From 6ac330241a41bfa9097b4063a0b3b3dc6af9dae2 Mon Sep 17 00:00:00 2001 From: Dotty Dotter Date: Thu, 9 Apr 2026 12:27:01 +0200 Subject: [PATCH] =?UTF-8?q?Sub-B:=20BE=20Sample=20auf=2019/2606=20(Menstru?= =?UTF-8?q?ation,=20GR=C3=9CNE)=20=E2=80=94=20zuverl=C3=A4ssig=20im=20Top-?= =?UTF-8?q?Result-Window?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 19/2650 ist eine echte BE-Drucksache (GRÜNE A100-Antrag) aber außerhalb des Top-Result-Windows von BE PARDOK — der Server-side ETYPF-Filter ist bei BE deaktiviert (document_type=None) und der client-side Filter verwirft die meisten Schriftlichen Anfragen, sodass die Pagination der verbleibenden Anträge nicht zuverlässig zu 19/2650 reicht. 19/2606 ist die Top-3-Antrag-Drucksache aus aktueller search() — als GRÜNE-Antrag mit Title 'Menstruation enttabuisieren' deutlich identifizierbar und im Window stabil. Refs: #61 Co-Authored-By: Claude Opus 4.6 (1M context) --- tests/integration/ground_truth.py | 14 ++++++++------ 1 file changed, 8 insertions(+), 6 deletions(-) diff --git a/tests/integration/ground_truth.py b/tests/integration/ground_truth.py index 1d6295b..a1409a8 100644 --- a/tests/integration/ground_truth.py +++ b/tests/integration/ground_truth.py @@ -67,15 +67,17 @@ GROUND_TRUTH: list[GroundTruth] = [ frontend_search_url="https://www.dokumentation.landtag-mv.de/parldok/", ), # ─── BE (PARDOK / portala) ────────────────────────────────────────── - # 19/3107 vom April 2026 ist außerhalb des 200-result-Windows von - # PortalaAdapter.get_document gewandert. Sample auf eine aktuelle - # BE-Drucksache aktualisiert (siehe #61 Bug 5). + # Sample muss eine BE-Drucksache sein, die vom PortalaAdapter + # zuverlässig in den top results gelistet wird (search-Pagination + # ist BE-eigen und liefert nicht alle WP19-Anträge zurück). + # 19/2606 ist eine etablierte GRÜNE-Drucksache mit klarer Title- + # Substring "Menstruation". GroundTruth( bundesland="BE", - drucksache="19/2650", - title_substring="A100", + drucksache="19/2606", + title_substring="Menstruation", expected_fraktionen={"GRÜNE"}, - datum="2025-09-09", + datum="2025-07-22", pdf_url_substring="pardok.parlament-berlin.de", frontend_search_url="https://pardok.parlament-berlin.de/portala/", ),