diff --git a/tests/integration/ground_truth.py b/tests/integration/ground_truth.py index e2a61d4..1d6295b 100644 --- a/tests/integration/ground_truth.py +++ b/tests/integration/ground_truth.py @@ -67,12 +67,15 @@ GROUND_TRUTH: list[GroundTruth] = [ frontend_search_url="https://www.dokumentation.landtag-mv.de/parldok/", ), # ─── BE (PARDOK / portala) ────────────────────────────────────────── + # 19/3107 vom April 2026 ist außerhalb des 200-result-Windows von + # PortalaAdapter.get_document gewandert. Sample auf eine aktuelle + # BE-Drucksache aktualisiert (siehe #61 Bug 5). GroundTruth( bundesland="BE", - drucksache="19/3107", - title_substring="Kleingewässerprogramm", - expected_fraktionen={"CDU", "SPD"}, - datum="", # BE-Card-Parser extrahiert Datum sometimes via "vom" + drucksache="19/2650", + title_substring="A100", + expected_fraktionen={"GRÜNE"}, + datum="2025-09-09", pdf_url_substring="pardok.parlament-berlin.de", frontend_search_url="https://pardok.parlament-berlin.de/portala/", ), @@ -110,12 +113,17 @@ GROUND_TRUTH: list[GroundTruth] = [ frontend_search_url="https://www.buergerschaft-hh.de/parldok/", ), # ─── TH (ParlDok 8.x) ─────────────────────────────────────────────── + # 8/1594 vom 31.03.2026 hatte zum Test-Zeitpunkt noch keinen + # freigegebenen PDF-Link (allowed=false). Seit dem TH-Adapter-Patch + # in #61 werden solche Hits aus der Pipeline ausgeschlossen, der + # Sample muss daher auf einen leicht älteren Antrag mit + # garantiertem PDF zeigen. GroundTruth( bundesland="TH", - drucksache="8/1594", - title_substring="Lernmittelbeschaffung", + drucksache="8/3133", + title_substring="Notfallversorgung", expected_fraktionen={"AfD"}, - datum="2026-03-31", + datum="2026-03-18", pdf_url_substring="dokument/", frontend_search_url="https://parldok.thueringer-landtag.de/parldok/", ),