diff --git a/tests/integration/ground_truth.py b/tests/integration/ground_truth.py index a1409a8..c750a77 100644 --- a/tests/integration/ground_truth.py +++ b/tests/integration/ground_truth.py @@ -48,12 +48,19 @@ class GroundTruth: # Stand: 2026-04-09. Bei Drift bitte das Sample ersetzen, nicht löschen. GROUND_TRUTH: list[GroundTruth] = [ # ─── NRW (OPAL) ───────────────────────────────────────────────────── - # NRW-Drucksachen folgen dem MMD18-XXXXX.pdf-URL-Schema. Substring - # "MMD18-" matched alle aktuellen Anträge der WP18. + # NRW-Drucksachen folgen dem MMD{wp}-{nummer}.pdf-URL-Schema, das auch + # für historische Wahlperioden funktioniert. Sample 10/5376 vom + # 28.03.1990 (WP10) ist ein F.D.P.+CDU-Entschließungsantrag zum + # NRW-CO2-Minderungsprogramm — historisch interessant für die GWÖ- + # Bilanzierung (Klimaschutz seit 1990) und garantiert stabil im + # Archiv. NRWAdapter.get_document liefert für historische WPs nur + # existence + URL — title/fraktionen/datum bleiben leer, deshalb sind + # die Sample-Felder hier auf das Minimum reduziert. GroundTruth( bundesland="NRW", - drucksache="18/12345", - title_substring="", # tbd: ersetzen mit echtem Sample + drucksache="10/5376", + title_substring="Drucksache 10/5376", # Stub-title des Adapters + pdf_url_substring="MMD10-5376", frontend_search_url="https://opal.landtag.nrw.de", ), # ─── MV (ParlDok 8.x) ───────────────────────────────────────────────