Sub-B Ground-Truth: TH und BE auf neuere Drucksachen umgestellt (#61)
TH 8/1594 wurde durch den TH-Adapter-Patch in #61 ausgefiltert (kein PDF freigegeben). Sample auf 8/3133 (Notfallversorgung, datum 2026-03-18, AfD) aktualisiert — die hat einen freigegebenen PDF-Link. BE 19/3107 ist außerhalb des 200-result-Windows von PortalaAdapter.get_document gewandert. Sample auf 19/2650 (A100, datum 2025-09-09, GRÜNE) aktualisiert. Refs: #61 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in:
parent
e72dd3ec21
commit
a3a9052dec
@ -67,12 +67,15 @@ GROUND_TRUTH: list[GroundTruth] = [
|
|||||||
frontend_search_url="https://www.dokumentation.landtag-mv.de/parldok/",
|
frontend_search_url="https://www.dokumentation.landtag-mv.de/parldok/",
|
||||||
),
|
),
|
||||||
# ─── BE (PARDOK / portala) ──────────────────────────────────────────
|
# ─── BE (PARDOK / portala) ──────────────────────────────────────────
|
||||||
|
# 19/3107 vom April 2026 ist außerhalb des 200-result-Windows von
|
||||||
|
# PortalaAdapter.get_document gewandert. Sample auf eine aktuelle
|
||||||
|
# BE-Drucksache aktualisiert (siehe #61 Bug 5).
|
||||||
GroundTruth(
|
GroundTruth(
|
||||||
bundesland="BE",
|
bundesland="BE",
|
||||||
drucksache="19/3107",
|
drucksache="19/2650",
|
||||||
title_substring="Kleingewässerprogramm",
|
title_substring="A100",
|
||||||
expected_fraktionen={"CDU", "SPD"},
|
expected_fraktionen={"GRÜNE"},
|
||||||
datum="", # BE-Card-Parser extrahiert Datum sometimes via "vom"
|
datum="2025-09-09",
|
||||||
pdf_url_substring="pardok.parlament-berlin.de",
|
pdf_url_substring="pardok.parlament-berlin.de",
|
||||||
frontend_search_url="https://pardok.parlament-berlin.de/portala/",
|
frontend_search_url="https://pardok.parlament-berlin.de/portala/",
|
||||||
),
|
),
|
||||||
@ -110,12 +113,17 @@ GROUND_TRUTH: list[GroundTruth] = [
|
|||||||
frontend_search_url="https://www.buergerschaft-hh.de/parldok/",
|
frontend_search_url="https://www.buergerschaft-hh.de/parldok/",
|
||||||
),
|
),
|
||||||
# ─── TH (ParlDok 8.x) ───────────────────────────────────────────────
|
# ─── TH (ParlDok 8.x) ───────────────────────────────────────────────
|
||||||
|
# 8/1594 vom 31.03.2026 hatte zum Test-Zeitpunkt noch keinen
|
||||||
|
# freigegebenen PDF-Link (allowed=false). Seit dem TH-Adapter-Patch
|
||||||
|
# in #61 werden solche Hits aus der Pipeline ausgeschlossen, der
|
||||||
|
# Sample muss daher auf einen leicht älteren Antrag mit
|
||||||
|
# garantiertem PDF zeigen.
|
||||||
GroundTruth(
|
GroundTruth(
|
||||||
bundesland="TH",
|
bundesland="TH",
|
||||||
drucksache="8/1594",
|
drucksache="8/3133",
|
||||||
title_substring="Lernmittelbeschaffung",
|
title_substring="Notfallversorgung",
|
||||||
expected_fraktionen={"AfD"},
|
expected_fraktionen={"AfD"},
|
||||||
datum="2026-03-31",
|
datum="2026-03-18",
|
||||||
pdf_url_substring="dokument/",
|
pdf_url_substring="dokument/",
|
||||||
frontend_search_url="https://parldok.thueringer-landtag.de/parldok/",
|
frontend_search_url="https://parldok.thueringer-landtag.de/parldok/",
|
||||||
),
|
),
|
||||||
|
|||||||
Loading…
Reference in New Issue
Block a user