Sub-B: NRW Sample 10/5376 — F.D.P.+CDU CO2-Minderungsprogramm 1990

Letzter offener Sub-B-Sample-Slot. NRW liefert ein historisches WP10-
Sample (28.03.1990, F.D.P.+CDU-Entschließung zum NRW-CO2-Minderungs-
programm) — interessant für die GWÖ-Bilanzierung als Beleg, dass
Klimaschutz seit 35 Jahren auf dem Tisch liegt.

NRWAdapter.get_document() konstruiert die PDF-URL deterministisch über
das MMD{wp}-{nummer}.pdf-Schema, das auch für historische Wahlperioden
funktioniert (HEAD 200 verifiziert). Die Title/Fraktionen/Datum-Felder
bleiben für historische WPs leer, weil der Adapter sie aus der OPAL-
Suche nicht extrahiert (die nur die aktuelle WP18 indexiert). Der
Sample-Eintrag prüft daher nur existence + URL-Schema, beides wird vom
Sub-B-Test honoriert (leere Felder werden geskipped).

Sub-B im Container: 10/10 grün (vorher 9/9 mit NRW als skip).

Refs: #52, #59 (Sub-B Live-Verifikation)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in:
Dotty Dotter 2026-04-09 13:43:17 +02:00
parent 6ac330241a
commit 15b9af8795

View File

@ -48,12 +48,19 @@ class GroundTruth:
# Stand: 2026-04-09. Bei Drift bitte das Sample ersetzen, nicht löschen.
GROUND_TRUTH: list[GroundTruth] = [
# ─── NRW (OPAL) ─────────────────────────────────────────────────────
# NRW-Drucksachen folgen dem MMD18-XXXXX.pdf-URL-Schema. Substring
# "MMD18-" matched alle aktuellen Anträge der WP18.
# NRW-Drucksachen folgen dem MMD{wp}-{nummer}.pdf-URL-Schema, das auch
# für historische Wahlperioden funktioniert. Sample 10/5376 vom
# 28.03.1990 (WP10) ist ein F.D.P.+CDU-Entschließungsantrag zum
# NRW-CO2-Minderungsprogramm — historisch interessant für die GWÖ-
# Bilanzierung (Klimaschutz seit 1990) und garantiert stabil im
# Archiv. NRWAdapter.get_document liefert für historische WPs nur
# existence + URL — title/fraktionen/datum bleiben leer, deshalb sind
# die Sample-Felder hier auf das Minimum reduziert.
GroundTruth(
bundesland="NRW",
drucksache="18/12345",
title_substring="", # tbd: ersetzen mit echtem Sample
drucksache="10/5376",
title_substring="Drucksache 10/5376", # Stub-title des Adapters
pdf_url_substring="MMD10-5376",
frontend_search_url="https://opal.landtag.nrw.de",
),
# ─── MV (ParlDok 8.x) ───────────────────────────────────────────────