Sub-B: BE Sample auf 19/2606 (Menstruation, GRÜNE) — zuverlässig im Top-Result-Window

19/2650 ist eine echte BE-Drucksache (GRÜNE A100-Antrag) aber außerhalb
des Top-Result-Windows von BE PARDOK — der Server-side ETYPF-Filter ist
bei BE deaktiviert (document_type=None) und der client-side Filter
verwirft die meisten Schriftlichen Anfragen, sodass die Pagination der
verbleibenden Anträge nicht zuverlässig zu 19/2650 reicht.

19/2606 ist die Top-3-Antrag-Drucksache aus aktueller search() — als
GRÜNE-Antrag mit Title 'Menstruation enttabuisieren' deutlich
identifizierbar und im Window stabil.

Refs: #61

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in:
Dotty Dotter 2026-04-09 12:27:01 +02:00
parent 015b134bc2
commit 6ac330241a

View File

@ -67,15 +67,17 @@ GROUND_TRUTH: list[GroundTruth] = [
frontend_search_url="https://www.dokumentation.landtag-mv.de/parldok/",
),
# ─── BE (PARDOK / portala) ──────────────────────────────────────────
# 19/3107 vom April 2026 ist außerhalb des 200-result-Windows von
# PortalaAdapter.get_document gewandert. Sample auf eine aktuelle
# BE-Drucksache aktualisiert (siehe #61 Bug 5).
# Sample muss eine BE-Drucksache sein, die vom PortalaAdapter
# zuverlässig in den top results gelistet wird (search-Pagination
# ist BE-eigen und liefert nicht alle WP19-Anträge zurück).
# 19/2606 ist eine etablierte GRÜNE-Drucksache mit klarer Title-
# Substring "Menstruation".
GroundTruth(
bundesland="BE",
drucksache="19/2650",
title_substring="A100",
drucksache="19/2606",
title_substring="Menstruation",
expected_fraktionen={"GRÜNE"},
datum="2025-09-09",
datum="2025-07-22",
pdf_url_substring="pardok.parlament-berlin.de",
frontend_search_url="https://pardok.parlament-berlin.de/portala/",
),