Pro BL (BUND + 15 Laender) ein Modul app/protokoll_parsers/<bl>.py mit: - Recherche-Findings im Docstring (Doku-System, Base-URL, Format, URL-Discovery-Status, Familie, Aufwand-Schaetzung) - parse_protocol() raised NotImplementedError mit Hinweis auf Issue-Tracker - *Nicht* in PROTOKOLL_PARSERS-Registry → Auto-Ingest-Cron uebersieht sie Tracking-Issues #148-#163 auf Gitea, jeweils mit den Recherche-Findings und einer Checkliste fuer die Implementer-Session. Roadmap-Doc (docs/protokoll-parser-roadmap.md) aktualisiert mit Stub→Issue-Mapping-Tabelle. Wenn der Implementer pro BL fertig ist: 1. NotImplementedError durch echten Parser ersetzen 2. Eintrag in app/protokoll_parsers/__init__.py::PROTOKOLL_PARSERS 3. PROTO_TARGETS in scripts/auto-ingest-protocols.sh ergaenzen 787 Tests gruen, NRW unveraendert.
48 lines
1.7 KiB
Python
48 lines
1.7 KiB
Python
"""Baden-Württemberg (BW) — Plenarprotokoll-Parser STUB (#106 Folge, ADR 0009).
|
|
|
|
**Status: noch nicht implementiert.** Dieser Modul-Stub enthaelt
|
|
Recherche-Findings vom 2026-04-28, sodass die Implementer-Session
|
|
direkt produktiv loslegen kann. Der Stub wird **nicht** in
|
|
``app.protokoll_parsers.PROTOKOLL_PARSERS`` registriert — der
|
|
Auto-Ingest-Cron ueberspringt BW solange.
|
|
|
|
## Recherche
|
|
|
|
| Feld | Wert |
|
|
|---|---|
|
|
| **Doku-System** | PARLIS |
|
|
| **Base-URL** | https://parlis.landtag-bw.de |
|
|
| **Familie** | eigenstaendig (PARLIS-spezifisch, eigene Pattern) |
|
|
| **Format** | PDF; URL-Pattern bekannt mit 4-stelliger Sitzungs-Nr |
|
|
|
|
## URL-Discovery
|
|
|
|
https://www.landtag-bw.de/files/live/sites/LTBW/files/dokumente/WP{wp}/Plp/{wp}_{n:04}.pdf (HTTP 200 verifiziert!)
|
|
|
|
## Bezug
|
|
|
|
- Architektur: ADR 0009 (Plenarprotokoll-Parser-Registry)
|
|
- Roadmap: ``docs/protokoll-parser-roadmap.md``
|
|
- Referenz-Implementation: ``app/protokoll_parsers/nrw.py``
|
|
(38 Tests, 19/19-Fixture-Garantie)
|
|
- Folge-Issue: https://repo.toppyr.de/tobias/gwoe-antragspruefer/issues/151 (Titel: "protokoll-parser: BW (Baden-Württemberg)")
|
|
|
|
## Aufwand
|
|
|
|
Geschaetzt 1-3 Tage konzentrierte Arbeit:
|
|
- 2-4h URL-Discovery + Format-Inspektion (Sample-Protokoll inhaltlich anschauen)
|
|
- 4-8h Anchor-Phrasen-Reverse-Engineering + Parser-Implementierung
|
|
- 4h Tests mit Fixture-Pinning
|
|
- 1h Eintrag in PROTOKOLL_PARSERS + auto-ingest-protocols.sh
|
|
"""
|
|
from __future__ import annotations
|
|
|
|
|
|
def parse_protocol(path: str) -> list[dict]:
|
|
"""STUB — siehe Modul-Docstring."""
|
|
raise NotImplementedError(
|
|
"BW-Plenarprotokoll-Parser ist noch nicht implementiert. "
|
|
"Siehe app/protokoll_parsers/bw.py-Docstring fuer Recherche-Findings "
|
|
"und docs/protokoll-parser-roadmap.md."
|
|
)
|