gwoe-antragspruefer/app/protokoll_parsers/be.py

48 lines
1.6 KiB
Python
Raw Normal View History

"""Berlin (BE) — Plenarprotokoll-Parser STUB (#106 Folge, ADR 0009).
**Status: noch nicht implementiert.** Dieser Modul-Stub enthaelt
Recherche-Findings vom 2026-04-28, sodass die Implementer-Session
direkt produktiv loslegen kann. Der Stub wird **nicht** in
``app.protokoll_parsers.PROTOKOLL_PARSERS`` registriert der
Auto-Ingest-Cron ueberspringt BE solange.
## Recherche
| Feld | Wert |
|---|---|
| **Doku-System** | PARDOK |
| **Base-URL** | https://pardok.parlament-berlin.de |
| **Familie** | LSA-Familie |
| **Format** | PDF erwartet |
## URL-Discovery
Plenum-PDF-URLs ueber PARDOK-Search-API zu ermitteln; direktes Pattern noch nicht bekannt
## Bezug
- Architektur: ADR 0009 (Plenarprotokoll-Parser-Registry)
- Roadmap: ``docs/protokoll-parser-roadmap.md``
- Referenz-Implementation: ``app/protokoll_parsers/nrw.py``
(38 Tests, 19/19-Fixture-Garantie)
- Folge-Issue: https://repo.toppyr.de/tobias/gwoe-antragspruefer/issues/150 (Titel: "protokoll-parser: BE (Berlin)")
## Aufwand
Geschaetzt 1-3 Tage konzentrierte Arbeit:
- 2-4h URL-Discovery + Format-Inspektion (Sample-Protokoll inhaltlich anschauen)
- 4-8h Anchor-Phrasen-Reverse-Engineering + Parser-Implementierung
- 4h Tests mit Fixture-Pinning
- 1h Eintrag in PROTOKOLL_PARSERS + auto-ingest-protocols.sh
"""
from __future__ import annotations
def parse_protocol(path: str) -> list[dict]:
"""STUB — siehe Modul-Docstring."""
raise NotImplementedError(
"BE-Plenarprotokoll-Parser ist noch nicht implementiert. "
"Siehe app/protokoll_parsers/be.py-Docstring fuer Recherche-Findings "
"und docs/protokoll-parser-roadmap.md."
)