Scraper NI: Niedersachsen (StarWeb, Wahl 2027-10-10) #22
Labels
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: tobias/gwoe-antragspruefer#22
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Wahltermin
2027-10-10 — Niedersachsen (NI), aktuell 19. Wahlperiode.
Backend
StarWebni19/12345Adapter-Strategie
StarWeb (2/6) — Wiederverwendung des SH-StarWebAdapters, neuer Registry-Eintrag.
Was zu tun ist
webapp/app/parlamente.pyimplementieren — entweder als neue Subklasse vonParlamentAdapteroder als zweiter Registry-Eintrag eines existierenden parametrisierbaren Adapters.ADAPTERS-Registry am Ende der Datei.ADAPTERS["NI"].search("Schule", limit=10)liefert echte Anträge mit Datum + Fraktionen, sortiert newest-first.Hängt mit … zusammenunten) — dieses Issue ist nur der Adapter selbst, nicht das Indexieren der Wahlprogramme oder das Frontend-aktiv-Setzen.Akzeptanzkriterien
parlamente.py::ADAPTERS["NI"]existiert und ist instanziierbarsearch(query="Schule", limit=10)liefert ≥3 echte Drucksachen mit korrektem Datum, Fraktionen, PDF-Linkget_document(drucksache)für eine reale Drucksache der laufenden WP liefert das Dokument zurückdownload_text(drucksache)extrahiert Text aus dem PDFHinweise aus dokukratie/ni.yml
StarWeb-Servlet (NILAS):
https://www.nilas.niedersachsen.de/starweb/NILAS/servlet.starweb?path=NILAS/lissh.webhttps://www.nilas.niedersachsen.de/starweb/NILAS/start.html.//form[@name="__form"]Suchzeile5=DRUCKSACHE,Suchzeile6/7/8,__action=5,28,ReportFormatListDisplay=Vollanzeige,Vorgaenge.//table[@id="listTable"]//ul[@class="fundstelle"]/...//b/text().//ul[@class="fundstelle"]/li[contains(text(), "Drucksache")][last()]/a[1]/@hrefSynergie: Wiederverwendung des
StarWebAdapteraus #27. Achtung: NI nutztSuchzeile5/6/7/8als Field-Names statt derLISSH_*-Variante von HB/BB — der Adapter braucht eine konfigurierbare Field-Name-Map pro BL.Sondiert in der Phase-2-Session: nilas.niedersachsen.de/portal/ ist eine Login-Page. Das öffentliche niedersächsische Parlamentsdokumentations-Portal ist passwortgeschützt — der
/portal/-Endpoint zeigt eine Anmeldemaske, jeglicher API-Aufruf ohne Session-Cookie schlägt fehl.Optionen
/starweb/NILAS/servlet.starweb?path=NILAS/lissh.web— das könnte öffentlich sein. Lohnt einen separaten Probe-Versuch. Wenn ja, eigene Adapter-Implementierung wie für SH (StarFinderCGIAdapter, eigenständig) — aber NILAS ist die moderne Variante, kein altes Starfinder.Aktuell kein klarer Pfad ohne öffentliche API. Deferred bis Option 1 oder 2 verifiziert ist.
Resolved in
edcb4e9+521d940.NILAS ist ein portala/eUI-Backend — kein neuer Adapter noetig, nur ein neuer PortalaAdapter-Eintrag + dritter Parsing-Pfad (JSON-in-HTML-Comments).
Config: bundesland=NI, db_id=lns.lissh, WP 19, /portala/, document_type=Antrag.
Smoke: search(Schule, 5) liefert 5 NI-Antraege mit Titel, Datum, Fraktionen, PDF-Link. download_text liefert 5504 chars Volltext.
UI-Aktivierung folgt in #34.