Bundesland: Mecklenburg-Vorpommern (Wahl 20.09.2026) #4

Closed
opened 2026-03-31 00:49:57 +02:00 by tobias · 1 comment
Owner

Landtagswahl

  • Datum: 20.09.2026
  • Wahlprogramm Grüne: Noch nicht veröffentlicht
    • Listenaufstellung läuft (LDK 24.05.2025 in Güstrow)
    • URL: https://gruene-mv.de
    • Grüne stehen bei 5-6% (knapp über Hürde)

Parlamentsdokumentation

Scraping-Optionen

TODO für Integration

  • Wahlprogramm Grüne MV 2026 abwarten/beschaffen
  • Dokukratie-Scraper mv testen
  • ParLDok-Datenformat analysieren
  • Adapter schreiben
  • GWÖ-Matrix-Bewertung mit MV-Kontext
  • Frontend: MV im Bundesland-Wähler aktivieren
## Landtagswahl - **Datum:** 20.09.2026 - **Wahlprogramm Grüne:** Noch nicht veröffentlicht - Listenaufstellung läuft (LDK 24.05.2025 in Güstrow) - URL: https://gruene-mv.de - Grüne stehen bei 5-6% (knapp über Hürde) ## Parlamentsdokumentation - **System:** ParLDok (eigenes System, Tcl-basiert) - **URL:** https://www.dokumentation.landtag-mv.de/ - **Direkt-URL:** http://www.dokumentation.landtag-mv.de/parldok/tcl/PDDocView.tcl - **Aktuelle WP:** 8 (seit 2021) - **API:** Keine bekannte öffentliche API ## Scraping-Optionen - **Dokukratie (OKF):** Scraper `mv` verfügbar - `memorious run mv` - Backend: ParLDok - https://github.com/okfde/dokukratie - **Parlamentsspiegel:** Integriert ## TODO für Integration - [ ] Wahlprogramm Grüne MV 2026 abwarten/beschaffen - [ ] Dokukratie-Scraper `mv` testen - [ ] ParLDok-Datenformat analysieren - [ ] Adapter schreiben - [ ] GWÖ-Matrix-Bewertung mit MV-Kontext - [ ] Frontend: MV im Bundesland-Wähler aktivieren
tobias added a new dependency 2026-04-07 13:56:49 +02:00
Author
Owner

Erledigt in 2b9c0b2 + 8992cff + 1b5fd96 + bc7f4a6.

Adapter: Neuer ParLDokAdapter in app/parlamente.py für ParlDok 8.x (J3S GmbH SPA). Reverse-engineered aus dem bundle.js der Live-Instanz: JSON-API unter /parldok/Fulltext/Search + /parldok/Fulltext/Resultpage, Server-Filter via facet_lp (type=10), zweistufige Pagination weil das Search-Endpoint Start>0 ignoriert. Die in dokukratie/mv.yml beschriebene HTML-POST-Form (parldok/formalkriterien) ist mit dem 8.x-Upgrade deprecated.

Wahlprogramme zur LTW 26.09.2021 (alle 6 Fraktionen, über abgeordnetenwatch.de + library.fes.de + cdu-mv.de + fdp-mv.de):

  • cdu-mv-2021.pdf (49 chunks)
  • spd-mv-2021.pdf (179 chunks)
  • gruene-mv-2021.pdf (108 chunks)
  • fdp-mv-2021.pdf (118 chunks)
  • afd-mv-2021.pdf (68 chunks)
  • linke-mv-2021.pdf (89 chunks)

Indexiert in embeddings.db (611 MV-chunks total) im prod-Container.

Smoke-Test (8/6390, CDU "Krisenmechanismus Kraftstoffpreise"): GWÖ-Score 4.0; Wahlprogramm-Zitate für CDU/SPD/LINKE alle aus den korrekten MV-2021-Programmen.

Drive-by-Fixes unterwegs entdeckt:

  • format_quotes_for_prompt lieferte chunks ohne Programm-Identifikation, daher hat das LLM Quellen halluziniert (typischerweise NRW 2022). Fix: Programm-Name + Seite jetzt im prompt-Block (1b5fd96).
  • Auch nach dem Format-Fix hielt sich das LLM nicht immer an die Quellen aus dem Kontext. Strikte ZITATEREGEL im user_prompt (bc7f4a6) verbietet jetzt Cross-BL-Zitate explizit.
  • PortalaAdapter print() → logger.exception (Memory feedback silent_excepts).

Bekannte kleine Limitierung (separates Folge-Issue empfohlen): Suche ist client-side Title-Filter über das letzte 1000-Doc-Window — Server-side Volltext via facet_fulltext=0 ist im Bundle gesehen, aber noch nicht implementiert.

Erledigt in 2b9c0b2 + 8992cff + 1b5fd96 + bc7f4a6. **Adapter:** Neuer `ParLDokAdapter` in `app/parlamente.py` für ParlDok 8.x (J3S GmbH SPA). Reverse-engineered aus dem `bundle.js` der Live-Instanz: JSON-API unter `/parldok/Fulltext/Search` + `/parldok/Fulltext/Resultpage`, Server-Filter via `facet_lp` (type=10), zweistufige Pagination weil das `Search`-Endpoint `Start>0` ignoriert. Die in `dokukratie/mv.yml` beschriebene HTML-POST-Form (`parldok/formalkriterien`) ist mit dem 8.x-Upgrade deprecated. **Wahlprogramme zur LTW 26.09.2021** (alle 6 Fraktionen, über `abgeordnetenwatch.de` + `library.fes.de` + `cdu-mv.de` + `fdp-mv.de`): - `cdu-mv-2021.pdf` (49 chunks) - `spd-mv-2021.pdf` (179 chunks) - `gruene-mv-2021.pdf` (108 chunks) - `fdp-mv-2021.pdf` (118 chunks) - `afd-mv-2021.pdf` (68 chunks) - `linke-mv-2021.pdf` (89 chunks) **Indexiert in `embeddings.db`** (611 MV-chunks total) im prod-Container. **Smoke-Test (8/6390, CDU "Krisenmechanismus Kraftstoffpreise"):** GWÖ-Score 4.0; Wahlprogramm-Zitate für CDU/SPD/LINKE alle aus den korrekten MV-2021-Programmen. **Drive-by-Fixes unterwegs entdeckt:** - `format_quotes_for_prompt` lieferte chunks ohne Programm-Identifikation, daher hat das LLM Quellen halluziniert (typischerweise NRW 2022). Fix: Programm-Name + Seite jetzt im prompt-Block (1b5fd96). - Auch nach dem Format-Fix hielt sich das LLM nicht immer an die Quellen aus dem Kontext. Strikte ZITATEREGEL im `user_prompt` (bc7f4a6) verbietet jetzt Cross-BL-Zitate explizit. - `PortalaAdapter` print() → logger.exception (Memory feedback `silent_excepts`). **Bekannte kleine Limitierung (separates Folge-Issue empfohlen):** Suche ist client-side Title-Filter über das letzte 1000-Doc-Window — Server-side Volltext via `facet_fulltext=0` ist im Bundle gesehen, aber noch nicht implementiert.
Sign in to join this conversation.
No description provided.