UI SH: aktiv schalten + Wahlprogramme der WP20 indexieren #32

Closed
opened 2026-04-08 22:22:13 +02:00 by tobias · 1 comment
Owner

Hängt ab von #20 (Scraper-Adapter für Schleswig-Holstein).

Was zu tun ist

Sobald der Adapter aus #20 funktioniert und smoke-getestet ist:

  1. bundeslaender.py: aktiv=True im BUNDESLAENDER["SH"]-Eintrag setzen
  2. Wahlprogramme der laufenden 20. WP beschaffen — alle Fraktionen (siehe landtagsfraktionen in bundeslaender.py). Quellen pro Bundesland: meist abgeordnetenwatch.de, FES-Bibliothek, KAS-Archiv, Heinrich-Böll-Stiftung, Rosa-Luxemburg-Stiftung. Verifizieren via pdftotext gegen das im Programm genannte Wahldatum (Lehre aus #10 — abgeordnetenwatch tauscht alte Datei-Slugs manchmal gegen neue Programme aus).
  3. PDFs als <partei>-sh-<jahr>.pdf in webapp/app/static/referenzen/
  4. Einträge in wahlprogramme.WAHLPROGRAMME["SH"] und embeddings.PROGRAMME ergänzen — siehe #10 als Vorlage
  5. Indexieren im prod-Container:
    ssh vserver 'docker exec gwoe-antragspruefer python -c "
    from app.embeddings import index_programm
    from pathlib import Path
    d = Path("/app/app/static/referenzen")
    for pid in [...]:
        index_programm(pid, d)
    "'
    
  6. Smoke-Test im Live-System: einen realen SH-Antrag analysieren, prüfen dass die Wahlprogramm-Treue-Bewertung Zitate aus den jeweiligen WP-Programmen liefert (kein NRW-Halluzinations-Fallback wie vor bc7f4a6).
  7. project_state.md Memory aktualisieren — neuer aktiver Bundesland-Code dazu.

Beachten

  • Wichtige Regel (Memory feedback_legislaturprogramme): die Wahlprogramme der laufenden Wahlperiode müssen rein, keine neueren Entwürfe. Falls vor der Wahl 2027-04-18 aktiviert wird → 2021er/2022er-Programme; nach der Wahl → die zur 2027-04-18-Wahl.
  • Container-Build kopiert Volume data/ und reports/ nicht — beim Indexieren immer im laufenden Container, nicht beim Build.

Akzeptanzkriterien

  • aktiv=True in bundeslaender.py
  • Alle Fraktionen mit indexiertem Wahlprogramm in der embeddings.db
  • Live-Smoke-Test: ein SH-Antrag wird analysiert, Zitate kommen aus den lokalen Programmen (nicht aus föderalen Grundsatzprogrammen)
  • Frontend-Bundesland-Wähler zeigt Schleswig-Holstein ohne (bald)-Marker
Hängt ab von #20 (Scraper-Adapter für Schleswig-Holstein). ## Was zu tun ist Sobald der Adapter aus #20 funktioniert und smoke-getestet ist: 1. **`bundeslaender.py`**: `aktiv=True` im `BUNDESLAENDER["SH"]`-Eintrag setzen 2. **Wahlprogramme der laufenden 20. WP** beschaffen — alle Fraktionen (siehe `landtagsfraktionen` in bundeslaender.py). Quellen pro Bundesland: meist `abgeordnetenwatch.de`, FES-Bibliothek, KAS-Archiv, Heinrich-Böll-Stiftung, Rosa-Luxemburg-Stiftung. Verifizieren via `pdftotext` gegen das im Programm genannte Wahldatum (Lehre aus #10 — abgeordnetenwatch tauscht alte Datei-Slugs manchmal gegen neue Programme aus). 3. PDFs als `<partei>-sh-<jahr>.pdf` in `webapp/app/static/referenzen/` 4. Einträge in `wahlprogramme.WAHLPROGRAMME["SH"]` und `embeddings.PROGRAMME` ergänzen — siehe #10 als Vorlage 5. **Indexieren im prod-Container**: ```bash ssh vserver 'docker exec gwoe-antragspruefer python -c " from app.embeddings import index_programm from pathlib import Path d = Path("/app/app/static/referenzen") for pid in [...]: index_programm(pid, d) "' ``` 6. **Smoke-Test im Live-System**: einen realen SH-Antrag analysieren, prüfen dass die Wahlprogramm-Treue-Bewertung Zitate aus den jeweiligen WP-Programmen liefert (kein NRW-Halluzinations-Fallback wie vor `bc7f4a6`). 7. **`project_state.md` Memory aktualisieren** — neuer aktiver Bundesland-Code dazu. ## Beachten - **Wichtige Regel** (Memory `feedback_legislaturprogramme`): die Wahlprogramme der **laufenden** Wahlperiode müssen rein, keine neueren Entwürfe. Falls vor der Wahl 2027-04-18 aktiviert wird → 2021er/2022er-Programme; nach der Wahl → die zur 2027-04-18-Wahl. - Container-Build kopiert Volume `data/` und `reports/` nicht — beim Indexieren immer im laufenden Container, nicht beim Build. ## Akzeptanzkriterien - [ ] `aktiv=True` in `bundeslaender.py` - [ ] Alle Fraktionen mit indexiertem Wahlprogramm in der `embeddings.db` - [ ] Live-Smoke-Test: ein SH-Antrag wird analysiert, Zitate kommen aus den lokalen Programmen (nicht aus föderalen Grundsatzprogrammen) - [ ] Frontend-Bundesland-Wähler zeigt Schleswig-Holstein ohne `(bald)`-Marker
tobias added the
ui-aktivierung
label 2026-04-08 23:16:39 +02:00
Author
Owner

Erledigt in a4af796.

5 Wahlprogramme der WP20 (2022er) für SH indexiert. Quelle: abgeordnetenwatch.de.

embeddings.db: SH → 5 programme, 1061 chunks total

Damit fällt die Antrag-Analyse für SH nicht mehr auf föderale Grundsatzprogramme zurück, sondern zitiert aus den jeweils gewählten Programmen der laufenden Wahlperiode.

Erledigt in a4af796. 5 Wahlprogramme der WP20 (2022er) für SH indexiert. Quelle: abgeordnetenwatch.de. ``` embeddings.db: SH → 5 programme, 1061 chunks total ``` Damit fällt die Antrag-Analyse für SH nicht mehr auf föderale Grundsatzprogramme zurück, sondern zitiert aus den jeweils gewählten Programmen der laufenden Wahlperiode.
Sign in to join this conversation.
No description provided.