gwoe-antragspruefer/tests
Dotty Dotter 5eabe0d9b3 feat: Stimmverhalten × Gemeinwohl-Orientierung in /auswertungen
Neue Auswertungs-Sicht: Welche Fraktionen stimmen häufiger gemeinwohl-
orientierten Anträgen zu? Verschneidet GWÖ-Bewertung pro Antrag mit
dem tatsächlichen Plenum-Stimmverhalten der Fraktionen.

Vier Aussagen, alle hinter dem neuen Tab "Stimmverhalten":

1. **Gemeinwohl-Stimm-Index** pro Fraktion: Ø-GWÖ-Score der JA-Anträge
   minus Ø-GWÖ-Score der NEIN-Anträge. Domain −10..+10. Positiv = stimmt
   eher Gemeinwohl-affinen Anträgen zu.

2. **Heuchelei-Quote** pro Fraktion: Anteil der Anträge mit
   wahlprogramm_score ≥ 7 (passt zum eigenen Wahlprogramm), bei denen
   die Fraktion trotzdem NEIN gestimmt hat.

3. **Stimm-Index pro GWÖ-Wert** als Heatmap: 5 Spalten (Würde,
   Solidarität, Nachhaltigkeit, Gerechtigkeit, Demokratie) aus den
   gwoe_matrix-Suffix-Spalten. Domain −5..+5 pro Zelle.

4. **Cross-BL-Vergleich** als Grouped Bar: gleiche Fraktion in
   mehreren Ländern. Nur Fraktionen in ≥2 BL mit ausreichender
   Datenbasis.

Querschnitt:
- `exclude_antragsteller=True` per Default (Toggle-Checkbox in UI),
  weil Antragsteller-Fraktionen quasi immer JA stimmen → würde Index
  verzerren. Toggle macht den Effekt sichtbar.
- `min_n=5` pro Fraktion fuer Stimm-Index, n=3 fuer Heatmaps.
  Fraktionen unter dem Cutoff werden als "Nicht aussagekräftig" separat
  gelistet.
- Caveat-Banner mit `n_assessments_matched` über jedem Chart.

Implementation:
- `app/auswertungen.py`: `_load_assessments_with_votes()` JOIN-Helper
  + 4 Aggregat-Funktionen analog zu `aggregate_matrix`-Pattern.
  Reuse: `normalize_partei` für Aliasing (BÜNDNIS 90/DIE GRÜNEN →
  GRÜNE), `wahlperiode_for` für WP-Filter.
- `app/main.py`: 4 neue read-only GET-Endpoints unter
  `/api/auswertungen/stimm-index|heuchelei|stimm-index-pro-wert|
  stimm-index-cross-bl`.
- `app/templates/v2/screens/auswertungen.html`: 4. Tab "Stimmverhalten"
  mit 4 Sub-Sektionen, Chart.js Bars + HTML-Heatmap-Tabelle.
- `tests/test_auswertungen_stimmverhalten.py`: 18 neue Tests
  (Fixture-DB mit 13 Assessments + 13 Vote-Results, Edge-Cases:
  GRÜNE-positiver-Index, AfD-negativer-Index, exclude_antragsteller-
  Effekt, min_n-Cutoff, leere DB).

Sparse-Data-Realität: aktuell 35 Assessments im prod, dünne Datenbasis
fuer einige Fraktionen. Feature wächst mit Issue #44 Batch-Bewertung.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-04-29 15:30:02 +02:00
..
e2e test: 467 -> 574 Tests (+107) — DDD, abgeordnetenwatch, monitoring, v2, Bug-Regressions 2026-04-25 20:55:57 +02:00
integration Sub-B: NRW Sample 10/5376 — F.D.P.+CDU CO2-Minderungsprogramm 1990 2026-04-09 13:43:17 +02:00
__init__.py Add pytest suite + fix two regex bugs uncovered by it (#46) 2026-04-08 23:26:06 +02:00
conftest.py Add pytest suite + fix two regex bugs uncovered by it (#46) 2026-04-08 23:26:06 +02:00
test_abgeordnetenwatch.py test(#134): Coverage-Backfill drei Module 2026-04-28 10:50:26 +02:00
test_abonnement_repository.py test(#134): Coverage-Backfill auswertungen + Repositories 2026-04-28 10:54:28 +02:00
test_analyzer.py test(#134): analyzer Coverage 70.1% → 83.1% 2026-04-28 11:06:24 +02:00
test_antrag_repository.py test(#134): Coverage-Backfill auswertungen + Repositories 2026-04-28 10:54:28 +02:00
test_auswertungen_stimmverhalten.py feat: Stimmverhalten × Gemeinwohl-Orientierung in /auswertungen 2026-04-29 15:30:02 +02:00
test_auswertungen.py test(#134): Coverage-Backfill auswertungen + Repositories 2026-04-28 10:54:28 +02:00
test_auth.py test(#134): auth.py Coverage 47.1% → 86% 2026-04-28 11:10:08 +02:00
test_bewertung_repository.py test(#134): Coverage-Backfill auswertungen + Repositories 2026-04-28 10:54:28 +02:00
test_bug_regressions.py test: 467 -> 574 Tests (+107) — DDD, abgeordnetenwatch, monitoring, v2, Bug-Regressions 2026-04-25 20:55:57 +02:00
test_bundeslaender.py Phase J: SN EDAS-XML-Adapter (#26/#38) — Sachsen aktiv via XML-Export 2026-04-09 14:39:03 +02:00
test_clustering.py test(#134): clustering.py Coverage 82.3% → 99.3% 2026-04-28 11:02:58 +02:00
test_database.py feat(#106): plenum_vote_results-Tabelle + Repository 2026-04-28 08:01:26 +02:00
test_domain_behavior.py test: 467 -> 574 Tests (+107) — DDD, abgeordnetenwatch, monitoring, v2, Bug-Regressions 2026-04-25 20:55:57 +02:00
test_drucksache_typen.py test(#134): drucksache_typen Coverage 72.5% → 100% 2026-04-28 11:04:31 +02:00
test_embeddings_v3_v4.py test: 467 -> 574 Tests (+107) — DDD, abgeordnetenwatch, monitoring, v2, Bug-Regressions 2026-04-25 20:55:57 +02:00
test_embeddings.py Hybrid-Zitate: verified/unverified statt drop + UI-Labels 2026-04-10 21:45:36 +02:00
test_endpoints_smoke.py Tests: 8 Endpoint-Smoke-Tests (queue, auth, programme, health) 2026-04-10 20:09:34 +02:00
test_feedback_endpoint.py feat(v2): Feedback-Widget mit Audit-Trail + Screenshot + direkter Gitea-Anbindung 2026-04-28 01:00:44 +02:00
test_ingest_votes.py test(#134): Coverage-Backfill drei Module 2026-04-28 10:50:26 +02:00
test_llm_bewerter.py test(#134): qwen_bewerter Coverage 86% → 94% 2026-04-28 10:56:56 +02:00
test_mail.py test(#134): mail.py Coverage 88.2% → 100% 2026-04-28 10:58:03 +02:00
test_main_validators.py Phase A: Audit-Restbefunde #57.3/4/7 (Roadmap #59) 2026-04-09 11:15:16 +02:00
test_monitoring.py test(#134): monitoring.py Coverage 83.2% → 99.3% 2026-04-28 11:01:19 +02:00
test_og_card.py test(#134): app/og_card.py Coverage 44% → 100% 2026-04-28 08:40:20 +02:00
test_parlamente.py fix(#142): SL HTTP 5xx als Fehler raisen statt return [] 2026-04-28 01:46:35 +02:00
test_parteien.py Phase B: Parteinamen-Mapper #55 (Roadmap #59) 2026-04-09 11:22:13 +02:00
test_protokoll_parsers_bb.py feat(#149): BB-Parser produktiv — Brandenburger Plenarprotokolle (Status-Only) 2026-04-29 02:04:21 +02:00
test_protokoll_parsers_be.py feat(#150): BE-Parser produktiv — Berliner Abgeordnetenhaus-Plenarprotokolle 2026-04-29 00:37:47 +02:00
test_protokoll_parsers_bund.py feat(#148): BUND-Parser produktiv — Bundestags-XML-Plenarprotokolle 2026-04-28 23:21:39 +02:00
test_protokoll_parsers_hb.py feat(#153): HB-Parser produktiv — Bremer Beschlussprotokolle (Status-Only) 2026-04-29 01:41:40 +02:00
test_protokoll_parsers_hh.py test(#155): 19 Tests fuer HH-Parser 2026-04-29 01:05:33 +02:00
test_protokoll_parsers_nrw.py test(#134): NRW Protokoll-Parser Coverage 51.7% → 85.1% 2026-04-28 11:11:52 +02:00
test_protokoll_parsers_sh.py feat(#160): SH-Parser produktiv — Schleswig-Holsteiner Plenarprotokolle 2026-04-29 01:29:06 +02:00
test_protokoll_parsers_sl.py feat(#161): SL-Parser produktiv — Saarland HTML-Abstimmungsergebnisse 2026-04-29 01:53:51 +02:00
test_protokoll_parsers_stubs.py feat(#149): BB-Parser produktiv — Brandenburger Plenarprotokolle (Status-Only) 2026-04-29 02:04:21 +02:00
test_protokoll_parsers.py feat(#126): protokoll_parsers/-Sub-Package + Registry-Pattern + ADR 0009 2026-04-28 08:37:31 +02:00
test_queue.py test(#134): queue Coverage 26.6% → 43.4% 2026-04-28 11:08:04 +02:00
test_redline_parser.py test(#134): build_pdf_href Coverage 50% → 100% 2026-04-28 08:39:05 +02:00
test_report.py test(#134): report.py Coverage 44.3% → 52.7% 2026-04-28 11:13:20 +02:00
test_rss.py test(#134): test_rss.py — Atom-Feed-Validitaet, Filter, ETag, Limits 2026-04-28 02:01:01 +02:00
test_wahlperioden.py test(#134): test_wahlperioden.py — Datum→WP-Mapping 2026-04-28 02:02:40 +02:00
test_wahlprogramm_check.py test: 467 -> 574 Tests (+107) — DDD, abgeordnetenwatch, monitoring, v2, Bug-Regressions 2026-04-25 20:55:57 +02:00
test_wahlprogramm_fetch.py test(#134): wahlprogramm_fetch Coverage 42.8% → 54.4% 2026-04-28 08:42:29 +02:00
test_wahlprogramme.py test(#134): Coverage-Backfill drei Module 2026-04-28 10:50:26 +02:00