GWÖ-Antragsprüfer: Automatische Gemeinwohl-Bilanzierung von Parlamentsanträgen nach der GWÖ-Matrix 2.0

Go to file

Dotty Dotter d54ce23e42 feat(#170 ): Aktuelle-Themen-Dashboard — News × Anträge × Pressemitteilungen Vollständiges 4-Phasen-Feature: Phase 1 — News-Aggregator (`app/news_aggregator.py`) - Tagesschau-API (`/api2u/news?ressort=...`) für inland/ausland/wirtschaft/wissen - Bundestag-RSS für aktuellethemen / pressemitteilungen / hib - DB-Tabelle `news_articles` (URL-PK, idempotent) - Embeddings via existierender qwen-v4-Pipeline - Cron-Script `scripts/auto-fetch-news.sh` - Bewusst NICHT: RND.de (robots.txt bannt explizit ClaudeBot, GPTBot, CCBot, ChatGPT-User, Google-Extended). Nur AI-erlaubende, öffentlich- rechtliche/parlamentarische Quellen - Volltexte werden NICHT persistiert (nur Titel + erster Satz) Phase 2 — Themen × Anträge Matching (`app/themen_matching.py`) - News-Embedding × Assessment-summary_embedding via Cosine-Similarity - `find_anträge_for_news`: pro News die Top-K passenden Anträge - `find_news_for_antrag`: pro Antrag Top-K News mit Datums-Fenster (90d) - `aggregate_top_themen`: primärer Dashboard-Endpoint - `aggregate_themen_zeitreihe`: News-Volumen pro Tag × Source Phase 3 — Dashboard-View (`/aktuelle-themen`) - Neuer linker Nav-Eintrag „Aktuelle Themen" - Stacked-Area-Chart News-Volumen pro Quelle (30d) - Pro News-Card: Titel + Summary + Tags + Top-3-Antrags-Match-Liste mit GWÖ-Score-Pill, Drucksache-Link, PM-Vorschlag-Button - Filter: Zeitfenster, Top-N, min_similarity - Auth-protected (require_auth) Phase 4 — Pressemitteilungs-Generator (`app/presse_generator.py`) - LLM-Prompt-Template (200-250 Worte, GWÖ-Sicht, JSON-Output) - Reuse von `QwenBewerter` aus app/adapters/qwen_bewerter.py - DB-Tabelle `presse_drafts` (Persistenz) - POST `/api/aktuelle-themen/generate-presse` rate-limited 5/min, auth-only (LLM-Kosten) - GET `/api/aktuelle-themen/drafts` + `/drafts/{id}` für Liste/Detail - Manueller Trigger via UI-Button, kein Auto-Versand - Modal-Anzeige des generierten Texts Compliance: - robots.txt-respektierend (ClaudeBot-Bann von RND vermieden, AI- erlaubende Quellen verwendet) - UI zeigt nur Titel+URL+Datum+erster Satz, keine Volltext-Reproduktion - Pressemitteilungen sind explizit Drafts, nicht Auto-Versand - LLM-Calls rate-limited, auth-only Tests: 43 neue Tests (19 news_aggregator + 16 themen_matching + 8 presse_generator). Suite jetzt 1048 grün. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>		2026-05-03 12:39:36 +02:00
app	feat(#170 ): Aktuelle-Themen-Dashboard — News × Anträge × Pressemitteilungen	2026-05-03 12:39:36 +02:00
docs	feat(#149 ): BB-Parser produktiv — Brandenburger Plenarprotokolle (Status-Only)	2026-04-29 02:04:21 +02:00
scripts	feat(#170 ): Aktuelle-Themen-Dashboard — News × Anträge × Pressemitteilungen	2026-05-03 12:39:36 +02:00
tests	feat(#170 ): Aktuelle-Themen-Dashboard — News × Anträge × Pressemitteilungen	2026-05-03 12:39:36 +02:00
.coveragerc	build(#134 ): Coverage-Schwelle 45% → 50% nach Test-Backfill-Welle	2026-04-28 11:14:09 +02:00
.dockerignore	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
.env.example	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
.gitignore	build(#134 ): Coverage-Baseline (.coveragerc) + pytest-cov in dev-deps	2026-04-28 02:05:39 +02:00
.tarignore	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
CHANGELOG.md	release(1.0): README + CHANGELOG + DATA-LICENSE (CC-BY-4.0)	2026-04-25 20:59:28 +02:00
DATA-LICENSE	release(1.0): README + CHANGELOG + DATA-LICENSE (CC-BY-4.0)	2026-04-25 20:59:28 +02:00
docker-compose.dev.yml	ops(dev): docker-compose.dev.yml + deploy.sh-Branch-Guard	2026-04-28 01:35:30 +02:00
docker-compose.yml	ops: GITEA_TOKEN + GITEA_*-Settings im docker-compose.yml durchreichen	2026-04-28 01:06:57 +02:00
Dockerfile	ops: Dockerfile + docker-compose Anpassungen, ADR-Index aktuell	2026-04-25 20:55:57 +02:00
LICENSE	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
mkdocs.yml	Docs: Keycloak-Setup How-to + ADR-Index aktualisiert	2026-04-10 16:33:52 +02:00
pytest.ini	docs+ops: ADRs 0006/0008, DDD-Bewertung, Zugriffsrechte, Smoke-Test, Cron-Scripts	2026-04-25 20:55:57 +02:00
README.md	release(1.0): README + CHANGELOG + DATA-LICENSE (CC-BY-4.0)	2026-04-25 20:59:28 +02:00
requirements-dev.txt	build(#134 ): Coverage-Baseline (.coveragerc) + pytest-cov in dev-deps	2026-04-28 02:05:39 +02:00
requirements.txt	#43 Keycloak SSO: JWT-Middleware + UI-Guiding	2026-04-10 14:28:57 +02:00

README.md

GWÖ-Antragsprüfer

Automatische Gemeinwohl-Bilanzierung von Parlamentsanträgen nach der GWÖ-Matrix 2.0 für Gemeinden

Live unter https://gwoe.toppyr.de/.

Was macht das Tool?

Der GWÖ-Antragsprüfer analysiert Anträge aus deutschen Landesparlamenten und dem Bundestag und bewertet sie nach den Kriterien der Gemeinwohl-Ökonomie (GWÖ):

GWÖ-Score (0–10) — Wie gut entspricht der Antrag den GWÖ-Werten?
Matrix-Zuordnung — Welche der 25 Felder der GWÖ-Matrix für Gemeinden werden adressiert?
Programm-Treue — Passt der Antrag zum Wahl- und Grundsatzprogramm jeder Fraktion?
Verbesserungsvorschläge — Konkrete Textänderungen mit GWÖ-Begründung im Redline-Format
Zitate mit Verifikation — Belege aus den Wahl-/Grundsatzprogrammen, server-seitig gegen Original-Chunks geprüft (siehe ADR 0001)

Aktive Datenquellen (Stand Release 1.0)

16 Bundesländer + Bundestag — alle aktiven Adapter:

BL	Wahlperiode	Quelle
BUND	21 (2025–2029)	bundestag.de DIP
BW	17 (2021–2026)	PARLIS
BY	19 (2023–2028)	Bayern Landtag
BE	19 (2023–2026)	Berlin AGH
BB	8 (2024–2029)	StarWeb
HB	21 (2023–2027)	ParlDok
HH	23 (2025–2029)	ParlDok
HE	21 (2024–2029)	Hessen Landtag
MV	8 (2021–2026)	ParlDok
NI	—	NILAS (login-protected, deferred)
NRW	18 (2022–2027)	OPAL
RP	18 (2021–2026)	StarWeb
LSA	8 (2021–2026)	StarWeb
SL	17 (2022–2027)	Umbraco
SN	8 (2024–2029)	XML-Export
SH	20 (2022–2027)	Schleswig-Holstein
TH	8 (2024–2029)	StarWeb

Plus abgeordnetenwatch.de-Integration für strukturierte namentliche Abstimmungen (alle 16 BL + BT).

Features

Frontend (v2, ECOnGOOD-CD)

Listenansicht mit Score-Band-Filter, BL-Chip-Filter, Sort-Dropdown (8 Optionen), Live-Suche
Antragsdetail mit ScoreHero, Matrix 5×5, Zitaten, Redline-Diff, Programm-Treue pro Fraktion, Versionshistorie, namentlichem Abstimmungsverhalten (wenn vorhanden)
Bookmark-Liste (server-seitig pro User), Kommentare, Voting, Share-Buttons (Threads/X/Mastodon mit LLM-Texten), Re-Analyze
Auswertungen mit BL×Partei-Matrix, Themen×Fraktion-Heatmap, Cluster-Bubble-Chart
Tag-Cloud, Cluster-Liste, Landtag-Live-Suche, Methodik, Quellen
Admin-Panel Freischaltungen / Queue / Abos / Wahlprogramme
Dark-Mode, Phosphor-Icons, Avenir/Nunito-Sans, Keyboard-Shortcuts (j/k/Enter/Esc/?/⏎)

Backend

FastAPI + Jinja2 + Vanilla JS (kein Build-Tool)
SQLite mit aiosqlite (Source of Truth)
Qwen-Plus (DashScope) für die LLM-Bewertung — austauschbar via LlmBewerter-Port (ADR 0008)
Embeddings v4 für die Zitat-Verifikation (ADR 0006)
Keycloak SSO mit Direct-Access-Grant (Login-Modal in der App, kein Redirect)
Background-Queue mit 3 parallelen Workern + Graceful Shutdown
Daily-Digest-Mail für Abonnent:innen
Monitoring-Scan aller Adapter mit Kosten-Schätzung — Beobachtung ohne Auto-Fetch
OG-Cards (Open-Graph-Bilder pro Antrag, Playwright-gerendert)
WeasyPrint für PDF-Reports

Tests

574 Tests, 13 skipped — Unit + Integration + Property + Bug-Regression + DDD
Live-Adapter-Tests gegen alle 17 Quellen (pytest -m integration)
Citation-Substring-Verification gegen Original-PDFs
E2E-Browser-Tests via Playwright (pytest -m e2e)

Architektur

Detailliert in docs/:

docs/adr/ — Architecture Decision Records (8 ADRs)
docs/analysen/ddd-bewertung.md — DDD-Analyse + Migrations-Roadmap
docs/reference/zugriffsrechte.md — 63 Routes × User-Status-Matrix
docs/reference/api.md — API-Reference

DDD-Lightweight-Migration ist Tag 1-4 abgeschlossen (Ports, Adapter, Repositories, Domain-Verhalten — siehe ADR 0008). Callsite-Migration in main.py ist Folge-PR.

Schnellstart

Voraussetzungen

Docker + Docker Compose
Python 3.12 (für lokale Tests)
DashScope API-Key (Qwen)
Keycloak (optional, für Login)

Installation

git clone https://repo.toppyr.de/tobias/gwoe-antragspruefer
cd gwoe-antragspruefer/webapp
cp .env.example .env       # API-Keys eintragen
docker compose up -d --build

App auf http://localhost:8000.

Tests

python3 -m pytest tests/ -q                  # Unit-Suite (574 Tests, < 2 s)
python3 -m pytest tests/ -m integration      # Live-Adapter-Tests (langsam)
./scripts/smoke-test.sh                       # Gesamt-Funktionsprüfung gegen Live

Deploy (Server)

./scripts/deploy.sh                           # mit Uptime-Kuma-Wartungsmodus
./scripts/run-digest.sh                       # Daily-Mail-Digest (Cron 07:00)
./scripts/run-monitoring-scan.sh              # Monitoring-Scan (manuell oder Cron)

Lizenz

Zwei getrennte Lizenzen:

Quellcode — MIT
Bewertungs-Daten und -Berichte (Assessments, Matrix-Zuordnungen, Verbesserungsvorschläge, Themen-Tags etc.) — CC BY 4.0

Wahlprogramme und Antrags-PDFs der Parlamente unterliegen der jeweiligen Urheber-Lizenz der Quelle und werden hier nur zur Verifikation referenziert.

Mitwirken

Issues unter https://repo.toppyr.de/tobias/gwoe-antragspruefer. Pull Requests willkommen — beachte ADR 0004 (Deployment-Workflow) und die Test-Konventionen in pytest.ini.

Statistiken (Stand Release 1.0)

16 BL + Bundestag aktiv
85 Wahlprogramme indexiert (Embeddings v4)
71 produktive Bewertungen in der Live-DB
28 977 abgeordnetenwatch-Votes (BUND)
11 789 LOC Python in app/

README.md Unescape Escape

GWÖ-Antragsprüfer

Was macht das Tool?

Aktive Datenquellen (Stand Release 1.0)

Features

Frontend (v2, ECOnGOOD-CD)

Backend

Tests

Architektur

Schnellstart

Voraussetzungen

Installation

Tests

Deploy (Server)

Lizenz

Mitwirken

Statistiken (Stand Release 1.0)

README.md