GWÖ-Antragsprüfer: Automatische Gemeinwohl-Bilanzierung von Parlamentsanträgen nach der GWÖ-Matrix 2.0

Go to file

Dotty Dotter 6ced7ae018 #60 Reopen — Option B: server-side reconstruct of zitat quelle/url Sub-D Live-Run gegen Prod-DB nach dem db3ada9-Deploy hat einen neuen Halluzinations-Case gezeigt, den A+C nicht gefangen hat: BB 8/673 BSW: text aus bsw-bb-2024 S.27 (verifiziert via Volltext-Suche im PDF), aber LLM hat im quelle-Feld "S. 4" angegeben — die Seite des Top-2-Chunks im selben Retrieval-Window. Klassischer Cross-Mix zwischen Q-IDs. Strukturelle Diagnose: Das [Qn]-Tag aus A ist nur ein weicher Anker im Prompt. Das LLM darf Text aus Chunk Qn kopieren und trotzdem die quelle aus Chunk Qm zusammenbauen. Die ZITATEREGEL kann das nicht verhindern, solange wir der LLM-Selbstauskunft vertrauen. Fix (Option B aus dem ursprünglichen Plan): `embeddings.reconstruct_zitate(data, semantic_quotes)` läuft im analyzer nach json.loads aber vor Pydantic-Validation: 1. Flachen die retrievten Chunks aller Parteien zu einer einzigen Liste. 2. Pro Zitat: text via Substring oder 5-Wort-Anker gegen alle Chunks matchen (Helpers `find_chunk_for_text` + `_normalize_for_match`, identische Logik wie Sub-D Test). 3. Match → quelle/url server-seitig durch _chunk_source_label und _chunk_pdf_url des matchenden Chunks ÜBERSCHREIBEN. 4. Kein Match → Zitat verworfen (statt mit erfundener quelle persistiert). Damit kann der LLM nur noch sauber zitieren oder gar nicht — es gibt keinen Pfad mehr zu "echter Text, falsche quelle". Tests: - TestReconstructZitate (5 cases): BB 8/673 Re-Mapping, Drop bei hallucinated, no-op bei leeren chunks, anchor-match-Fallback, short-needle und soft-hyphen Edge-Cases - 185/185 grün (179 + 6 neu) Refs: #60, #54 (Sub-D)		2026-04-09 22:52:17 +02:00
app	#60 Reopen — Option B: server-side reconstruct of zitat quelle/url	2026-04-09 22:52:17 +02:00
tests	#60 Reopen — Option B: server-side reconstruct of zitat quelle/url	2026-04-09 22:52:17 +02:00
.dockerignore	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
.env.example	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
.gitignore	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
.tarignore	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
docker-compose.yml	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
Dockerfile	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
LICENSE	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
pytest.ini	Add E2E functional acceptance test suite (#50 , #51 , #52 , #53 , #54 )	2026-04-09 10:00:20 +02:00
README.md	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
requirements-dev.txt	Add pytest suite + fix two regex bugs uncovered by it (#46 )	2026-04-08 23:26:06 +02:00
requirements.txt	Security hotfixes #1 , #2 , #6 from audit (#57 )	2026-04-09 10:45:43 +02:00

README.md

GWÖ-Antragsprüfer

Automatische Gemeinwohl-Bilanzierung von Parlamentsanträgen nach der GWÖ-Matrix 2.0 für Gemeinden

🎯 Was ist das?

Der GWÖ-Antragsprüfer analysiert Anträge aus Landesparlamenten (aktuell NRW) und bewertet sie nach den Kriterien der Gemeinwohl-Ökonomie (GWÖ):

GWÖ-Score (0-10): Wie gut entspricht der Antrag den GWÖ-Werten?
Matrix-Zuordnung: Welche Felder der GWÖ-Matrix werden adressiert?
Programmtreue: Passt der Antrag zu Wahl- und Parteiprogrammen?
Verbesserungsvorschläge: Konkrete Textänderungen mit GWÖ-Begründung

✨ Features

🔍 Landtag-Suche: Direkte Anbindung an OPAL (NRW Parlamentsdokumentation)
📊 GWÖ-Matrix-Visualisierung: 5×5-Tabelle mit Bewertungssymbolen
🏷️ Tag-Wolke: Filter nach Themen mit Multi-Select
🎯 Partei-Filter: Durchschnittswerte pro Fraktion
📄 PDF-Export: Professionelle Berichte im GWÖ-Design
🔒 Security: CSP, CORS, Rate Limiting

🚀 Schnellstart

Voraussetzungen

Python 3.12+
Docker & Docker Compose
DashScope API-Key (Qwen LLM)

Installation

# Repository klonen
git clone https://github.com/tobiasroedel/gwoe-antragspruefer.git
cd gwoe-antragspruefer

# Environment-Variablen
cp .env.example .env
# DASHSCOPE_API_KEY eintragen

# Mit Docker starten
docker compose up -d

# Oder lokal entwickeln
python -m venv venv
source venv/bin/activate
pip install -r requirements.txt
uvicorn app.main:app --reload

Die App läuft auf http://localhost:8000

📁 Projektstruktur

webapp/
├── app/
│   ├── main.py           # FastAPI-Endpoints
│   ├── analyzer.py       # LLM-Analyse-Logik
│   ├── database.py       # SQLite-Persistenz
│   ├── models.py         # Pydantic-Modelle
│   ├── parlamente.py     # Landtag-Adapter (OPAL)
│   ├── report.py         # PDF-Generierung
│   ├── config.py         # Settings
│   ├── kontext/          # GWÖ-Matrix, Wahlprogramme
│   ├── templates/        # Jinja2-HTML
│   └── static/           # CSS, JS, Assets
├── data/                 # SQLite-DBs (Volume)
├── reports/              # Generierte PDFs (Volume)
├── docker-compose.yml
├── Dockerfile
└── requirements.txt

🔧 Konfiguration

Environment-Variablen

Variable	Beschreibung	Default
`DASHSCOPE_API_KEY`	Alibaba DashScope API-Key	(required)
`LLM_MODEL_DEFAULT`	Standard-Modell	`qwen-plus-latest`
`LLM_MODEL_PREMIUM`	Premium-Modell	`qwen-max`

Unterstützte Bundesländer

Code	Name	Status
NRW	Nordrhein-Westfalen	✅ Aktiv
BY	Bayern	🔜 Geplant
BW	Baden-Württemberg	🔜 Geplant

📊 API-Endpoints

Methode	Pfad	Beschreibung
GET	`/`	Web-UI
GET	`/api/assessments`	Alle Bewertungen
GET	`/api/assessment?drucksache=18/12345`	Einzelne Bewertung
POST	`/api/analyze-drucksache`	Neue Analyse starten
GET	`/api/search?q=Klima`	Interne Suche
GET	`/api/search-landtag?q=Klima`	Landtag-Suche
GET	`/api/assessment/pdf?drucksache=18/12345`	PDF-Download

🧠 GWÖ-Prompt (v5)

Der Analyse-Prompt basiert auf:

GWÖ-Matrix 2.0 für Gemeinden (Arbeitsbuch)
ECOnGOOD Corporate Design Manual 2024
Wahlprogramme der NRW-Landtagsparteien 2022

Ausgabe-Format:

GWÖ-Score mit Matrix-Feldern und Symbolen (++/+/○/−/−−)
Wahlprogramm- und Parteiprogrammtreue
Verbesserungsvorschläge im Redline-Format (Original → Vorschlag → Begründung)
Themen-Tags für Kategorisierung

🛠️ Entwicklung

# Tests ausführen
pytest

# Linting
ruff check app/

# Type-Checking
mypy app/

📝 Lizenz

MIT License - siehe LICENSE

🙏 Credits

Gemeinwohl-Ökonomie - Matrix und Arbeitsbücher
Alibaba DashScope - Qwen LLM API
Landtag NRW - OPAL-Dokumentation

Entwickelt von Tobias Rödel · tobiasroedel.de

README.md Unescape Escape