GWÖ-Antragsprüfer: Automatische Gemeinwohl-Bilanzierung von Parlamentsanträgen nach der GWÖ-Matrix 2.0

Go to file

Dotty Dotter db3ada9328 #60 Fix A+C: ENUM-basiertes Zitieren + top_k 2→5 Strukturelle Lösung für die LLM-Halluzinations-Cases aus #60: A — ENUM-Anker - format_quotes_for_prompt nummeriert jeden retrievten Chunk als [Q1], [Q2], … - Neue ZITATEREGEL im Prompt erzwingt vier Bedingungen: 1. Jedes Zitat MUSS auf genau einen [Qn]-Chunk verweisen 2. Der text-String MUSS eine wörtliche, zusammenhängende Passage von min. 5 Wörtern aus genau diesem Chunk sein 3. Die quelle MUSS exakt das Source-Label des gewählten Chunks sein 4. Wenn kein Chunk passt: leeres zitate-Array — lieber 0 als erfunden - analyzer.py:get_system_prompt: Wichtige-Regeln-Block zieht den selben Mechanismus nach, damit das LLM den [Qn]-Anker auch im System-Prompt sieht und nicht nur im User-Prompt. C — Recall-Boost - analyzer.py:run_analysis: top_k_per_partei 2 → 5. In den drei Cases aus #60 lagen die "richtigen" Seiten (S.36, S.37) bisher außerhalb des Top-3-Windows; mit Top-5 erhöht sich die Wahrscheinlichkeit, dass sie überhaupt im Kontext landen. Hintergrund — die Halluzinationen waren KEIN Embedding-Bug: Die retrievten Chunks für Case 1 enthielten S.58 (richtige Seite, falscher Snippet) — das LLM hat den Snippet aus seinem Trainingswissen über GRÜNE-Wahlprogramme rekonstruiert statt aus dem retrievten Chunk-Text zu zitieren. Cases 2/3 hatten die zitierten Seiten gar nicht im Top-3-Window — das LLM hat sowohl Seite als auch Snippet halluziniert. ENUM-Anker verhindert beides strukturell, weil ein nicht-existenter [Qn] sofort als Cheating sichtbar wäre. Tests: - test_chunks_get_enum_ids - test_zitateregel_mentions_enum_anchor - 179/179 grün Refs: #60, #54 (Sub-D), #50 (Umbrella E2E)		2026-04-09 22:21:39 +02:00
app	#60 Fix A+C: ENUM-basiertes Zitieren + top_k 2→5	2026-04-09 22:21:39 +02:00
tests	#60 Fix A+C: ENUM-basiertes Zitieren + top_k 2→5	2026-04-09 22:21:39 +02:00
.dockerignore	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
.env.example	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
.gitignore	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
.tarignore	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
docker-compose.yml	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
Dockerfile	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
LICENSE	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
pytest.ini	Add E2E functional acceptance test suite (#50 , #51 , #52 , #53 , #54 )	2026-04-09 10:00:20 +02:00
README.md	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
requirements-dev.txt	Add pytest suite + fix two regex bugs uncovered by it (#46 )	2026-04-08 23:26:06 +02:00
requirements.txt	Security hotfixes #1 , #2 , #6 from audit (#57 )	2026-04-09 10:45:43 +02:00

README.md

GWÖ-Antragsprüfer

Automatische Gemeinwohl-Bilanzierung von Parlamentsanträgen nach der GWÖ-Matrix 2.0 für Gemeinden

🎯 Was ist das?

Der GWÖ-Antragsprüfer analysiert Anträge aus Landesparlamenten (aktuell NRW) und bewertet sie nach den Kriterien der Gemeinwohl-Ökonomie (GWÖ):

GWÖ-Score (0-10): Wie gut entspricht der Antrag den GWÖ-Werten?
Matrix-Zuordnung: Welche Felder der GWÖ-Matrix werden adressiert?
Programmtreue: Passt der Antrag zu Wahl- und Parteiprogrammen?
Verbesserungsvorschläge: Konkrete Textänderungen mit GWÖ-Begründung

✨ Features

🔍 Landtag-Suche: Direkte Anbindung an OPAL (NRW Parlamentsdokumentation)
📊 GWÖ-Matrix-Visualisierung: 5×5-Tabelle mit Bewertungssymbolen
🏷️ Tag-Wolke: Filter nach Themen mit Multi-Select
🎯 Partei-Filter: Durchschnittswerte pro Fraktion
📄 PDF-Export: Professionelle Berichte im GWÖ-Design
🔒 Security: CSP, CORS, Rate Limiting

🚀 Schnellstart

Voraussetzungen

Python 3.12+
Docker & Docker Compose
DashScope API-Key (Qwen LLM)

Installation

# Repository klonen
git clone https://github.com/tobiasroedel/gwoe-antragspruefer.git
cd gwoe-antragspruefer

# Environment-Variablen
cp .env.example .env
# DASHSCOPE_API_KEY eintragen

# Mit Docker starten
docker compose up -d

# Oder lokal entwickeln
python -m venv venv
source venv/bin/activate
pip install -r requirements.txt
uvicorn app.main:app --reload

Die App läuft auf http://localhost:8000

📁 Projektstruktur

webapp/
├── app/
│   ├── main.py           # FastAPI-Endpoints
│   ├── analyzer.py       # LLM-Analyse-Logik
│   ├── database.py       # SQLite-Persistenz
│   ├── models.py         # Pydantic-Modelle
│   ├── parlamente.py     # Landtag-Adapter (OPAL)
│   ├── report.py         # PDF-Generierung
│   ├── config.py         # Settings
│   ├── kontext/          # GWÖ-Matrix, Wahlprogramme
│   ├── templates/        # Jinja2-HTML
│   └── static/           # CSS, JS, Assets
├── data/                 # SQLite-DBs (Volume)
├── reports/              # Generierte PDFs (Volume)
├── docker-compose.yml
├── Dockerfile
└── requirements.txt

🔧 Konfiguration

Environment-Variablen

Variable	Beschreibung	Default
`DASHSCOPE_API_KEY`	Alibaba DashScope API-Key	(required)
`LLM_MODEL_DEFAULT`	Standard-Modell	`qwen-plus-latest`
`LLM_MODEL_PREMIUM`	Premium-Modell	`qwen-max`

Unterstützte Bundesländer

Code	Name	Status
NRW	Nordrhein-Westfalen	✅ Aktiv
BY	Bayern	🔜 Geplant
BW	Baden-Württemberg	🔜 Geplant

📊 API-Endpoints

Methode	Pfad	Beschreibung
GET	`/`	Web-UI
GET	`/api/assessments`	Alle Bewertungen
GET	`/api/assessment?drucksache=18/12345`	Einzelne Bewertung
POST	`/api/analyze-drucksache`	Neue Analyse starten
GET	`/api/search?q=Klima`	Interne Suche
GET	`/api/search-landtag?q=Klima`	Landtag-Suche
GET	`/api/assessment/pdf?drucksache=18/12345`	PDF-Download

🧠 GWÖ-Prompt (v5)

Der Analyse-Prompt basiert auf:

GWÖ-Matrix 2.0 für Gemeinden (Arbeitsbuch)
ECOnGOOD Corporate Design Manual 2024
Wahlprogramme der NRW-Landtagsparteien 2022

Ausgabe-Format:

GWÖ-Score mit Matrix-Feldern und Symbolen (++/+/○/−/−−)
Wahlprogramm- und Parteiprogrammtreue
Verbesserungsvorschläge im Redline-Format (Original → Vorschlag → Begründung)
Themen-Tags für Kategorisierung

🛠️ Entwicklung

# Tests ausführen
pytest

# Linting
ruff check app/

# Type-Checking
mypy app/

📝 Lizenz

MIT License - siehe LICENSE

🙏 Credits

Gemeinwohl-Ökonomie - Matrix und Arbeitsbücher
Alibaba DashScope - Qwen LLM API
Landtag NRW - OPAL-Dokumentation

Entwickelt von Tobias Rödel · tobiasroedel.de

README.md Unescape Escape