gwoe-antragspruefer

History

Dotty Dotter db3ada9328 #60 Fix A+C: ENUM-basiertes Zitieren + top_k 2→5 Strukturelle Lösung für die LLM-Halluzinations-Cases aus #60: A — ENUM-Anker - format_quotes_for_prompt nummeriert jeden retrievten Chunk als [Q1], [Q2], … - Neue ZITATEREGEL im Prompt erzwingt vier Bedingungen: 1. Jedes Zitat MUSS auf genau einen [Qn]-Chunk verweisen 2. Der text-String MUSS eine wörtliche, zusammenhängende Passage von min. 5 Wörtern aus genau diesem Chunk sein 3. Die quelle MUSS exakt das Source-Label des gewählten Chunks sein 4. Wenn kein Chunk passt: leeres zitate-Array — lieber 0 als erfunden - analyzer.py:get_system_prompt: Wichtige-Regeln-Block zieht den selben Mechanismus nach, damit das LLM den [Qn]-Anker auch im System-Prompt sieht und nicht nur im User-Prompt. C — Recall-Boost - analyzer.py:run_analysis: top_k_per_partei 2 → 5. In den drei Cases aus #60 lagen die "richtigen" Seiten (S.36, S.37) bisher außerhalb des Top-3-Windows; mit Top-5 erhöht sich die Wahrscheinlichkeit, dass sie überhaupt im Kontext landen. Hintergrund — die Halluzinationen waren KEIN Embedding-Bug: Die retrievten Chunks für Case 1 enthielten S.58 (richtige Seite, falscher Snippet) — das LLM hat den Snippet aus seinem Trainingswissen über GRÜNE-Wahlprogramme rekonstruiert statt aus dem retrievten Chunk-Text zu zitieren. Cases 2/3 hatten die zitierten Seiten gar nicht im Top-3-Window — das LLM hat sowohl Seite als auch Snippet halluziniert. ENUM-Anker verhindert beides strukturell, weil ein nicht-existenter [Qn] sofort als Cheating sichtbar wäre. Tests: - test_chunks_get_enum_ids - test_zitateregel_mentions_enum_anchor - 179/179 grün Refs: #60, #54 (Sub-D), #50 (Umbrella E2E)		2026-04-09 22:21:39 +02:00
..
kontext	Activate LSA: Wahlprogramme + ingest + frontend (#2 )	2026-04-07 22:12:32 +02:00
routers	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
static/referenzen	Add 30 Wahlprogramme für TH/BB/HH/SH/BW/RP (#37 , #39 , #40 , #32 , #41 , #42 )	2026-04-09 08:03:11 +02:00
templates	Phase E (substituted): Auswertungen-Drilldown-Modal (#59 )	2026-04-09 11:30:10 +02:00
__init__.py	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
analyzer.py	#60 Fix A+C: ENUM-basiertes Zitieren + top_k 2→5	2026-04-09 22:21:39 +02:00
auswertungen.py	Phase C: Auswertungen-Dashboard #58 + CSV-Export #45 (Roadmap #59 )	2026-04-09 11:25:57 +02:00
bundeslaender.py	Phase J: SN EDAS-XML-Adapter (#26/#38) — Sachsen aktiv via XML-Export	2026-04-09 14:39:03 +02:00
config.py	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
database.py	Phase A: Audit-Restbefunde #57.3/4/7 (Roadmap #59 )	2026-04-09 11:15:16 +02:00
embeddings.py	#60 Fix A+C: ENUM-basiertes Zitieren + top_k 2→5	2026-04-09 22:21:39 +02:00
main.py	Phase C: Auswertungen-Dashboard #58 + CSV-Export #45 (Roadmap #59 )	2026-04-09 11:25:57 +02:00
models.py	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
parlamente.py	Phase J: SN EDAS-XML-Adapter (#26/#38) — Sachsen aktiv via XML-Export	2026-04-09 14:39:03 +02:00
parteien.py	Phase J: SN EDAS-XML-Adapter (#26/#38) — Sachsen aktiv via XML-Export	2026-04-09 14:39:03 +02:00
report.py	Security hotfixes #1 , #2 , #6 from audit (#57 )	2026-04-09 10:45:43 +02:00
validators.py	Phase A: Audit-Restbefunde #57.3/4/7 (Roadmap #59 )	2026-04-09 11:15:16 +02:00
wahlperioden.py	Phase C: Auswertungen-Dashboard #58 + CSV-Export #45 (Roadmap #59 )	2026-04-09 11:25:57 +02:00
wahlprogramme.py	Add 30 Wahlprogramme für TH/BB/HH/SH/BW/RP (#37 , #39 , #40 , #32 , #41 , #42 )	2026-04-09 08:03:11 +02:00