Transparenz-/Methodik-Seite: Systematik, Prompts und Bewertungslogik offenlegen #96

Closed
opened 2026-04-10 16:06:58 +02:00 by tobias · 1 comment
Owner

Hintergrund

Nutzer muessen nachvollziehen koennen, WIE die Bewertungen zustande kommen, um der Plattform zu vertrauen. Aktuell gibt es keine oeffentliche Erklaerung der Methodik.

Inhalte der Seite

  1. GWOe-Matrix 2.0: Erklaerung der 5x5 Matrix (Beruehrungsgruppen x Werte), Bewertungsskala -5 bis +5, Empfehlungs-Kategorien
  2. LLM-Analyse-Pipeline: Welches Modell (Qwen Plus via DashScope), System-Prompt-Zusammenfassung (ohne den vollen Prompt zu leaken), Retry-Logik bei JSON-Parse-Fehlern
  3. Wahlprogramm-Vergleich: Wie werden Wahl- und Grundsatzprogramme indexiert (Embedding-Retrieval, Top-K=5), wie werden Zitate verifiziert (reconstruct_zitate, Substring-Match)
  4. Transparenz-Garantien: Sub-D Citation-Property-Tests, Halluzinations-Erkennung und Auto-Re-Analyse
  5. Einschraenkungen: Was das Tool NICHT kann (keine juristische Bewertung, LLM-Bias, nur indexierte Programme)
  6. Datenquellen: Links zu allen 16 Landtags-Portalen + DIP-API, Liste der indexierten Wahlprogramme

Akzeptanzkriterien

  • Neue Seite unter /methodik oder /about/methodik
  • In der Hauptnavigation verlinkt (neben Quellen + Auswertungen)
  • Verstaendlich fuer Nicht-Techniker, aber mit optionalen technischen Details (aufklappbar)
  • Verweis auf ADRs in der docs-Site fuer die tieferen technischen Entscheidungen
  • Kein Leak des vollen System-Prompts (Manipulation-Risiko), aber Zusammenfassung der Bewertungskriterien
## Hintergrund Nutzer muessen nachvollziehen koennen, WIE die Bewertungen zustande kommen, um der Plattform zu vertrauen. Aktuell gibt es keine oeffentliche Erklaerung der Methodik. ## Inhalte der Seite 1. **GWOe-Matrix 2.0**: Erklaerung der 5x5 Matrix (Beruehrungsgruppen x Werte), Bewertungsskala -5 bis +5, Empfehlungs-Kategorien 2. **LLM-Analyse-Pipeline**: Welches Modell (Qwen Plus via DashScope), System-Prompt-Zusammenfassung (ohne den vollen Prompt zu leaken), Retry-Logik bei JSON-Parse-Fehlern 3. **Wahlprogramm-Vergleich**: Wie werden Wahl- und Grundsatzprogramme indexiert (Embedding-Retrieval, Top-K=5), wie werden Zitate verifiziert (reconstruct_zitate, Substring-Match) 4. **Transparenz-Garantien**: Sub-D Citation-Property-Tests, Halluzinations-Erkennung und Auto-Re-Analyse 5. **Einschraenkungen**: Was das Tool NICHT kann (keine juristische Bewertung, LLM-Bias, nur indexierte Programme) 6. **Datenquellen**: Links zu allen 16 Landtags-Portalen + DIP-API, Liste der indexierten Wahlprogramme ## Akzeptanzkriterien - [ ] Neue Seite unter /methodik oder /about/methodik - [ ] In der Hauptnavigation verlinkt (neben Quellen + Auswertungen) - [ ] Verstaendlich fuer Nicht-Techniker, aber mit optionalen technischen Details (aufklappbar) - [ ] Verweis auf ADRs in der docs-Site fuer die tieferen technischen Entscheidungen - [ ] Kein Leak des vollen System-Prompts (Manipulation-Risiko), aber Zusammenfassung der Bewertungskriterien
Author
Owner

Live unter /methodik. Commits 07507de + 0870e8a.

Live unter /methodik. Commits 07507de + 0870e8a.
Sign in to join this conversation.
No description provided.