Claim-Verification-Layer: Faktendichte und prüfbare Behauptungen #16

Open
opened 2026-04-23 20:50:38 +02:00 by tobias · 0 comments
Owner

Ziel

Prüfbare faktische Behauptungen automatisch extrahieren und eine "Factual Density Map" erstellen — wo sind viele Zahlen und Fakten, wo ist viel Meinung?

Ansatz

  1. LLM-Pass über alle Transkript-Absätze: Extrahiere prüfbare Claims (Zahlen, Statistiken, kausale Behauptungen)
  2. Ergebnis: claims(paragraph_id, claim_text, claim_type, verifiable)
  3. Zweite Stufe: Für jeden Claim in den anderen Episoden nach Bestätigung oder Widerspruch suchen (semantische Suche + LLM-Bewertung)
  4. Optional: Externe Faktenquellen anbinden (Destatis, Eurostat, IPCC)

Erkenntnisgewinn

  • Welche Behauptungen stehen unwidersprochen?
  • Wo nutzen verschiedene Sprecher*innen dieselbe Statistik unterschiedlich?
  • Factual Density Map: Welche Episoden/Passagen sind faktenreich, welche meinungslastig?

Beispiel

Butterwegge (S4E2): "Die fünf reichsten Familien besitzen 250 Mrd. Euro" → Claim extrahiert → Suche findet Pistor (S1E3), die über Vermögenskonzentration redet → Ergänzung/Bestätigung.

Visualisierung

Heatmap über die Timeline: Grün = hohe Faktendichte, Gelb = Mischung, Rot = überwiegend normativ.

## Ziel Prüfbare faktische Behauptungen automatisch extrahieren und eine "Factual Density Map" erstellen — wo sind viele Zahlen und Fakten, wo ist viel Meinung? ## Ansatz 1. LLM-Pass über alle Transkript-Absätze: Extrahiere prüfbare Claims (Zahlen, Statistiken, kausale Behauptungen) 2. Ergebnis: `claims(paragraph_id, claim_text, claim_type, verifiable)` 3. Zweite Stufe: Für jeden Claim in den anderen Episoden nach Bestätigung oder Widerspruch suchen (semantische Suche + LLM-Bewertung) 4. Optional: Externe Faktenquellen anbinden (Destatis, Eurostat, IPCC) ## Erkenntnisgewinn - Welche Behauptungen stehen unwidersprochen? - Wo nutzen verschiedene Sprecher*innen dieselbe Statistik unterschiedlich? - Factual Density Map: Welche Episoden/Passagen sind faktenreich, welche meinungslastig? ## Beispiel Butterwegge (S4E2): "Die fünf reichsten Familien besitzen 250 Mrd. Euro" → Claim extrahiert → Suche findet Pistor (S1E3), die über Vermögenskonzentration redet → Ergänzung/Bestätigung. ## Visualisierung Heatmap über die Timeline: Grün = hohe Faktendichte, Gelb = Mischung, Rot = überwiegend normativ.
Sign in to join this conversation.
No Label
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: tobias/podcast-mindmap#16
No description provided.