Daten-Update: 7 Themen + 464 Zitate aus Qwen-Extraktion

mindmap_data.json regeneriert aus dem Live-Snapshot. Stand: 7 Themen-Cluster (gaza-nahost, haushalt-investitionen, klima-verkehr, krieg-ukraine, migration-asyl, parteienlandschaft, trump-usa), 464 Zitate (94 Top-Zitate, im Mittel 4,9 je Episode), 96 Episoden. INDEX.md entsprechend angepasst.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
Dotty Dotter 2026-04-28 01:12:26 +02:00
parent 011ac49f3d
commit e29c49bd8f
2 changed files with 7353 additions and 700 deletions

View File

@ -6,17 +6,17 @@
## Stand
- **96 transkribierte Episoden** (LdN379 bis LdN474)
- **96 transkribierte Episoden** (LdN379 bis LdN474), nur 2024-2026 im aktuellen Snapshot
- **473 katalogisierte Episoden** in `project.yaml` (alle Jahre 2017-2026)
- **7 Themen-Cluster** und **464 Zitate** (im Mittel 4,9 je Episode), via Qwen-plus extrahiert
- Transkripte via MacWhisper (Whisper-Modell large-v3) aus den Original-MP3s
- Nur Episoden 2024-2026 sind im aktuellen Snapshot transkribiert
## Inhalt dieses Repos
| Pfad | Inhalt | Groesse |
|------|--------|---------|
| `project.yaml` | Episode-Katalog (473 Eintraege), 10 Staffeln (2017-2026) | ~98 KB |
| `data/mindmap_data.json` | Strukturierte Episode-/Themen-Daten fuers Frontend | ~30 KB |
| `data/mindmap_data.json` | Strukturierte Episode-, Themen- und Zitat-Daten fuers Frontend | ~420 KB |
| `data/srt_index.json` | Paragraph-Index aller 96 transkribierten Episoden | ~6,5 MB |
| `audio/LdN*.json` | 96 Whisper-Outputs mit Wort-Timestamps | ~15 MB |
| `audio/LdN406.srt` | Stichprobe-SRT | klein |

File diff suppressed because it is too large Load Diff