Daten-Update: 7 Themen + 464 Zitate aus Qwen-Extraktion
mindmap_data.json regeneriert aus dem Live-Snapshot. Stand: 7 Themen-Cluster (gaza-nahost, haushalt-investitionen, klima-verkehr, krieg-ukraine, migration-asyl, parteienlandschaft, trump-usa), 464 Zitate (94 Top-Zitate, im Mittel 4,9 je Episode), 96 Episoden. INDEX.md entsprechend angepasst. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
parent
011ac49f3d
commit
e29c49bd8f
6
INDEX.md
6
INDEX.md
@ -6,17 +6,17 @@
|
||||
|
||||
## Stand
|
||||
|
||||
- **96 transkribierte Episoden** (LdN379 bis LdN474)
|
||||
- **96 transkribierte Episoden** (LdN379 bis LdN474), nur 2024-2026 im aktuellen Snapshot
|
||||
- **473 katalogisierte Episoden** in `project.yaml` (alle Jahre 2017-2026)
|
||||
- **7 Themen-Cluster** und **464 Zitate** (im Mittel 4,9 je Episode), via Qwen-plus extrahiert
|
||||
- Transkripte via MacWhisper (Whisper-Modell large-v3) aus den Original-MP3s
|
||||
- Nur Episoden 2024-2026 sind im aktuellen Snapshot transkribiert
|
||||
|
||||
## Inhalt dieses Repos
|
||||
|
||||
| Pfad | Inhalt | Groesse |
|
||||
|------|--------|---------|
|
||||
| `project.yaml` | Episode-Katalog (473 Eintraege), 10 Staffeln (2017-2026) | ~98 KB |
|
||||
| `data/mindmap_data.json` | Strukturierte Episode-/Themen-Daten fuers Frontend | ~30 KB |
|
||||
| `data/mindmap_data.json` | Strukturierte Episode-, Themen- und Zitat-Daten fuers Frontend | ~420 KB |
|
||||
| `data/srt_index.json` | Paragraph-Index aller 96 transkribierten Episoden | ~6,5 MB |
|
||||
| `audio/LdN*.json` | 96 Whisper-Outputs mit Wort-Timestamps | ~15 MB |
|
||||
| `audio/LdN406.srt` | Stichprobe-SRT | klein |
|
||||
|
||||
File diff suppressed because it is too large
Load Diff
Loading…
Reference in New Issue
Block a user