gwoe-antragspruefer

Author	SHA1	Message	Date
Dotty Dotter	bdbfc1ff7d	feat(Phase 18): PM-Prompt verschaerft + Auto-Re-Generate bei zu kurzem Output - SYSTEM_PROMPT mit explizitem 'Mindestens 320 Worte, < 280 ist Verstoss' + Hinweis 'wenn Substanz ausgeht: Lebenslage vertiefen statt abbrechen'. - Output-Format-Beispiel mit MINDESTENS-Hinweis. - generate_draft prüft nach LLM-Call die Wortzahl. Bei <280 Worten: ein einzelner Re-Prompt mit höherer Temperatur (0.5) und Hint zur ersten zu-kurzen Wortzahl. Wenn der zweite Versuch laenger ist, wird er übernommen — sonst bleibt der erste. - max_retries=1 fuer den zweiten Call (nicht endlos). Audit-Hauptbefund war 15/19 PMs unter Soll 320–380 Worten. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 23:47:42 +02:00
Dotty Dotter	ba1f104c8e	feat(#178 Folge): Thread-Auto-Splitter + Quality-Audit-Skript - _split_into_thread_posts() splittet zu lange Bodies an Satzgrenzen in mehrere Posts ≤ max_chars (Default 280). Greedy: möglichst viele Sätze pro Post. Hashtags am Ende bleiben erhalten. - generate_draft(style='thread') ruft den Splitter auf, wenn das LLM weniger als 3 Posts oder Posts > 290 chars liefert. - 7 Unit-Tests fuer den Splitter (test_thread_splitter.py). - scripts/pm-quality-audit.sh: prueft alle PM-Drafts gegen Verbotsliste (GWÖ-Score, Matrix-Codes, Floskeln) + Wortzahl + Absatzzahl + Post-Laengen. Markdown-Report-Output. Audit von 23 Drafts: 4/23 ohne Auffaelligkeit; Hauptbefund: PMs haeufig zu kurz, Threads splittten ohne Auto-Splitter nicht zuverlaessig — Splitter behebt das. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 17:08:57 +02:00
Dotty Dotter	eb74ae647e	fix(#178 ): Thread-Prompt verschaerft fuer 280-Zeichen-Posts	2026-05-06 16:14:11 +02:00
Dotty Dotter	a2b8f8c6fe	feat(#178 Phase 4.2): PM-Variante 'thread' fuer Mastodon/Twitter-Threads - Schema additiv: presse_drafts.style TEXT NOT NULL DEFAULT 'pm' via ALTER TABLE (idempotent in init_db). - presse_generator.generate_draft(style='pm'\|'thread') nutzt eigenen SYSTEM_PROMPT_THREAD (3-5 Posts à ≤280 Zeichen, Hook + Lebenslagen + Forderung, Hashtags am Schluss; keine fett-Markdown). - _find_existing_draft, list_drafts, list_drafts_for, get_draft liefern jetzt auch das style-Feld zurueck. - Endpoint /api/aktuelle-themen/generate-presse?style=thread baut den Switch ein. Ohne Param weiterhin 'pm'. - Frontend: PM-Modal zeigt den style-Tag (📰 PM / 🐦 Thread) im Banner und bietet einen Knopf "Auch als Thread / Auch als PM" generieren. Idempotenz pro (drucksache, news_url, style)-Tripel. Refs: #170, #178 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 16:11:16 +02:00
Dotty Dotter	b6b0ce752a	feat(#170 ): sparsame fett-Hervorhebungen + Smoke-Tests fuer Histogram/Stand PM-Prompt erlaubt nun max. eine Markdown-Bold-Markierung pro Absatz (Schluessel-Zahl/Effekt). Force-Regen-Test bestaetigt: qwen-max liefert 30 % wie im Beispiel; renderPmBody im Frontend rendert das als <strong>. Smoketests gegen die neuen Endpoints (score-histogram x4, admin/stand x2 Auth-Walls) absichern Regressionen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 09:32:54 +02:00
Dotty Dotter	0377cf4bd9	fix(#170 ): PM-Prompt — Paragraphen-Trennung mit \\n\\n erzwingen User-Beobachtung im Draft #6: qwen-max nutzte einsame Anfuehrungs- zeichen (") als Paragraph-Trenner statt \\n\\n. Optisch wirkte das wie inkorrekte JSON-Escapes mitten im Text. Zwei Mechanismen: 1. Prompt-Erweiterung: Neuer Abschnitt "Paragraphen-Formatierung" mit explizitem Beispiel: `"body": "Lead.\\n\\nWirkung 1.\\n\\nWirkung 2.\\n\\n..."`. Klar: keine Anfuehrungszeichen oder Sonderzeichen als Trenner. 2. Post-Process-Heuristik: Regex `([.!?])"([A-ZÄÖÜ])` → `\\1\\n\\n\\2`. Wenn ein " genau zwischen Punkt+Whitespace und Großbuchstabe steht, ist es wahrscheinlich ein Trenn-Klumpen, kein semantischer Anfuehrer. Wird durch echten Paragraph-Break ersetzt. Konservativ: nur dieses spezifische Pattern wird touched. Echte Quotes (z.B. "Es ist Zeit, …", sagt X) bleiben unangetastet, weil sie nicht direkt nach Satzschluss-Punkt stehen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 02:30:58 +02:00
Dotty Dotter	39ef248a66	fix(#170 ): PM-Body literal \\n → echte Newlines Beobachtung beim ersten Pressereferent-Output: qwen-max liefert manchmal literale Backslash-n Sequenzen (2 chars: \\ + n) statt echter Newline-Bytes im JSON-Body. Auch mit response_format=json_object aktiv. Post-Process im PM-Generator: \\n / \\r / \\t Sequenzen durch echte Newlines / CR / Tab ersetzen. Konservativ (nur diese drei). Macht das Modal richtig formatiert mit Paragraphen-Breaks. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 01:55:58 +02:00
Dotty Dotter	a0559333e8	fix(#170 ): JSON-Parse-Fehler im PM-Generator (unescaped Newlines) Beobachtung beim Force-Regen: alle 2 Retries scheiterten mit "Invalid control character at: line 3 column 275". qwen-max produziert JSON mit rohen \n statt \\n im body-String, was json.loads sprengt. Zwei Fixes parallel: 1. response_format={"type": "json_object"} als optionaler Mode im LlmRequest. PM-Generator setzt das jetzt. DashScope unterstuetzt das fuer qwen-max + qwen-plus und zwingt valide JSON-Strings. 2. Newline-Recovery als Fallback im QwenBewerter: `_recover_unescaped_newlines` iteriert char-weise mit String-Tracking, ersetzt unescaped \n/\r/\t in Strings durch \\n/\\r/\\t. Backslash- Folgen bleiben unangetastet. Wird vor dem Retry-Re-throw versucht. Bewertungs-Pfad (analyzer.py) bekommt json_object_mode=False als Default, um die bewaehrte Retry-Semantik nicht zu aendern. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 01:53:29 +02:00
Dotty Dotter	3bf1de15b5	fix(#174 ): PM-Prompt mit harter Verbotsliste + Few-Shot User-Feedback nach Live-Test: PMs waren kuerzer + nicht anschaulicher. Im Output stand "Score von 4,0/10", "in den Bereichen Buerger:innen, Wirtschaft, Staat, Gesellschaft und Natur" (Matrix-Zeilen D+E), "staerkt Solidaritaet, Wuerde und Demokratie" (GWÖ-Werte-Liste), Floskeln wie "innovative Loesungen" und "faktenbasierter Dialog". Komplett-Refactor: ABSOLUT VERBOTEN im PM-Text: - Numerische Scores ("GWÖ-Score 4/10", "X von 10 Punkten") - GWÖ-Wert-Listen als Aufzaehlung - Beruehrungsgruppen-Sprache ("Bereiche Buerger, Wirtschaft, Staat, ...") - Matrix-Codes ("Feld D2", "A1") - GWÖ-Begriffe als Schlagwort (max 1× pro Begriff, nur konkret) - Floskeln (zukunftsweisend, innovativ, faktenbasierter Dialog, ...) PFLICHT: Mindestens 3 Buerger:innen-Lebenslagen mit konkreter Wirkung: - Familien mit Kindern (Beträge, KiTa-Plätze) - Pflegebeduerftige + Angehoerige (Wartezeiten, Kosten) - Auszubildende / Studierende (Abbruchrisiko, BAföG) - Pendler:innen (Spritpreis, ÖPNV-Tarif) - Mieter:innen (Mietniveau, Nebenkosten) - Rentner:innen / Geringverdiener:innen (Kaufkraft in Euro) - Selbststaendige / kleine Betriebe (Buerokratie-Stunden, Steuern) Pro Lebenslage: konkreter quantifizierter Effekt ("verlaengert Wartezeit auf Heimplatz von 8 auf 12 Wochen", "spart einer vierkoepfigen Familie etwa 1.800 €/Jahr"). Few-Shot: Schlechtes Beispiel + Gutes Beispiel im Prompt. Das gute Beispiel zeigt 30%-Abbrecherquote, 2 Stunden Beratung, 800 zusaetzliche Pflegekraefte in 5 Jahren — konkret quantifizierte Wirkungen aus echten Zahlen. Laenger: 320–380 Worte (vorher 220–280) — konkrete Beispiele brauchen Platz. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-03 21:22:00 +02:00
Dotty Dotter	a3d13e984b	fix(#170 ): default min_similarity 0.40 + PM-Prompt als Pressereferent (Issue tba) 1. Default min_similarity 0.40 statt 0.50. Live-Test auf dev: mit 0.50 zeigt only_relevant=true 0 buckets, weil zu strikt fuer die aktuelle Sparse-Datenlage (77 Bewertungen × 30 News). Mit 0.40 bleiben 1 high + 2 mid News pro 7-Tage-Fenster — genau die kuratierte Sicht, die wir wollen. 2. PM-System-Prompt umgeschrieben als Pressereferent statt Redakteur. User-Wunsch: "Bürger:innen anschaulich machen, was sich durch den Antrag konkret im Leben vor Ort aendert". Pflicht-Elemente im neuen Prompt: - Konkrete Alltagswirkung (mindestens 2 Beispiele aus Lebenslagen: Pflegekraefte, Familien, Mieter:innen, Pendler:innen, ...) - GWÖ-Verbesserungspotential bei nicht voll ueberzeugenden Antraegen (was fehlt, wie ginge es besser aus GWÖ-Sicht) - Bei negativen Antraegen: klar benennen was verschlechtert wird, konkret quantifiziert wo moeglich - 220–280 Worte (vorher 200–250) - Aktive Verben, kurze Saetze, keine Floskeln - Strukturierter Aufbau: Lead → Beispiele + GWÖ-Bewertung → Verbesserungspotential → Forderung Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-03 13:45:40 +02:00
Dotty Dotter	e27dfc30a2	feat(#170 followup 2): Pre-Filter, Cluster, Antrags-Initiative, PM-Versionierung, Mail-Link User-Feedback: Aktuelle-Themen-Dashboard war "Detective-Modus" — durch viele News scrollen, Match-Stärke selbst interpretieren. Komplett-Refactor zur kuratierten Sicht mit Tabs. 1. Pre-Filter + GWÖ-Relevanz-Score (#134) `compute_relevance(matches)`: Score = max(antrag.gwoe_score × similarity). Level: high (≥4.0) / mid (≥2.5) / low (>0) / none. Pro News in der UI ein farbiger Pill (gruen/orange/grau) + Reason-Text: "GWÖ-9.0/10-Antrag „Klimaschutzgesetz" (GRÜNE) passt mit Similarity 0.55." Default-Filter "Nur GWÖ-relevant" aktiv (only_relevant=true) — zeigt nur high/mid News, blendet Rauschen aus. Toggle-Checkbox. `/api/aktuelle-themen/top` neuer Param `only_relevant=true\|false`. 2. PM-Versionierung im Modal (#135) `list_drafts_for(drucksache, news_url)`: alle Versionen, neueste oben. Endpoint `/api/aktuelle-themen/drafts-versions`. Modal zeigt Dropdown wenn >1 Version, Switch ohne LLM-Call. Force-Regen bleibt als Button im "bestehender Entwurf"-Banner. 3. News-Cluster-View (#136) `aggregate_news_cluster(intra_threshold=0.55, min_cluster_size=2)`: Greedy-Embedding-Cluster + zentralster Antrags-Match per Centroid- Vektor. Zweiter Tab "Themen-Cluster": 5 News über "Pflege" → 1 Cluster mit gemeinsamem Antrag-Vorschlag, statt 5 separate Cards. Endpoint: `/api/aktuelle-themen/cluster`. 4. Mail-Direkt-Link + Clipboard (#137) Im PM-Modal zwei Buttons: - "📧 Per Mail versenden" (mailto: mit subject + body, ~1900 Char Limit) - "📋 In Zwischenablage kopieren" (navigator.clipboard.writeText) - Bei langem PM (>1900 Char): mailto-Link wird ausgegraut, Hinweis "PM zu lang für Mail-Link — Clipboard nutzen" 5. Antrags-Initiative (#138) `aggregate_top_antraege_with_news(min_gwoe_score=8.0, days=14)`: Reverse-Sicht — pro Antrag mit GWÖ ≥ 8 die News-Resonanz. Antraege ohne Match werden trotzdem angezeigt mit "keine News"-Pill. Dritter Tab "GWÖ-Top-Anträge". Endpoint `.../top-antraege`. UI-Restrukturierung: statt einer langen Scroll-Liste jetzt 5 Tabs mit gemeinsamer Filter-Bar: - News × Anträge (Default, kuratiert via Pre-Filter) - Themen-Cluster (Bündel ähnlicher News) - GWÖ-Top-Anträge (Reverse) - News-Volumen (Chart) - PM-Entwürfe (Drafts-Liste) Default min_similarity 0.40 → 0.50 erhoeht (weniger Rauschen). Tests: 14 neue (compute_relevance × 5, only_relevant + sort × 3, cluster × 3, top_antraege × 3). Suite 1067 gruen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-03 13:41:31 +02:00
Dotty Dotter	2bff943e8a	feat(#170 followup): PM-Generator Idempotenz + qwen-max + Wrapper-Verbesserungen User-Feedback nach Live-Test: 1. Idempotenz — Pressemitteilungen wurden ungespeichert generiert, doppelter Klick erzeugte doppelten Draft + LLM-Kosten. - Neuer Helper `_find_existing_draft(drucksache, news_url)` der den neuesten Draft fuer das Paar zurueckgibt - `generate_draft()` prueft per Default zuerst den Lookup, liefert existing zurueck mit `_was_existing=True` (kein LLM-Call) - `force=True` Parameter fuer bewusste Neu-Generierung - Endpoint nimmt `?force=true` Query-Param entgegen - UI: Modal zeigt klar "Bestehender Entwurf vs Neu generiert" Banner, mit "Neu generieren"-Button im existing-Banner 2. Premium-Modell statt Default — User wollte hoehere Sprachqualitaet ("Opus oder sowas"). Da das Projekt Qwen via DashScope nutzt (kein Anthropic), Wechsel auf `settings.llm_model_premium` (qwen-max). - Tradeoff: ~3× teurer (~6 Cent statt 2 Cent) und ~2× langsamer (~30 s statt 15 s) — aber spuerbare Qualitaetsverbesserung in Pressemitteilungs-Diktion - confirm-Dialog im Frontend nennt jetzt 6 Cent + 30 s 3. Wrapper-Verbesserungen — `auto-fetch-news.sh` aufgeraeumt: - Container-Check (skip wenn down) analog zu run-digest.sh - START/END-Timestamps - Ausfuehrliche cron-install-Doku im Header - Auto-Backfill: wenn erster Run >= 100 Embeddings (Limit gehit), wird embed_pending_articles bis zu 500 weitere nachgeholt Tests: 5 neue (idempotency, force, _find_existing_draft × 3). Suite 1053 gruen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-03 13:10:20 +02:00
Dotty Dotter	d54ce23e42	feat(#170 ): Aktuelle-Themen-Dashboard — News × Anträge × Pressemitteilungen Vollständiges 4-Phasen-Feature: Phase 1 — News-Aggregator (`app/news_aggregator.py`) - Tagesschau-API (`/api2u/news?ressort=...`) für inland/ausland/wirtschaft/wissen - Bundestag-RSS für aktuellethemen / pressemitteilungen / hib - DB-Tabelle `news_articles` (URL-PK, idempotent) - Embeddings via existierender qwen-v4-Pipeline - Cron-Script `scripts/auto-fetch-news.sh` - Bewusst NICHT: RND.de (robots.txt bannt explizit ClaudeBot, GPTBot, CCBot, ChatGPT-User, Google-Extended). Nur AI-erlaubende, öffentlich- rechtliche/parlamentarische Quellen - Volltexte werden NICHT persistiert (nur Titel + erster Satz) Phase 2 — Themen × Anträge Matching (`app/themen_matching.py`) - News-Embedding × Assessment-summary_embedding via Cosine-Similarity - `find_anträge_for_news`: pro News die Top-K passenden Anträge - `find_news_for_antrag`: pro Antrag Top-K News mit Datums-Fenster (90d) - `aggregate_top_themen`: primärer Dashboard-Endpoint - `aggregate_themen_zeitreihe`: News-Volumen pro Tag × Source Phase 3 — Dashboard-View (`/aktuelle-themen`) - Neuer linker Nav-Eintrag „Aktuelle Themen" - Stacked-Area-Chart News-Volumen pro Quelle (30d) - Pro News-Card: Titel + Summary + Tags + Top-3-Antrags-Match-Liste mit GWÖ-Score-Pill, Drucksache-Link, PM-Vorschlag-Button - Filter: Zeitfenster, Top-N, min_similarity - Auth-protected (require_auth) Phase 4 — Pressemitteilungs-Generator (`app/presse_generator.py`) - LLM-Prompt-Template (200-250 Worte, GWÖ-Sicht, JSON-Output) - Reuse von `QwenBewerter` aus app/adapters/qwen_bewerter.py - DB-Tabelle `presse_drafts` (Persistenz) - POST `/api/aktuelle-themen/generate-presse` rate-limited 5/min, auth-only (LLM-Kosten) - GET `/api/aktuelle-themen/drafts` + `/drafts/{id}` für Liste/Detail - Manueller Trigger via UI-Button, kein Auto-Versand - Modal-Anzeige des generierten Texts Compliance: - robots.txt-respektierend (ClaudeBot-Bann von RND vermieden, AI- erlaubende Quellen verwendet) - UI zeigt nur Titel+URL+Datum+erster Satz, keine Volltext-Reproduktion - Pressemitteilungen sind explizit Drafts, nicht Auto-Versand - LLM-Calls rate-limited, auth-only Tests: 43 neue Tests (19 news_aggregator + 16 themen_matching + 8 presse_generator). Suite jetzt 1048 grün. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-03 12:39:36 +02:00

13 Commits