fix(#170): JSON-Parse-Fehler im PM-Generator (unescaped Newlines)

Beobachtung beim Force-Regen: alle 2 Retries scheiterten mit "Invalid control character at: line 3 column 275". qwen-max produziert JSON mit rohen \n statt \\n im body-String, was json.loads sprengt. Zwei Fixes parallel: **1. response_format={"type": "json_object"}** als optionaler Mode im LlmRequest. PM-Generator setzt das jetzt. DashScope unterstuetzt das fuer qwen-max + qwen-plus und zwingt valide JSON-Strings. **2. Newline-Recovery als Fallback** im QwenBewerter: `_recover_unescaped_newlines` iteriert char-weise mit String-Tracking, ersetzt unescaped \n/\r/\t in Strings durch \\n/\\r/\\t. Backslash- Folgen bleiben unangetastet. Wird vor dem Retry-Re-throw versucht. Bewertungs-Pfad (analyzer.py) bekommt json_object_mode=False als Default, um die bewaehrte Retry-Semantik nicht zu aendern. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-06 01:53:29 +02:00 · 2026-05-06 01:53:29 +02:00 · a0559333e8
commit a0559333e8
parent 6e78e92ddf
3 changed files with 66 additions and 0 deletions
--- a/app/adapters/qwen_bewerter.py
+++ b/app/adapters/qwen_bewerter.py
@ -31,6 +31,44 @@ def _content_fingerprint(content: str) -> str:
    return f"len={len(content)} sha1={h}"
 def _recover_unescaped_newlines(content: str) -> str:
    """Versucht JSON-Strings mit unescaped Newlines zu reparieren.
    Iteriert character-weise, behaelt einen "im String"-Status (per
    Anfuehrungszeichen), und ersetzt rohe \\n / \\r / \\t innerhalb von
    Strings durch ihre escapeten Aequivalente. Lassen Backslash-Folgen
    unangetastet (kein doppel-Escapen).
    Konservativ: bei Backslash-Status (kommt nach \\) wird nicht
    ersetzt, dadurch bleiben bereits-escapete Sequenzen erhalten.
    """
    out = []
    in_string = False
    escape_next = False
    for ch in content:
        if escape_next:
            out.append(ch)
            escape_next = False
            continue
        if ch == "\\":
            out.append(ch)
            escape_next = True
            continue
        if ch == '"':
            in_string = not in_string
            out.append(ch)
            continue
        if in_string:
            if ch == "\n":
                out.append("\\n"); continue
            if ch == "\r":
                out.append("\\r"); continue
            if ch == "\t":
                out.append("\\t"); continue
        out.append(ch)
    return "".join(out)
 def _strip_markdown_fences(content: str) -> str:
    """Entfernt Markdown-Code-Fences, die Qwen trotz Prompt manchmal ergänzt.
@ -78,6 +116,12 @@ class QwenBewerter:
        last_error: Optional[Exception] = None
        for attempt in range(request.max_retries):
            extra_kwargs = {}
            if request.json_object_mode:
                # DashScope (OpenAI-kompatibel) unterstuetzt
                # response_format={"type":"json_object"} fuer qwen-max + plus —
                # zwingt den LLM zu valid JSON ohne unescaped Newlines.
                extra_kwargs["response_format"] = {"type": "json_object"}
            response = await client.chat.completions.create(
                model=request.model,
                messages=[
@ -86,6 +130,7 @@ class QwenBewerter:
                ],
                temperature=request.base_temperature + (attempt * 0.1),
                max_tokens=request.max_tokens,
                **extra_kwargs,
            )
            content = response.choices[0].message.content.strip()
            content = _strip_markdown_fences(content)
@ -93,6 +138,20 @@ class QwenBewerter:
            try:
                return json.loads(content)
            except json.JSONDecodeError as e:
                # Recovery-Versuch: unescaped Newlines in String-Werten.
                # Beobachtetes Muster: LLM produziert `"body": "Zeile1\nZeile2"`
                # mit echten Newline-Bytes statt \n-Sequenzen.
                recovered = _recover_unescaped_newlines(content)
                if recovered != content:
                    try:
                        result = json.loads(recovered)
                        logger.info(
                            "LLM JSON recovered via newline-escape (attempt %d)",
                            attempt + 1,
                        )
                        return result
                    except json.JSONDecodeError:
                        pass
                last_error = e
                logger.warning(
                    "LLM JSON parse error attempt %d/%d (%s) — content %s",
--- a/app/ports/llm_bewerter.py
+++ b/app/ports/llm_bewerter.py
@ -28,6 +28,12 @@ class LlmRequest:
    max_retries: int = 3
    max_tokens: int = 4000
    base_temperature: float = 0.3
    # Wenn True, wird der DashScope-API ``response_format={"type":"json_object"}``
    # gesendet. Verhindert unescaped-Newlines-Bugs im LLM-Output. Bisher
    # nur fuer den Pressemitteilungs-Generator (#170 Phase 4) benutzt;
    # der Bewertungs-Pfad in analyzer.py laesst das auf False um die
    # bewaehrte Retry-Semantik nicht zu aendern.
    json_object_mode: bool = False
@runtime_checkable
--- a/app/presse_generator.py
+++ b/app/presse_generator.py
@ -308,6 +308,7 @@ async def generate_draft(
        base_temperature=0.3,
        max_tokens=1500,
        max_retries=2,
        json_object_mode=True,
    )
    result = await bewerter.bewerte(req)