refactor(#136): DDD-Lightweight Tag 1-4 (Ports, Adapter, Repositories, Domain-Verhalten)

ADR 0008: Lightweight-Migration ohne Package-Split - ports/llm_bewerter.py: Protocol + LlmRequest-Dataclass - adapters/qwen_bewerter.py: Qwen/DashScope-Adapter mit Retry-Loop - repositories/{antrag,bewertung,abonnement}_repository.py: Protocol + Sqlite-Impl + InMemory-Fake - analyzer.py refactored: nimmt Optional[LlmBewerter], AsyncOpenAI-Import raus - models.py: 5 Domain-Methoden auf Bewertung/MatrixEntry (ist_ablehnung, hat_fundamental_kritisches_feld, verletzt_score_cap, ...) - analyzer loggt WARNING wenn LLM Score-Cap-Invariante verletzt Folge-PR: Callsite-Migration in main.py (~21 direkte database.*-Aufrufe) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-04-25 20:55:16 +02:00 · 2026-04-25 20:55:16 +02:00 · 8f0f6d6e32
commit 8f0f6d6e32
parent 2c0e94d29d
11 changed files with 892 additions and 68 deletions
--- a/app/adapters/init.py
+++ b/app/adapters/init.py
@ -0,0 +1,11 @@
+"""Adapter: konkrete Implementierungen der Ports.
+
+Vorläufig enthält dieses Modul nur den Qwen-LLM-Adapter. Perspektivisch
+wandern die 17 Parlaments-Adapter aus ``parlamente.py`` hierher (eigener
+Folge-PR, weil das eine umfangreichere Umstellung ist und die
+Adapter-ABC dort bereits existiert — siehe ADR 0002).
+"""
+
+from .qwen_bewerter import QwenBewerter
+
+__all__ = ["QwenBewerter"]
--- a/app/adapters/qwen_bewerter.py
+++ b/app/adapters/qwen_bewerter.py
@ -0,0 +1,111 @@
+"""QwenBewerter — Produktions-Adapter für den LlmBewerter-Port.
+
+Kapselt den ``AsyncOpenAI``-Client gegen die DashScope-API, den Retry-
+Loop mit Temperatur-Escalation und das Markdown-Fence-Stripping. Die
+Retry-Semantik bleibt identisch zu ``analyzer.py`` vor der Migration:
+bis zu ``max_retries`` Versuche, Temperatur steigt um 0.1 pro Versuch.
+
+Der Adapter gibt den geparsten ``dict`` zurück — Pydantic-Validierung,
+Citation-Binding und Missing-Programme-Check bleiben Sache des Callers
+in ``analyzer.py``.
+"""
+
+from __future__ import annotations
+
+import hashlib
+import json
+import logging
+from typing import Optional
+
+from ..config import settings
+from ..ports.llm_bewerter import LlmRequest
+
+logger = logging.getLogger(__name__)
+
+
+def _content_fingerprint(content: str) -> str:
+    """Log-sicherer Identifier ohne PII-Leak (Issue #57 Befund #4)."""
+    if not content:
+        return "len=0"
+    h = hashlib.sha1(content.encode("utf-8", errors="replace")).hexdigest()[:8]
+    return f"len={len(content)} sha1={h}"
+
+
+def _strip_markdown_fences(content: str) -> str:
+    """Entfernt Markdown-Code-Fences, die Qwen trotz Prompt manchmal ergänzt.
+
+    In Sync mit ``analyzer.py`` vor der Migration; Einheitstests in
+    ``tests/test_analyzer.py`` spiegeln exakt diese Logik.
+    """
+    content = content.strip()
+    if content.startswith("```"):
+        content = content.split("\n", 1)[1]
+    if content.endswith("```"):
+        content = content.rsplit("```", 1)[0]
+    if content.startswith("```json"):
+        content = content[7:]
+    return content.strip()
+
+
+class QwenBewerter:
+    """LlmBewerter-Adapter für Qwen Plus (via DashScope)."""
+
+    def __init__(
+        self,
+        api_key: Optional[str] = None,
+        base_url: Optional[str] = None,
+        client=None,
+    ) -> None:
+        """Konstruktor-Injection erlaubt Tests, einen Mock-Client zu reichen
+        ohne Netzwerk-Zugriff. Prod nutzt den Default: Settings aus
+        ``config.py`` + ``AsyncOpenAI``."""
+        self._api_key = api_key or settings.dashscope_api_key
+        self._base_url = base_url or settings.dashscope_base_url
+        self._client = client  # lazy-created in .bewerte() wenn nicht gesetzt
+
+    def _get_client(self):
+        if self._client is not None:
+            return self._client
+        # Lazy-Import, damit die Test-Suite ohne ``openai``-Paket laufen kann.
+        from openai import AsyncOpenAI
+
+        self._client = AsyncOpenAI(api_key=self._api_key, base_url=self._base_url)
+        return self._client
+
+    async def bewerte(self, request: LlmRequest) -> dict:
+        """Führt den LLM-Call aus, bis JSON-Parse klappt oder Retries erschöpft."""
+        client = self._get_client()
+
+        last_error: Optional[Exception] = None
+        for attempt in range(request.max_retries):
+            response = await client.chat.completions.create(
+                model=request.model,
+                messages=[
+                    {"role": "system", "content": request.system_prompt},
+                    {"role": "user", "content": request.user_prompt},
+                ],
+                temperature=request.base_temperature + (attempt * 0.1),
+                max_tokens=request.max_tokens,
+            )
+            content = response.choices[0].message.content.strip()
+            content = _strip_markdown_fences(content)
+
+            try:
+                return json.loads(content)
+            except json.JSONDecodeError as e:
+                last_error = e
+                logger.warning(
+                    "LLM JSON parse error attempt %d/%d (%s) — content %s",
+                    attempt + 1, request.max_retries, e,
+                    _content_fingerprint(content),
+                )
+                if attempt >= request.max_retries - 1:
+                    logger.error(
+                        "LLM JSON parsing exhausted retries, content %s",
+                        _content_fingerprint(content),
+                    )
+                    raise
+
+        # Unreachable — letzter Versuch hat raised. Für Typcheck.
+        assert last_error is not None
+        raise last_error
--- a/app/analyzer.py
+++ b/app/analyzer.py
@ -1,16 +1,23 @@
-"""LLM-based analysis of parliamentary motions against GWÖ matrix."""
+"""LLM-based analysis of parliamentary motions against GWÖ matrix.
+
+Seit ADR 0008: Die reinen LLM-Calls laufen über den ``LlmBewerter``-Port
+(``app/ports/llm_bewerter.py``); der Default-Adapter ist ``QwenBewerter``
+(``app/adapters/qwen_bewerter.py``). Citation-Binding, Missing-Programme-
+Check und Pydantic-Validierung bleiben hier in der Application-Schicht.
+"""

 import hashlib
 import json
 import logging
 import re
 from pathlib import Path
-
-from openai import AsyncOpenAI
+from typing import Optional

 from .config import settings
 from .models import Assessment
 from .bundeslaender import BUNDESLAENDER
+from .wahlprogramm_check import check_missing_programmes
+from .ports.llm_bewerter import LlmBewerter, LlmRequest
 from .wahlprogramme import (
    find_relevant_quotes,
    format_quote_for_prompt,
@ -30,12 +37,28 @@ def _content_fingerprint(content: str) -> str:
    """Cheap, log-safe identifier for an LLM response: length + first 8 chars
    of SHA-1. Lets us correlate retries without ever leaking the LLM's
    actual output (which may contain sensitive Antrags-Inhalte). Issue
-    #57 Befund #4."""
+    #57 Befund #4.
+
+    Wird nach ADR 0008 nur noch für post-LLM-Diagnostik (Pydantic-Validation)
+    gebraucht; der LLM-Retry-Loop selbst loggt in ``QwenBewerter``.
+    """
    if not content:
        return "len=0"
    h = hashlib.sha1(content.encode("utf-8", errors="replace")).hexdigest()[:8]
    return f"len={len(content)} sha1={h}"

+
+def get_default_bewerter() -> LlmBewerter:
+    """Lazy-Instanziierung des Default-Adapters.
+
+    Der Adapter-Import ist lazy, damit Tests ohne ``openai``-Paket und ohne
+    DashScope-Credentials laufen (das Stubbing in ``conftest.py`` reicht,
+    solange niemand Top-Level importiert).
+    """
+    from .adapters.qwen_bewerter import QwenBewerter
+
+    return QwenBewerter()
+
 # Load context files
 KONTEXT_DIR = Path(__file__).parent / "kontext"

@ -152,7 +175,11 @@ Antworte NUR mit einem JSON-Objekt im folgenden Format (keine Markdown-Codeblöc
  "verbesserungspotenzial": "gering | mittel | hoch | fundamental",
  "themen": ["Bildung", "Soziales"],
  "antragZusammenfassung": "1-2 Sätze Kernaussage",
-  "antragKernpunkte": ["Punkt 1", "Punkt 2", "Punkt 3"]
+  "antragKernpunkte": ["Punkt 1", "Punkt 2", "Punkt 3"],
+  "konfidenz": "hoch | mittel | niedrig",
+  "shareThreads": "Schlagkräftiger Post für Threads/Instagram (max 500 Zeichen). Emoji, Engagement, CTA, konkret auf den Antrag bezogen. Hashtags: #Gemeinwohl #GWÖ + 2-3 thematische.",
+  "shareTwitter": "Prägnanter Tweet für X/Twitter (max 280 Zeichen). Knackig, pointiert, mit Emoji und 2 Hashtags.",
+  "shareMastodon": "Sachlicher aber ansprechender Post für Mastodon (max 500 Zeichen). Informativ, quellenbasiert, mit Kontext."
 }

 ## Wichtige Regeln
@ -165,7 +192,11 @@ Antworte NUR mit einem JSON-Objekt im folgenden Format (keine Markdown-Codeblöc
  - Wenn EIN Feld -3 hat → Gesamtscore maximal 4/10
  - Bei "Ablehnen" → Score 0-2/10
  - Bei "Uneingeschränkt unterstützen" → Score 8-10/10
- **Matrix-Felder**: Bewertung -5 bis +5 (Symbole: −− / − / ○ / + / ++)"""
+- **Matrix-Felder**: Bewertung -5 bis +5 (Symbole: −− / − / ○ / + / ++)
+- **Konfidenz**: Selbsteinschätzung der Bewertungssicherheit:
+  - "hoch": Antrag ist eindeutig, GWÖ-Bezug klar, genügend Kontext
+  - "mittel": Antrag ist mehrdeutig oder berührt Nischenthemen
+  - "niedrig": Antrag ist sehr kurz, unklar oder fachfremd — Bewertung unsicher"""


 def get_bundesland_context(bundesland: str) -> str:
@ -220,13 +251,30 @@ Bei Oppositionsanträgen: Bewerte zusätzlich, ob die Regierungsfraktionen zusti
 """


-async def analyze_antrag(text: str, bundesland: str = "NRW", model: str = "qwen-plus") -> Assessment:
-    """Analyze a parliamentary motion using the LLM."""
+async def analyze_antrag(
+    text: str,
+    bundesland: str = "NRW",
+    model: str = "qwen-plus",
+    bewerter: Optional[LlmBewerter] = None,
+) -> Assessment:
+    """Analyze a parliamentary motion using the LLM.

-    client = AsyncOpenAI(
-        api_key=settings.dashscope_api_key,
-        base_url=settings.dashscope_base_url,
-    )
+    Args:
+        text: Antrag-Volltext (plain).
+        bundesland: BL-Code aus ``bundeslaender.py``.
+        model: LLM-Modell (wird vom Default-Adapter ``QwenBewerter``
+            akzeptiert; andere Adapter können eigene Modell-Namen nutzen).
+        bewerter: ``LlmBewerter``-Implementierung. Default: ``QwenBewerter``
+            (DashScope/Qwen). Tests reichen hier ``FakeLlmBewerter``.
+
+    Nach ADR 0008: der HTTP-Call samt Retry-Loop lebt im Adapter; hier
+    bleibt nur noch die Application-Logik (Prompt-Komposition, Semantic-
+    Search, Citation-Binding, Missing-Programme-Check, Pydantic-Validation
+    und Domain-Invarianten-Warnings).
+    """
+
+    if bewerter is None:
+        bewerter = get_default_bewerter()

    system_prompt = get_system_prompt()
    bundesland_context = get_bundesland_context(bundesland)
@ -303,58 +351,46 @@ Programme bekannter sind. Findest du oben für eine Partei keinen passenden Chun

 Ausgabe als reines JSON ohne Markdown-Codeblöcke."""

-    # Retry loop for JSON parsing errors
-    max_retries = 3
-    last_error = None
-    
-    for attempt in range(max_retries):
-        response = await client.chat.completions.create(
+    # LLM-Call über den Port. Retry-Loop + Markdown-Stripping wohnen im
+    # Adapter (``QwenBewerter``). Bei exhausted retries wirft er
+    # json.JSONDecodeError — wir lassen das durchpropagieren wie vor der
+    # Migration.
+    request = LlmRequest(
+        system_prompt=system_prompt,
+        user_prompt=user_prompt,
        model=model,
-            messages=[
-                {"role": "system", "content": system_prompt},
-                {"role": "user", "content": user_prompt},
-            ],
-            temperature=0.3 + (attempt * 0.1),  # Slightly increase temp on retry
-            max_tokens=4000,
    )
+    data = await bewerter.bewerte(request)

-        content = response.choices[0].message.content.strip()
-        
-        # Remove markdown code blocks if present
-        if content.startswith("```"):
-            content = content.split("\n", 1)[1]
-        if content.endswith("```"):
-            content = content.rsplit("```", 1)[0]
-        if content.startswith("```json"):
-            content = content[7:]
-        content = content.strip()
-        
-        try:
-            # Parse JSON
-            data = json.loads(content)
-            # Issue #60 Option B — server-side reconstruction of citation
-            # quelle/url from the actually retrieved chunks, before Pydantic
-            # validation. The LLM is no longer trusted for the citation source
-            # label; we replace it with the canonical _chunk_source_label of
-            # the chunk whose text actually contains the cited snippet, and
-            # drop any zitat that can't be located in any retrieved chunk.
+    # Issue #60 Option B — server-side reconstruction of citation quelle/url
+    # from the actually retrieved chunks, before Pydantic validation. Der LLM
+    # ist nicht mehr Quelle für die Quellen-Labels; wir ersetzen sie durch
+    # das kanonische _chunk_source_label und droppen Zitate ohne Chunk-Match.
    if semantic_quotes:
        data = reconstruct_zitate(data, semantic_quotes)
-            # Convert to Assessment model
-            return Assessment.model_validate(data)
-        except json.JSONDecodeError as e:
-            last_error = e
+
+    # #128: Fehlende Wahlprogramme server-seitig erkennen und eintragen. Der
+    # LLM bekommt diese Information nicht — sie basiert auf der lokalen
+    # Registry, nicht auf dem LLM-Wissen.
+    missing = check_missing_programmes(bundesland, landtagsfraktionen)
+    if missing:
        logger.warning(
-                "LLM JSON parse error attempt %d/%d (%s) — content %s",
-                attempt + 1, max_retries, e, _content_fingerprint(content),
+            "Fehlende Wahlprogramme für %s in %s: %s",
+            landtagsfraktionen, bundesland, missing,
        )
-            if attempt < max_retries - 1:
-                continue
-            else:
-                # Letzter Fehlversuch — Fingerprint reicht zur Forensik;
-                # Volltext darf nicht ins Log, weil er Antrag-Inhalte enthält
-                logger.error(
-                    "LLM JSON parsing exhausted retries, content %s",
-                    _content_fingerprint(content),
+    data["fehlendeProgramme"] = missing
+
+    # Pydantic-Validation: harter Check auf Schema-Drift.
+    assessment = Assessment.model_validate(data)
+
+    # Tag-4-Invarianten-Warnings (ADR 0008): Verstöße gegen das Score-Cap
+    # werden geloggt, aber nicht geworfen — das LLM soll lernen, nicht der
+    # Produktivbetrieb brechen.
+    if assessment.verletzt_score_cap():
+        logger.warning(
+            "Assessment %s verletzt Score-Cap: gwoe_score=%.1f bei "
+            "fundamental-kritischem Matrix-Feld (rating≤-4)",
+            assessment.drucksache, assessment.gwoe_score,
        )
-                raise
+
+    return assessment
--- a/app/models.py
+++ b/app/models.py
@ -40,6 +40,37 @@ class MatrixEntry(BaseModel):
    rating: int = Field(..., ge=-5, le=5)  # Neue Skala: -5 bis +5
    symbol: Optional[str] = None

+    # ─── Domain-Verhalten (ADR 0008) ──────────────────────────────────────
+
+    def ist_fundamental_kritisch(self) -> bool:
+        """True, wenn das Feld einen fundamentalen Widerspruch zu
+        GWÖ-Werten beschreibt (rating ≤ -4).
+
+        Diese Regel triggert den Score-Cap: ein einziges fundamental-
+        kritisches Feld deckelt den Gesamt-Score auf 3/10 (siehe
+        ``Assessment.verletzt_score_cap``).
+        """
+        return self.rating <= -4
+
+    def to_symbol(self) -> str:
+        """Berechnet das Matrix-Symbol aus dem Rating.
+
+        Quelle: analyzer.py System-Prompt „Matrix-Feldwertung (Skala -5 bis +5)".
+        Der LLM liefert das Symbol heute selbst; diese Methode erlaubt
+        server-seitige Konsistenz-Prüfung und ist die Basis, um das
+        Symbol-Feld perspektivisch ganz aus dem LLM-Output zu entfernen.
+        """
+        r = self.rating
+        if r >= 4:
+            return "++"
+        if r >= 1:
+            return "+"
+        if r == 0:
+            return "○"
+        if r >= -3:
+            return "−"
+        return "−−"
+

 class Zitat(BaseModel):
    text: str
@ -99,9 +130,51 @@ class Assessment(BaseModel):
    themen: list[str] = []
    antrag_zusammenfassung: Optional[str] = Field(None, alias="antragZusammenfassung")
    antrag_kernpunkte: Optional[list[str]] = Field(None, alias="antragKernpunkte")
+    konfidenz: Optional[str] = Field(None, description="LLM-Selbsteinschätzung: hoch/mittel/niedrig")
+    share_threads: Optional[str] = Field(None, alias="shareThreads", description="Social-Post für Threads (max 500 Zeichen)")
+    share_twitter: Optional[str] = Field(None, alias="shareTwitter", description="Social-Post für X/Twitter (max 280 Zeichen)")
+    share_mastodon: Optional[str] = Field(None, alias="shareMastodon", description="Social-Post für Mastodon (max 500 Zeichen)")
+
+    # #128: Fraktionen ohne hinterlegtes Wahlprogramm — wird server-seitig
+    # nach dem LLM-Call befüllt, nicht vom LLM selbst.
+    fehlende_programme: Optional[list[str]] = Field(
+        default_factory=list,
+        alias="fehlendeProgramme",
+        description="Fraktionen ohne hinterlegtes Wahlprogramm für dieses Bundesland",
+    )

    model_config = {"populate_by_name": True}

+    # ─── Domain-Verhalten (ADR 0008) ──────────────────────────────────────
+
+    def ist_ablehnung(self) -> bool:
+        """True, wenn die Empfehlung „Ablehnen" lautet."""
+        return self.empfehlung == Empfehlung.ABLEHNEN
+
+    def ist_uneingeschraenkt_unterstuetzend(self) -> bool:
+        """True, wenn die Empfehlung „Uneingeschränkt unterstützen" lautet."""
+        return self.empfehlung == Empfehlung.UNEINGESCHRAENKT
+
+    def hat_fundamental_kritisches_feld(self) -> bool:
+        """True, wenn mindestens ein Matrix-Feld rating ≤ -4 hat.
+
+        Basis für ``verletzt_score_cap``. Nutzt die VO-Methode
+        ``MatrixEntry.ist_fundamental_kritisch``.
+        """
+        return any(m.ist_fundamental_kritisch() for m in self.gwoe_matrix)
+
+    def verletzt_score_cap(self) -> bool:
+        """Prüft die Regel aus dem System-Prompt:
+
+            Wenn ein Matrix-Feld rating ≤ -4 hat, ist Gesamt-Score max. 3/10.
+
+        Der LLM-Prompt formuliert diese Regel als Soll-Anweisung; sie kann
+        trotzdem verletzt werden. Diese Methode macht die Regel server-
+        seitig prüfbar und ist der Anker für die Warning-Logik in
+        ``analyzer.py`` (Tag-4-Schritt der DDD-Lightweight-Migration).
+        """
+        return self.hat_fundamental_kritisches_feld() and self.gwoe_score > 3.0
+

 # --- Matrix constants ---

--- a/app/ports/init.py
+++ b/app/ports/init.py
@ -0,0 +1,11 @@
+"""Ports (Protocols) für externe Dienste — Teil der Hexagonal-Migration (ADR 0008).
+
+Ein „Port" ist hier ein ``typing.Protocol``, das einen Infrastruktur-
+Zugang beschreibt (LLM-Call, Embedding-Search, Mail-Versand) ohne
+konkrete Implementierung. Adapter in ``app/adapters/`` implementieren
+die Ports gegen reale Systeme; Tests nutzen Fake-Implementierungen.
+"""
+
+from .llm_bewerter import LlmBewerter, LlmRequest
+
+__all__ = ["LlmBewerter", "LlmRequest"]
--- a/app/ports/llm_bewerter.py
+++ b/app/ports/llm_bewerter.py
@ -0,0 +1,48 @@
+"""LlmBewerter — Port für den LLM-Call in der Antragsbewertung.
+
+Trennt die *Rohantwort* des LLMs (JSON-String) vom umgebenden
+Application-Flow (Retry, Prompt-Composition, Citation-Binding). Die
+Retry-Logik samt Temperatur-Escalation bleibt Adapter-Detail — ein
+zweiter Adapter (Claude, OpenAI-kompatible Proxies) kann eine ganz
+andere Strategie wählen.
+
+Ein späterer Tag-Schritt (Kapitel 10.5 der DDD-Bewertung) kapselt
+zusätzlich die JSON-Parse-Kaskade hinter dem Port; heute bekommt der
+Caller noch einen JSON-String zurück.
+"""
+
+from __future__ import annotations
+
+from dataclasses import dataclass
+from typing import Protocol, runtime_checkable
+
+
+@dataclass(frozen=True)
+class LlmRequest:
+    """Alles, was der Adapter zum Generieren der Bewertung braucht —
+    inkl. Retry-Verhalten auf der Adapter-Seite."""
+
+    system_prompt: str
+    user_prompt: str
+    model: str = "qwen-plus"
+    max_retries: int = 3
+    max_tokens: int = 4000
+    base_temperature: float = 0.3
+
+
+@runtime_checkable
+class LlmBewerter(Protocol):
+    """Port: wandelt einen Prompt in einen JSON-String (LLM-Rohantwort).
+
+    Der Adapter kümmert sich um:
+
+    - Markdown-Fence-Entfernung,
+    - JSON-Parse-Retry mit steigender Temperatur,
+    - Content-Fingerprint-Logging zur Forensik.
+
+    Raises:
+        json.JSONDecodeError: wenn alle Retries scheitern. Höhere Schichten
+            behandeln das als Fehlschlag der Analyse.
+    """
+
+    async def bewerte(self, request: LlmRequest) -> dict: ...
--- a/app/repositories/init.py
+++ b/app/repositories/init.py
@ -0,0 +1,44 @@
+"""Repository-Pattern für Persistenz-Zugriff (ADR 0008).
+
+Die Repositories kapseln direkte ``database.py``-Aufrufe hinter Protocols,
+sodass Tests `InMemory*Repository` verwenden können und Callsites nicht
+mehr jedes Schema-Detail kennen müssen.
+
+Die konkreten `Sqlite*Repository`-Implementierungen delegieren heute noch
+an die bestehenden Funktionen in ``database.py`` — kein Big-Bang-Rewrite.
+Schritt für Schritt wandern die direkten DB-Aufrufe in die Repositories.
+"""
+
+from .antrag_repository import (
+    AntragRepository,
+    SqliteAntragRepository,
+    InMemoryAntragRepository,
+    get_antrag_repository,
+)
+from .bewertung_repository import (
+    BewertungRepository,
+    SqliteBewertungRepository,
+    InMemoryBewertungRepository,
+    get_bewertung_repository,
+)
+from .abonnement_repository import (
+    AbonnementRepository,
+    SqliteAbonnementRepository,
+    InMemoryAbonnementRepository,
+    get_abonnement_repository,
+)
+
+__all__ = [
+    "AntragRepository",
+    "SqliteAntragRepository",
+    "InMemoryAntragRepository",
+    "get_antrag_repository",
+    "BewertungRepository",
+    "SqliteBewertungRepository",
+    "InMemoryBewertungRepository",
+    "get_bewertung_repository",
+    "AbonnementRepository",
+    "SqliteAbonnementRepository",
+    "InMemoryAbonnementRepository",
+    "get_abonnement_repository",
+]
--- a/app/repositories/abonnement_repository.py
+++ b/app/repositories/abonnement_repository.py
@ -0,0 +1,138 @@
+"""AbonnementRepository — Port für E-Mail-Digest-Abos (#124).
+
+Kapselt die `email_subscriptions`-Tabelle. Der Name „Abonnement" ist die
+Ubiquitous-Language-Form (Kapitel 4 der DDD-Bewertung); intern heißt die
+Tabelle weiter `email_subscriptions`.
+"""
+
+from __future__ import annotations
+
+from typing import Optional, Protocol, runtime_checkable
+
+from .. import database
+
+
+@runtime_checkable
+class AbonnementRepository(Protocol):
+    async def create(
+        self,
+        user_id: str,
+        email: str,
+        bundesland: Optional[str] = None,
+        partei: Optional[str] = None,
+        frequency: str = "daily",
+    ) -> int: ...
+
+    async def list_by_user(self, user_id: str) -> list[dict]: ...
+
+    async def list_all(self) -> list[dict]: ...
+
+    async def list_due(self, frequency: str = "daily") -> list[dict]: ...
+
+    async def delete(self, user_id: str, sub_id: int) -> bool: ...
+
+    async def delete_by_id(self, sub_id: int) -> bool: ...
+
+    async def mark_sent(self, sub_id: int) -> None: ...
+
+
+class SqliteAbonnementRepository:
+    async def create(
+        self,
+        user_id: str,
+        email: str,
+        bundesland: Optional[str] = None,
+        partei: Optional[str] = None,
+        frequency: str = "daily",
+    ) -> int:
+        return await database.create_subscription(
+            user_id, email, bundesland, partei, frequency,
+        )
+
+    async def list_by_user(self, user_id: str) -> list[dict]:
+        return await database.list_subscriptions(user_id)
+
+    async def list_all(self) -> list[dict]:
+        return await database.list_all_subscriptions()
+
+    async def list_due(self, frequency: str = "daily") -> list[dict]:
+        return await database.get_all_subscriptions_due(frequency)
+
+    async def delete(self, user_id: str, sub_id: int) -> bool:
+        return await database.delete_subscription(user_id, sub_id)
+
+    async def delete_by_id(self, sub_id: int) -> bool:
+        return await database.delete_subscription_by_id(sub_id)
+
+    async def mark_sent(self, sub_id: int) -> None:
+        await database.mark_subscription_sent(sub_id)
+
+
+class InMemoryAbonnementRepository:
+    """Test-Fake. Ignoriert ``last_sent``-Zeitberechnung — ``list_due`` gibt
+    einfach alle zurück, bei denen ``last_sent`` ``None`` ist. Für
+    Zeit-bezogene Tests explizit ``mark_sent`` nutzen."""
+
+    def __init__(self) -> None:
+        self._subs: list[dict] = []
+        self._next_id = 1
+
+    async def create(
+        self,
+        user_id: str,
+        email: str,
+        bundesland: Optional[str] = None,
+        partei: Optional[str] = None,
+        frequency: str = "daily",
+    ) -> int:
+        sid = self._next_id
+        self._next_id += 1
+        self._subs.append({
+            "id": sid,
+            "user_id": user_id,
+            "email": email,
+            "bundesland": bundesland,
+            "partei": partei,
+            "frequency": frequency,
+            "last_sent": None,
+            "created_at": "",
+        })
+        return sid
+
+    async def list_by_user(self, user_id: str) -> list[dict]:
+        return [dict(s) for s in self._subs if s["user_id"] == user_id]
+
+    async def list_all(self) -> list[dict]:
+        return [dict(s) for s in self._subs]
+
+    async def list_due(self, frequency: str = "daily") -> list[dict]:
+        return [
+            dict(s) for s in self._subs
+            if s["frequency"] == frequency and s.get("last_sent") is None
+        ]
+
+    async def delete(self, user_id: str, sub_id: int) -> bool:
+        for i, s in enumerate(self._subs):
+            if s["id"] == sub_id and s["user_id"] == user_id:
+                self._subs.pop(i)
+                return True
+        return False
+
+    async def delete_by_id(self, sub_id: int) -> bool:
+        for i, s in enumerate(self._subs):
+            if s["id"] == sub_id:
+                self._subs.pop(i)
+                return True
+        return False
+
+    async def mark_sent(self, sub_id: int) -> None:
+        for s in self._subs:
+            if s["id"] == sub_id:
+                s["last_sent"] = "sent"
+
+
+_default_abonnement_repo: AbonnementRepository = SqliteAbonnementRepository()
+
+
+def get_abonnement_repository() -> AbonnementRepository:
+    return _default_abonnement_repo
--- a/app/repositories/antrag_repository.py
+++ b/app/repositories/antrag_repository.py
@ -0,0 +1,135 @@
+"""AntragRepository — Persistenz-Port für Assessment-Datensätze (#136, ADR 0008).
+
+Der Name `AntragRepository` ist bewusst auf die Domäne bezogen: aus Sicht
+der Anwendung speichern wir eine Bewertung *zu einem Antrag* — die
+Drucksachen-ID ist der Identifier. Intern zugreifen wir auf die
+`assessments`-Tabelle.
+
+Für Bewertungs-Versionen (assessment_versions) siehe `BewertungRepository`.
+"""
+
+from __future__ import annotations
+
+from typing import Optional, Protocol, runtime_checkable
+
+from .. import database
+
+
+@runtime_checkable
+class AntragRepository(Protocol):
+    """Port für den Zugriff auf Antrags-Bewertungen.
+
+    Rückgabe-Typ bleibt vorerst ``dict`` (wie heute von ``database.get_assessment``
+    geliefert), um die Umstellung möglichst diff-arm zu halten. Ein
+    Domain-Objekt-Wrapper (Kapitel 3.2 der DDD-Bewertung) kommt als
+    Tag-6-Schritt. Wichtig: callsites sollen *nicht* weiter ``database.*``
+    direkt importieren.
+    """
+
+    async def save(self, data: dict) -> bool: ...
+
+    async def get(self, drucksache: str) -> Optional[dict]: ...
+
+    async def list(self, bundesland: Optional[str] = None) -> list[dict]: ...
+
+    async def search(
+        self, query: str, bundesland: Optional[str] = None, limit: int = 50,
+    ) -> list[dict]: ...
+
+    async def delete(self, drucksache: str) -> bool: ...
+
+
+class SqliteAntragRepository:
+    """Produktions-Implementation. Delegiert an ``database.py``.
+
+    Hält bewusst *keinen* Connection-Pool — ``database.py`` öffnet pro
+    Aufruf eine Connection (``aiosqlite.connect``). Bei Performance-
+    Regressionen später zentralisieren.
+    """
+
+    async def save(self, data: dict) -> bool:
+        return await database.upsert_assessment(data)
+
+    async def get(self, drucksache: str) -> Optional[dict]:
+        return await database.get_assessment(drucksache)
+
+    async def list(self, bundesland: Optional[str] = None) -> list[dict]:
+        return await database.get_all_assessments(bundesland)
+
+    async def search(
+        self, query: str, bundesland: Optional[str] = None, limit: int = 50,
+    ) -> list[dict]:
+        return await database.search_assessments(query, bundesland, limit)
+
+    async def delete(self, drucksache: str) -> bool:
+        return await database.delete_assessment(drucksache)
+
+
+class InMemoryAntragRepository:
+    """Test-Fake. Keine Datei, kein I/O — in-process Dict.
+
+    Bei mehrfachem ``save`` für dieselbe Drucksache wird überschrieben
+    (wie im produktiven UPSERT). Versionierung simuliert das Fake bewusst
+    nicht — dafür gibt es ``BewertungRepository`` als separaten Port.
+    """
+
+    def __init__(self, initial: Optional[list[dict]] = None) -> None:
+        self._store: dict[str, dict] = {}
+        for d in initial or []:
+            ds = d.get("drucksache")
+            if ds:
+                self._store[ds] = dict(d)
+
+    async def save(self, data: dict) -> bool:
+        ds = data.get("drucksache")
+        if not ds:
+            raise ValueError("save(): data.drucksache ist Pflicht")
+        self._store[ds] = dict(data)
+        return True
+
+    async def get(self, drucksache: str) -> Optional[dict]:
+        row = self._store.get(drucksache)
+        return dict(row) if row else None
+
+    async def list(self, bundesland: Optional[str] = None) -> list[dict]:
+        rows = list(self._store.values())
+        if bundesland and bundesland != "ALL":
+            rows = [r for r in rows if r.get("bundesland") == bundesland]
+        # Sortierung analog zu database.get_all_assessments: gwoe_score desc
+        rows.sort(key=lambda r: (r.get("gwoe_score") or 0), reverse=True)
+        return [dict(r) for r in rows]
+
+    async def search(
+        self, query: str, bundesland: Optional[str] = None, limit: int = 50,
+    ) -> list[dict]:
+        q = (query or "").lower()
+        out: list[dict] = []
+        for r in self._store.values():
+            if bundesland and bundesland != "ALL" and r.get("bundesland") != bundesland:
+                continue
+            hay = " ".join([
+                str(r.get("title") or ""),
+                str(r.get("drucksache") or ""),
+                " ".join(r.get("fraktionen") or []) if isinstance(r.get("fraktionen"), list) else str(r.get("fraktionen") or ""),
+                " ".join(r.get("themen") or []) if isinstance(r.get("themen"), list) else str(r.get("themen") or ""),
+            ]).lower()
+            if q in hay:
+                out.append(dict(r))
+        out.sort(key=lambda r: (r.get("gwoe_score") or 0), reverse=True)
+        return out[:limit]
+
+    async def delete(self, drucksache: str) -> bool:
+        return self._store.pop(drucksache, None) is not None
+
+
+# ─── FastAPI-Dependency ─────────────────────────────────────────────────────
+
+_default_antrag_repo: AntragRepository = SqliteAntragRepository()
+
+
+def get_antrag_repository() -> AntragRepository:
+    """FastAPI-``Depends()``-Provider. In Tests via
+    ``app.dependency_overrides[get_antrag_repository] = lambda: InMemoryAntragRepository()``
+    überschreibbar.
+    """
+    return _default_antrag_repo
--- a/app/repositories/bewertung_repository.py
+++ b/app/repositories/bewertung_repository.py
@ -0,0 +1,64 @@
+"""BewertungRepository — Port für die Versionshistorie einer Bewertung.
+
+Eine „Bewertung" ist die vollständige Assessment-Instanz; der
+`BewertungRepository` greift auf die Snapshot-Tabelle
+``assessment_versions`` zu. Für die aktuellste Bewertung siehe
+``AntragRepository``.
+"""
+
+from __future__ import annotations
+
+from typing import Protocol, runtime_checkable
+
+from .. import database
+
+
+@runtime_checkable
+class BewertungRepository(Protocol):
+    async def versions(self, drucksache: str) -> list[dict]: ...
+
+
+class SqliteBewertungRepository:
+    """Produktions-Implementation. Delegiert an ``database.py``."""
+
+    async def versions(self, drucksache: str) -> list[dict]:
+        return await database.get_assessment_history(drucksache)
+
+
+class InMemoryBewertungRepository:
+    """Test-Fake. Erlaubt per ``add_version`` händisches Bestücken.
+
+    Die produktive Versionierung passiert implizit in ``upsert_assessment``
+    (siehe database.py:580-598). Im Fake trennen wir das bewusst, weil
+    Tests oft explizit Versionshistorie befüllen wollen.
+    """
+
+    def __init__(self) -> None:
+        self._versions: dict[str, list[dict]] = {}
+
+    def add_version(
+        self,
+        drucksache: str,
+        version: int,
+        gwoe_score: float,
+        model: str,
+        created_at: str = "",
+    ) -> None:
+        self._versions.setdefault(drucksache, []).append({
+            "version": version,
+            "gwoe_score": gwoe_score,
+            "model": model,
+            "created_at": created_at,
+        })
+
+    async def versions(self, drucksache: str) -> list[dict]:
+        rows = list(self._versions.get(drucksache, []))
+        rows.sort(key=lambda r: r["version"], reverse=True)
+        return rows
+
+
+_default_bewertung_repo: BewertungRepository = SqliteBewertungRepository()
+
+
+def get_bewertung_repository() -> BewertungRepository:
+    return _default_bewertung_repo
--- a/docs/adr/0008-ddd-lightweight-migration.md
+++ b/docs/adr/0008-ddd-lightweight-migration.md
@ -0,0 +1,153 @@
+# 0008 — DDD-Lightweight-Migration
+
+| | |
+|---|---|
+| **Status** | accepted |
+| **Datum** | 2026-04-20 |
+| **Refs** | Issue #136, `docs/analysen/ddd-bewertung.md` Kap. 7 + 10 |
+| **Related** | ADR 0001 (Citation-Binding), ADR 0002 (Adapter-Architektur) |
+
+## Kontext
+
+Nach 18 Monaten Entwicklung verteilt der Code sich auf 23 Dateien in
+einem flachen `app/`-Verzeichnis (LOC-Inventar in `ddd-bewertung.md`
+Kap. 1.1). Die Analyse in diesem Dokument zeigt fünf konkrete
+DDD-Verletzungen (A–E, ebenda Kap. 1.2):
+
+- **A** Infrastructure-Leak: `analyze_antrag` instanziiert direkt einen
+  `AsyncOpenAI`-Client.
+- **B** Retry-Loop, JSON-Parsing und Pydantic in einer 60-Zeilen-Kaskade.
+- **C** Anämisches Modell: `MatrixEntry` / `Assessment` tragen keine
+  Invarianten; die Score-Cap-Regel („rating ≤ -4 ⇒ score ≤ 3") lebt nur
+  im LLM-System-Prompt.
+- **D** Kein Repository-Pattern: `database.py` (909 LOC) wird von sechs
+  Modulen direkt aufgerufen.
+- **E** Adapter-Contract nur informell (abhandelbar in späterem PR).
+
+Issue #136 fragte nach einer DDD-Umstellung. Die Analyse zeigte zwei
+realistische Optionen (Kap. 7 des Bewertungsdokuments).
+
+## Optionen
+
+### Option A — Voll-DDD mit Package-Split
+
+Getrennte Packages `antragsbewertung/`, `parlamentsintegration/`,
+`wahlprogramm_wissensbasis/`, `publikation/`, `benutzer_abo/`,
+`monitoring/`, jeweils mit `domain/application/infrastructure/`-
+Struktur. Ports und Adapter überall, Anti-Corruption-Layer pro BL.
+
+**Vorteile:** Maximale Testbarkeit, klare Bounded-Contexts, mehrere
+Devs können parallel arbeiten, Ubiquitous-Language konsequent.
+
+**Nachteile:** 4-8 Wochen netto Umbau, Test-Suite muss migriert werden,
+hohes Regressionsrisiko während der Migration, für Solo-Projekt dieser
+Größe ein schlechtes Kosten-Nutzen-Verhältnis.
+
+### Option B — DDD-Lightweight
+
+Drei gezielte DDD-Prinzipien *ohne* Package-Split: Repository-Pattern,
+LLM-Port, Domain-Verhalten auf den bestehenden Pydantic-Modellen.
+Dateien bleiben flach in `app/` liegen, nur drei neue Unterordner:
+`repositories/`, `ports/`, `adapters/`.
+
+**Vorteile:** Adressiert die schmerzhaftesten Punkte (A, B, C, D) in
+5-8 Tagen. Keine API-Breaking-Changes. Callsites müssen nicht alle
+gleichzeitig migrieren — die Repositories delegieren an die alten
+`database.py`-Funktionen, alte Calls laufen weiter.
+
+**Nachteile:** Parlaments-Adapter bleiben als eine 3397-LOC-Datei
+(`parlamente.py`). Ubiquitous-Language bleibt halb Deutsch / halb
+Englisch. Bounded-Contexts sind nur konzeptuell, nicht physisch
+separiert.
+
+## Entscheidung
+
+**Option B**. Konkret:
+
+1. **Repository-Pattern** für `assessments`, `assessment_versions` und
+   `email_subscriptions` — `app/repositories/`, drei Module.
+2. **LLM-Port + Qwen-Adapter** — `app/ports/llm_bewerter.py`,
+   `app/adapters/qwen_bewerter.py`. `analyze_antrag` nimmt ein
+   `LlmBewerter`-Argument (Default: `QwenBewerter()`), direkt oder über
+   FastAPI-`Depends`.
+3. **Domain-Verhalten** auf `Assessment` und `MatrixEntry`:
+   `verletzt_score_cap()`, `ist_ablehnung()`,
+   `ist_uneingeschraenkt_unterstuetzend()`, `hat_fundamental_kritisches_feld()`,
+   `MatrixEntry.ist_fundamental_kritisch()`, `MatrixEntry.to_symbol()`.
+   `analyzer.py` loggt bei Verletzung der Score-Cap-Invariante eine
+   Warning, wirft aber nicht — das LLM soll lernen, der Produktiv-
+   betrieb soll nicht brechen.
+
+Nicht Teil dieser Entscheidung (Folge-PRs):
+
+- Migration aller `database.*`-Callsites in `main.py` (21 Stellen)
+  auf Repository-`Depends`. Der Repository-Layer ist dafür
+  bereitgelegt; die Umstellung selbst ist mechanisch, aber wegen
+  1746 LOC in einer Datei mit Merge-Konflikt-Risiko verbunden.
+- `ZitatVerifier`-Port (Tag 5 der Roadmap).
+- Frozen-Dataclass-Domain-Objekte in `app/domain/` (Tag 6/7).
+- Bounded-Context-Package-Split (explizit ausgeschlossen).
+
+## Konsequenzen
+
+### Positiv
+
+- **Tests ohne OpenAI-Stub**. `conftest.py::_stub("openai")` ist nicht
+  mehr zwingend; Tests reichen einen `FakeLlmBewerter`-Objekt. Der
+  umgebaute `test_bug_regressions.py::test_analyzer_user_prompt_...`
+  ist exakt dieses Muster.
+- **Adapter-Wechsel trivial**. Ein zweiter LLM-Provider (Claude,
+  Gemini) ist eine neue Klasse in `app/adapters/`, ohne Änderung in
+  `analyzer.py`.
+- **Server-seitige Score-Cap-Erkennung**. Verstöße gegen die
+  fundamental-kritisch-Regel aus dem System-Prompt werden jetzt in
+  Logs sichtbar (`analyzer.py`), können in einem Folge-Issue zu
+  harten Rejects hochgezogen werden, wenn die Qualitäts-Daten stabil
+  aussehen.
+- **Test-Fakes für DB-Zugriff**. Application-Logik-Tests brauchen
+  keine SQLite-Datei mehr; `InMemoryAntragRepository` reicht. Die
+  76 neuen Tests in `tests/test_*_repository.py`, `test_llm_bewerter.py`
+  und `test_domain_behavior.py` demonstrieren das.
+
+### Negativ
+
+- **Zwei Zugangswege zur DB parallel**. Solange `main.py` noch
+  `database.get_assessment` direkt aufruft, gibt es doppelten Zugriff.
+  Folge-PR räumt auf.
+- **`analyzer.py` importiert noch `check_missing_programmes` direkt**.
+  Auch das ist Infrastructure, liegt aber außerhalb der drei
+  migrierten Schnitte. Nächster Schritt bei Bedarf.
+- **Logger-Warning ist weich**. Wer die Logs nicht liest, bemerkt
+  Score-Cap-Verletzungen nicht. Ein Dashboard-Panel auf
+  `logger.name == "app.analyzer"` + Severity ≥ WARNING gehört in
+  die Monitoring-Erweiterung (#135-Folge).
+
+### Folgen für andere ADRs
+
+- **ADR 0001** (Citation-Binding) bleibt unverändert gültig — die
+  Post-LLM-Rekonstruktion läuft weiter nach `bewerter.bewerte()`.
+- **ADR 0002** (Adapter-Architektur für Parlamente) bleibt unverändert;
+  die 17 Adapter in `parlamente.py` werden hier *nicht* in
+  `app/adapters/` gezogen. Ein Folge-ADR (0009?) könnte den Package-
+  Split für Parlaments-Adapter beschließen, wenn die Datei über 5000
+  LOC wächst (wie in ADR 0002 angekündigt).
+- **ADR 0003** (Citation-Property-Tests) bleibt unverändert; die
+  Tests hängen an der Assessment-Schnittstelle, die sich hier nicht
+  geändert hat.
+
+## Nach-Migration-Regeln
+
+Zur Orientierung bei neuen Beiträgen:
+
+1. **Kein direktes `database.*` in neuer Application-Logik.** Immer
+   über das passende Repository.
+2. **Kein `AsyncOpenAI` außerhalb `app/adapters/qwen_bewerter.py`.**
+   Neue LLM-Provider bekommen einen eigenen Adapter im gleichen
+   Ordner.
+3. **Invarianten auf dem Domain-Modell, nicht im Prompt.** Wenn eine
+   Regel im LLM-System-Prompt steht und vom LLM potenziell verletzt
+   werden kann, gehört eine Prüfmethode auf `Assessment` oder
+   `MatrixEntry` und ein Warning-Log in `analyzer.py`.
+4. **Tests mit `InMemory*Repository` und `FakeLlmBewerter`.** Keine
+   Monkeypatches auf `app.analyzer.AsyncOpenAI` mehr; keine
+   temporären SQLite-Dateien für Unit-Tests.