• Joined on 2026-03-28
tobias commented on issue tobias/gwoe-antragspruefer#127 2026-04-12 12:00:10 +02:00
Suche auf Anträge einschränken: Typ-Erkennung + Filter pro Adapter

Adapter Typ-Recherche — Ergebnis

Übersicht

tobias opened issue tobias/gwoe-antragspruefer#127 2026-04-12 11:57:30 +02:00
Suche auf Anträge einschränken: Typ-Erkennung + Filter pro Adapter
tobias opened issue tobias/gwoe-antragspruefer#126 2026-04-12 11:07:05 +02:00
Beschlussprotokoll-Parser: BL-übergreifende Abstimmungsergebnis-Extraktion
tobias commented on issue tobias/gwoe-antragspruefer#106 2026-04-12 01:46:51 +02:00
Abstimmungsverhalten verknuepfen (wenn Daten verfuegbar)

Parser v7 Iteration 2 — Alle 3 Test-Protokolle effektiv 100%

tobias commented on issue tobias/gwoe-antragspruefer#106 2026-04-12 01:24:49 +02:00
Abstimmungsverhalten verknuepfen (wenn Daten verfuegbar)

Parser v7 — MMP18-115 100% effektiv

Weitere Iterationen nach v6:

Änderungen gegenüber v6

  1. Kenntnisnahme-Anchor: `Damit haben wir (die )?(Vorlagen?
tobias commented on issue tobias/gwoe-antragspruefer#106 2026-04-12 01:19:36 +02:00
Abstimmungsverhalten verknuepfen (wenn Daten verfuegbar)

Parser v6 nach 15 Iterationen — großer Sprung im Recall

Zusammenfassung

tobias commented on issue tobias/gwoe-antragspruefer#106 2026-04-12 00:58:40 +02:00
Abstimmungsverhalten verknuepfen (wenn Daten verfuegbar)

Status Parser-Work 2026-04-12 ~01:15 CEST — Loop beendet

Parser v5 Status (committed):

  • 19/19 auf Training-Protokoll MMP18-119 ✓
  • ~30% Recall auf MMP18-115, 18-110, 18-100 (100%…
tobias commented on issue tobias/gwoe-antragspruefer#106 2026-04-12 00:33:26 +02:00
Abstimmungsverhalten verknuepfen (wenn Daten verfuegbar)

Generalisierungs-Check auf 3 weitere Protokolle

Parser v5 (trainiert auf MMP18-119) wurde gegen MMP18-115, 110, 100 getestet. Ergebnis:

tobias commented on issue tobias/gwoe-antragspruefer#106 2026-04-12 00:30:23 +02:00
Abstimmungsverhalten verknuepfen (wenn Daten verfuegbar)

Parser v5 — 19/19

Deterministischer Parser auf MMP18-119 komplett fertig.

Architektur

  1. Text-Normalisierung: Worttrennungen auflösen (Überweisungs-\nempfehlung →…
tobias commented on issue tobias/gwoe-antragspruefer#106 2026-04-11 23:10:23 +02:00
Abstimmungsverhalten verknuepfen (wenn Daten verfuegbar)

Research-Session Phase 1 abgeschlossen 2026-04-11 ~23:30 CEST

Erkenntnisse

NRW-Plenarprotokolle sind deterministisch parsbar — KEIN LLM nötig.

URL-Pattern:

https://www.land…
tobias commented on issue tobias/gwoe-antragspruefer#106 2026-04-11 23:05:05 +02:00
Abstimmungsverhalten verknuepfen (wenn Daten verfuegbar)

Research-Session gestartet 2026-04-11 ~23:00 CEST

Plan-Phasen:

Phase 1 — POC NRW (heute Nacht):

  1. Ein NRW-Plenarprotokoll PDF aus laufender WP laden (https://www.landtag.nrw.de/) 2.…
tobias closed issue tobias/gwoe-antragspruefer#105 2026-04-11 22:47:58 +02:00
Antrag-Clustering: Netzwerk-Graph aehnlicher Antraege (Embedding-Naehe)
tobias commented on issue tobias/gwoe-antragspruefer#108 2026-04-11 22:47:58 +02:00
Antrag-Empfehlungen basierend auf Merkliste

Teil B Live 2026-04-11

API: GET /api/assessment/similar?drucksache=...&top_k=5

  • Cosine-Distance über assessments.summary_embedding (v4)
  • Pure Python, kein sklearn
  • Gibt top_k…
tobias commented on issue tobias/gwoe-antragspruefer#105 2026-04-11 22:47:58 +02:00
Antrag-Clustering: Netzwerk-Graph aehnlicher Antraege (Embedding-Naehe)

Live 2026-04-11

Clustering-Modul app/clustering.py:

  • Pure Python (kein sklearn/numpy Dep)
  • Union-Find über Cosine-Similarity-Kanten
  • Hierarchisches Clustering: Haupt-Threshold…
tobias closed issue tobias/gwoe-antragspruefer#108 2026-04-11 22:47:58 +02:00
Antrag-Empfehlungen basierend auf Merkliste
tobias commented on issue tobias/gwoe-antragspruefer#123 2026-04-11 22:42:07 +02:00
Embedding-Modell: Migration text-embedding-v3 → v4 (einheitlicher Vektorraum)

#123 abgeschlossen

Reindex komplett (2026-04-11 20:40 UTC):

  • 66 Wahlprogramme neu indexiert mit text-embedding-v4, 9231 Chunks hinzugefügt (bereits indexierte 19 Programme vom ersten…
tobias closed issue tobias/gwoe-antragspruefer#123 2026-04-11 22:42:07 +02:00
Embedding-Modell: Migration text-embedding-v3 → v4 (einheitlicher Vektorraum)
tobias reopened issue tobias/gwoe-antragspruefer#106 2026-04-11 21:49:36 +02:00
Abstimmungsverhalten verknuepfen (wenn Daten verfuegbar)
tobias commented on issue tobias/gwoe-antragspruefer#106 2026-04-11 21:49:36 +02:00
Abstimmungsverhalten verknuepfen (wenn Daten verfuegbar)

Wieder geöffnet (dotty 2026-04-11: "Doch nicht schließen. Schedulen.").

Status: scheduled — Experimental-Session später

Kein aktiver Blocker, aber auch nicht aktuell in Bearbeitung.…

tobias commented on issue tobias/gwoe-antragspruefer#124 2026-04-11 21:36:58 +02:00
E-Mail-Benachrichtigung für neue Anträge (BL/Partei-Filter)

Stand 2026-04-11 Abend — Fundament deployed, wartet auf SMTP-Credentials

Deployed:

  • email_subscriptions Tabelle (DB-Migration automatisch beim Start)
  • app/mail.py —…