gwoe-antragspruefer

History

Dotty Dotter 27ae82a758 #23 BayernAdapter — TYPO3-Solr HTML scraping (Anträge in WP19) Stub durch echten Adapter ersetzt. Recon + Implementierung in einem Wurf, weil das Backend deutlich freundlicher ist als bei SL/NI: - Server-side rendered HTML, keine SPA, keine Auth, keine Cookies - TYPO3 mit ext-solr unter /parlament/dokumente/drucksachen - Filter direkt als URL-Query-Params (q, dokumentenart, wahlperiodeid[], sort, anzahl_treffer, page) - 17.598 Drucksachen in WP19, davon ~10-15% Anträge — wir holen pro Page 100 Hits, paginieren bis 3 Pages und filtern client-seitig auf <p>Antrag …</p> (analog zu SL/HE) Pattern-Extraktion über drei Regexen aus dem stabilen result-block: <div class="row result"> <h4><a href="…pdf">Drucksache Nr. 19/<NR> vom DD.MM.YYYY</a></h4> <p>Antrag <FRAKTION>[, <FRAKTION2>]</p> <h5><strong>TITLE</strong></h5> </div> Drucksachen-Lookup: q=<drucksache> matched die Nummer im Volltext und liefert sie als einzigen Hit — wie bei SL und HB, kein dedizierter GetById-Endpoint nötig. Smoke-Test im Container: search("Schule", 5) → 5 Anträge in WP19 (SPD/FW-BAYERN+CSU/GRÜNE/AfD/AfD) get_document(19/11388) → match download_text(19/11388) → 4694 chars echter Antrags-Volltext search("", 5) → 5 newest Anträge mit korrektem date-DESC sort Free-Voters-Disambiguation funktioniert über den #55 Parteinamen-Mapper: "FREIE WÄHLER" auf Bayerns Liste wird zu "FW-BAYERN" canonicalized (separat von "FREIE WÄHLER" in RP und "BVB-FW" in BB). Tests: 185/185 grün. UI-Aktivierung erfolgt separat in #35 (blockiert auf diesem Commit und auf den BY-WP19-Wahlprogrammen — CSU, GRÜNE, AfD, SPD, FDP, FW). Refs: #23, #49 (Roadmap Phase 3)		2026-04-10 01:00:47 +02:00
..
kontext	Activate LSA: Wahlprogramme + ingest + frontend (#2 )	2026-04-07 22:12:32 +02:00
routers	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
static/referenzen	Add 30 Wahlprogramme für TH/BB/HH/SH/BW/RP (#37 , #39 , #40 , #32 , #41 , #42 )	2026-04-09 08:03:11 +02:00
templates	Phase E (substituted): Auswertungen-Drilldown-Modal (#59 )	2026-04-09 11:30:10 +02:00
__init__.py	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
analyzer.py	#60 Reopen — Option B: server-side reconstruct of zitat quelle/url	2026-04-09 22:52:17 +02:00
auswertungen.py	Phase C: Auswertungen-Dashboard #58 + CSV-Export #45 (Roadmap #59 )	2026-04-09 11:25:57 +02:00
bundeslaender.py	Phase J: SN EDAS-XML-Adapter (#26/#38) — Sachsen aktiv via XML-Export	2026-04-09 14:39:03 +02:00
config.py	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
database.py	Phase A: Audit-Restbefunde #57.3/4/7 (Roadmap #59 )	2026-04-09 11:15:16 +02:00
embeddings.py	#60 Reopen — Option B: server-side reconstruct of zitat quelle/url	2026-04-09 22:52:17 +02:00
main.py	Phase C: Auswertungen-Dashboard #58 + CSV-Export #45 (Roadmap #59 )	2026-04-09 11:25:57 +02:00
models.py	Initial commit: GWÖ-Antragsprüfer v1.0	2026-03-28 22:30:24 +01:00
parlamente.py	#23 BayernAdapter — TYPO3-Solr HTML scraping (Anträge in WP19)	2026-04-10 01:00:47 +02:00
parteien.py	Phase J: SN EDAS-XML-Adapter (#26/#38) — Sachsen aktiv via XML-Export	2026-04-09 14:39:03 +02:00
report.py	Security hotfixes #1 , #2 , #6 from audit (#57 )	2026-04-09 10:45:43 +02:00
validators.py	Phase A: Audit-Restbefunde #57.3/4/7 (Roadmap #59 )	2026-04-09 11:15:16 +02:00
wahlperioden.py	Phase C: Auswertungen-Dashboard #58 + CSV-Export #45 (Roadmap #59 )	2026-04-09 11:25:57 +02:00
wahlprogramme.py	Add 30 Wahlprogramme für TH/BB/HH/SH/BW/RP (#37 , #39 , #40 , #32 , #41 , #42 )	2026-04-09 08:03:11 +02:00