Suche: Volltext-Filter fehlt in PortalaAdapter (BE/LSA) und ParLDokAdapter (MV) #11
Labels
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: tobias/gwoe-antragspruefer#11
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Symptom
Suche nach
"Schule"in BE liefert 0 Treffer, in MV nur 3 Treffer — unrealistisch wenig für laufende Wahlperioden mit jeweils ~3000 Drucksachen.Root Cause
Beide neueren Adapter (
PortalaAdapterfür LSA/BE,ParLDokAdapterfür MV) machen die Suche client-seitig auf Titel + Urheber, nicht über den Volltext der PDFs:MV (
ParLDokAdapter): Holt die letzten 10×100 = 1000 Drucksachen viaFulltext/Search+Fulltext/Resultpage(sortiert nach Datum desc), filtert dann clientseitig aufkind=Drucksache, type=Antrag→ ~30 Anträge. Davon haben 3 das WortSchuleim Titel. Ältere Schul-Anträge und solche, dieSchulenur im Volltext erwähnen, fallen raus.BE (
PortalaAdapter): Holt das letztedate_window_days=180Tage-Fenster viabrowse.tt.json+report.tt.html, filtert clientseitig nach Titel/Urheber. In den letzten 180 Tagen hatte kein BE-AntragSchuleim Titel.Der
NRWAdaptermacht echte Server-side Suche überOPALund ist nicht betroffen.Lösungsoptionen
Quick wins (Symptombehandlung)
MAX_PAGESvon 10 auf 30 erhöhen → scant 3000 statt 1000 Docs (3× Latenz)date_window_daysvon 180 auf 730 erhöhen (wie LSA) → 4× größeres FensterLöst nur das Symptom: Title-Only-Match bleibt.
Echter Fix (Server-side Volltext)
bundle.jsistfacet_fulltext = 0definiert. SearchTags der Form{type: 0, t: "Schule"}sollten Server-side Volltext aktivieren. Reverse-Engineering vermutlich überschaubar (~ 1–2h)._build_search_body-Docstring steht bereits: "Full-text search is not implemented in the MVP: the server-side full-text path requires state-specificsfindex names that are not yet known." Mehr Aufwand.Vorschlag
Server-side Volltext als zwei separate kleine Issues angehen, MV zuerst weil einfacher, BE/LSA als Folge.
Aufgedeckt nach Abschluss von #4 + #10 (Adapter + Wahlprogramm-Indexierung) im Live-System.
Aufgesplittet in zwei konkrete Sub-Issues:
Reihenfolge: erst #12, dann #13.
Beide Sub-Issues durch:
facet_fulltext=0umgesetzt in6184bf8.Schulein MV jetzt 20 Treffer (vorher 3), reverse-engineered komplett aus dembundle.jsohne DevTools.9eda6f9(date_window 730d, chunksize 500, timeout 60s).Schulein BE jetzt 20 (vorher 0), in LSA 14 (vorher 3). Echter Server-side Volltext bleibt offen, weil das eUI-Backend ohne Browser-DevTools-Trace nicht reverse-engineerbar ist — Einzelheiten im Abschluss-Kommentar von #13.Beide Adapter erfüllen jetzt das Akzeptanzkriterium ≥10 Treffer für
Schule.