Suche: einheitlicher Title+Urheber+Schlagwort-Filter über gesamte WP #18
Labels
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: tobias/gwoe-antragspruefer#18
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Ziel
Einheitliches Suchverhalten in allen vier Adaptern (NRW, MV, BE, LSA): die Suche scannt den gesamten Datenbestand der laufenden Wahlperiode, sortiert nach Datum absteigend, filtert clientseitig nach Treffern in Titel, Urheber und Schlagwort.
Ersetzt die ursprüngliche Volltext-Strategie aus #13 (mit den Sub-Issues #14, #15) und den UI-Toggle aus #17 — die wurden alle als "deferred until uniform" geschlossen.
Begründung
Der bisherige Stand war asymmetrisch:
facet_fulltext=0(echter Server-side Volltext)Folge: gleiche Suchanfrage liefert pro Bundesland völlig unterschiedliche Treffermengen, weil mal Volltext, mal Titel, mal nur ein Zeitfenster gescannt wird. Für den User ist das nicht nachvollziehbar — eine 0-Treffer-Antwort kann an seiner Anfrage liegen oder an der Adapter-Limitation, ohne dass es sichtbar wäre.
User-Entscheidung (2026-04-08): einheitliches "Title + Schlagwort über alles" ist besser als bestes-mögliches-pro-Adapter mit asymmetrischem Verhalten.
Akzeptanzkriterien
ParLDokAdapterbaut denfacet_fulltext-Tag zurück, scannt stattdessen via Pagination alle WP8-Drucksachen und filtert clientseitig auf Title + UrheberPortalaAdapterfür Berlin verzichtet auf dasdate_window_days-Fenster, paginiert über die ganze WP19, clientseitiger Filter wie heutePortalaAdapterfür Sachsen-Anhalt analogSchlagworte/thesaurus/keywords) wird im clientseitigen Filter berücksichtigt, sofern im Hit-list-Output sichtbar — wenn nicht, separater Folge-Issue/api/search-landtag?q=Schuleliefert ≥10 Treffer, und die ältesten Treffer sind tatsächlich aus dem Anfang der laufenden WPPerformance-Sorge
BE hat ~3000+ Drucksachen pro WP. Bei
chunksize=200und 15 Pages dauert ein voller Scan 30-60s. Mögliche Mitigation:Wird bei der Implementierung empirisch gemessen — wenn unzumutbar, separater Folge-Issue für Caching.
Beziehung zu geschlossenen Issues
Erledigt mit minimaler Variante in
b5ae889. Statt der ursprünglich diskutierten "Title-Suche über die ganze WP" — die mit ~5 Minuten pro Suche zu langsam war — wurde nur der Volltext-Pfad in MV deaktiviert.User-Entscheidung 2026-04-08: "deaktiviere die fulltext suche nur".
Neuer Stand der vier Adapter
Alle vier filtern jetzt clientseitig auf Title + Urheber, kein Server-Volltext mehr. NRWs OPAL-Eigensuche ist semantisch ähnlich (Title-Match-basiert), bleibt unangetastet weil sie seit ~25 prod-Assessments stabil läuft.
Live-Verifikation
SchuleMV ist jetzt schlechter als BE/LSA für Schul-Suchen, weil das ParlDok-Pagination-Window nur ~6 Monate abdeckt und BE/LSA über 24 Monate gehen. Bewusste Trade-off-Entscheidung.
Was nicht gemacht wurde
/api/search-landtagbleibt synchron wie heuteDer
FACET_FULLTEXT-Konstant und der_fulltext_id-Helper bleiben imParLDokAdapter-Code als Dokumentation für die spätere Re-Aktivierung wenn die Volltextsuche wieder einheitlich werden kann (closed-as-deferred Issues #13/#14/#15/#17 enthalten die Reverse-Engineering-Findings).