BE/LSA: Server-side Volltextsuche im PortalaAdapter via eUI sf-Index #13

New Issue

tobias · 2026-04-08T12:48:33+02:00

tobias commented

2026-04-08 12:48:33 +02:00

Sub-Issue von #11 — der schwierigere zweite Teil. Erfordert Reverse-Engineering des state-spezifischen sf-Index-Namens, das beim ursprünglichen LSA/BE-Adapterbau bewusst zurückgestellt wurde (siehe Docstring von PortalaAdapter._build_search_body).

Was zu tun ist

PortalaAdapter so erweitern, dass query als Server-side Volltext-Filter in den eUI/portala-Search-Body geht — für beide Instanzen (LSA/PADOKA und BE/PARDOK).

Was bereits dokumentiert ist

Aus dem Docstring von _build_search_body (Issue #2/#3):

Full-text search is not implemented in the MVP: the adapter returns documents of the current Wahlperiode in the given date window, and the search query is applied as a client-side title/Urheber filter. The server-side full-text path requires state-specific sf index names that are not yet known.

Das heißt: das eUI-Backend hat einen Volltext-Pfad, aber der sf-Schlüssel (search field) variiert pro Instanz. Bei den existierenden Filtern sieht man z.B. WP, ETYPF, DTYPF, DAT — analog gibt es vermutlich FT o.ä. für Volltext.

Vorgehen

Live-DevTools-Trace auf https://padoka.landtag.sachsen-anhalt.de/portal/ und https://pardok.parlament-berlin.de/portala/ für eine echte Volltextsuche einer Drucksache → exaktes Payload-Schema für sf und Term-Format extrahieren.
Der Test sollte beide Instanzen abdecken, weil LSA und BE leicht unterschiedliche Index-Namen haben können (siehe db_id="lsa.lissh" vs lah.lissh).
_build_search_body so erweitern, dass das top_terms-Array ein optionales Volltext-Term akzeptiert wenn query != "".
Client-side Filter behalten als Fallback wenn Server-side leer zurückgibt.

Akzeptanzkriterien

ADAPTERS["BE"].search("Schule", limit=20) liefert ≥10 Treffer
ADAPTERS["LSA"].search("Schule", limit=20) liefert ≥10 Treffer
Funktioniert für sowohl WP-aktuelle als auch ältere Anträge im Wahlperioden-Fenster
date_window_days kann nach erfolgreicher Volltext-Suche evtl. wieder reduziert werden (Performance)
Smoke-Test im prod via /api/search-landtag?q=Schule&bundesland=BE und =LSA

Abhängigkeit

Empfohlen: erst #12 (MV) durch, weil das ParlDok-Schema klarer dokumentiert ist und als Vorlage für die eUI-Variante dient.

Sub-Issue von #11 — der schwierigere zweite Teil. Erfordert Reverse-Engineering des state-spezifischen `sf`-Index-Namens, das beim ursprünglichen LSA/BE-Adapterbau bewusst zurückgestellt wurde (siehe Docstring von `PortalaAdapter._build_search_body`). ## Was zu tun ist `PortalaAdapter` so erweitern, dass `query` als **Server-side Volltext-Filter** in den eUI/portala-Search-Body geht — für beide Instanzen (LSA/PADOKA und BE/PARDOK). ## Was bereits dokumentiert ist Aus dem Docstring von `_build_search_body` (Issue #2/#3): > Full-text search is **not** implemented in the MVP: the adapter returns documents of the current Wahlperiode in the given date window, and the search query is applied as a client-side title/Urheber filter. The server-side full-text path requires state-specific `sf` index names that are not yet known. Das heißt: das eUI-Backend hat einen Volltext-Pfad, aber der `sf`-Schlüssel (search field) variiert pro Instanz. Bei den existierenden Filtern sieht man z.B. `WP`, `ETYPF`, `DTYPF`, `DAT` — analog gibt es vermutlich `FT` o.ä. für Volltext. ## Vorgehen 1. **Live-DevTools-Trace** auf https://padoka.landtag.sachsen-anhalt.de/portal/ und https://pardok.parlament-berlin.de/portala/ für eine echte Volltextsuche einer Drucksache → exaktes Payload-Schema für `sf` und Term-Format extrahieren. 2. Der Test sollte beide Instanzen abdecken, weil LSA und BE leicht unterschiedliche Index-Namen haben können (siehe `db_id="lsa.lissh"` vs `lah.lissh`). 3. `_build_search_body` so erweitern, dass das `top_terms`-Array ein optionales Volltext-Term akzeptiert wenn `query != ""`. 4. Client-side Filter behalten als Fallback wenn Server-side leer zurückgibt. ## Akzeptanzkriterien - [ ] `ADAPTERS["BE"].search("Schule", limit=20)` liefert ≥10 Treffer - [ ] `ADAPTERS["LSA"].search("Schule", limit=20)` liefert ≥10 Treffer - [ ] Funktioniert für sowohl WP-aktuelle als auch ältere Anträge im Wahlperioden-Fenster - [ ] `date_window_days` kann nach erfolgreicher Volltext-Suche evtl. wieder reduziert werden (Performance) - [ ] Smoke-Test im prod via `/api/search-landtag?q=Schule&bundesland=BE` und `=LSA` ## Abhängigkeit Empfohlen: erst #12 (MV) durch, weil das ParlDok-Schema klarer dokumentiert ist und als Vorlage für die eUI-Variante dient.

Land	Vorher	Jetzt
BE Schule	0	20 ✓
LSA Schule	3 (Titel-only)	14 ✓

BE/LSA: Server-side Volltextsuche im PortalaAdapter via eUI sf-Index #13

Was zu tun ist

Was bereits dokumentiert ist

Vorgehen

Akzeptanzkriterien

Abhängigkeit

Was im Commit ist (Quick-Win)

Was nicht im Commit ist (echter Server-side Fulltext)

Vorschlag fürs nächste Mal

Status nach HAR-Trace gegen padoka

Was funktioniert hat (lokal verifiziert)

Was noch NICHT funktioniert (warum der Patch nicht committet wurde)

LSA: Hit-Format ist anders im Volltext-Mode

BE: Server lehnt die LSA-Syntax ab

Aufsplitten