diff --git a/app/protokoll_parsers/bund.py b/app/protokoll_parsers/bund.py index bf155f2..adbb09c 100644 --- a/app/protokoll_parsers/bund.py +++ b/app/protokoll_parsers/bund.py @@ -39,18 +39,29 @@ mit ANDEREN Anchor-Phrasen. ### Vote-Anchor-Phrasen (vom NRW-Pattern abweichend!) -Bundestag-typisch: -- "Wer dem [Antrag/Gesetzentwurf] seine Zustimmung gibt, den bitte - ich, sich vom Platz zu erheben." -- "Damit ist [...] in zweiter Beratung angenommen." -- "Die Mehrheit hat den Gesetzentwurf [...] abgelehnt." -- "Wir kommen zur Abstimmung in dritter Lesung." -- "[...] wird zur federfuehrenden Beratung an den Ausschuss [...] - ueberwiesen." +**Verifiziert in WP20 Sitzung 30** (572k Zeichen XML, 5 angenommen-Anchors): -**Achtung:** WP20-Sitzung 184 enthielt 0 dieser Anchors weil pure -Aussprache. Echtes Sample mit Beschluessen brauchts (z.B. Sitzungen -mit Gesetzentwurf-Lesungen). +``` +Die Beschlussempfehlung ist mit den Stimmen der Koalitionsfraktionen +und der Fraktion Die Linke gegen die Stimmen der CDU/CSU-Fraktion bei +Enthaltung der AfD-Fraktion angenommen. +``` + +Pattern-Erkennung: +- Anchor-Verb: ``angenommen`` oder ``abgelehnt`` am Satzende +- Vote-Block: ``mit den Stimmen [...] gegen die Stimmen [...] bei + Enthaltung [...]`` +- Fraktions-Phrasen: ``Fraktion X``, ``X-Fraktion``, ``Koalitionsfraktionen`` +- Drucksachen muessen **rueckwaerts** vom Anchor gesucht werden + (oft mehrere 100 Zeichen vorher) + +**Wichtig:** BT-Anchor-Sprache ist viel laenger als NRW +(``Damit ist X angenommen``, 5-30 Zeichen) — bei BT zwischen Stimm- +Block und ``angenommen`` koennen 200+ Zeichen liegen. Regex-Begrenzung +muss entsprechend grosszuegig sein. + +WP20 Sitzung 184 = pure Aussprache, KEINE Beschluss-Anchors. Sample +fuer Tests: WP20-Sitzungen 30, 100, 150 (alle mit Beschluessen). ### Strukturierte Alternative — namentliche Abstimmungen