FS#78: Erkennung von redfam-Sections per RegEx erkennt False-Positive #22

Closed
opened 7 years ago by golderweb · 1 comments
Owner

Die Erkennung von redfam-Sections läuft gegenwärtig über eine RegExp die mindestens zwei in doppellten Eckigen Klammern gefasste Ausdrücke erfordert.

regexp=r"^(.[[.+]].[[.+]].*)"

Diese RegEx erkennt allerdings auch externe Links die Versehntlich in doppelten Klammern stehen.
Bsp. aus [https://de.wikipedia.org/wiki/Wikipedia:Redundanz/Juni_2007#.5BSeiten_Kurze_Artikel.5D_-_Wikipedia:Kurze_Artikel|Wikipedia:Redundanz/Juni 2007]]
=== [[http://de.wikipedia.org/wiki/Spezial:Kürzeste Seiten Kurze Artikel]] - [[Wikipedia:Kurze Artikel]] ===

Der mwparserfromhell bietet in wikicode.getSection() die Möglichkeit anstelle einer RegExp eine Callback-Funktion zu übergeben um Sections zu matchen.

Innerhalb dieser sollte dann über wikicode.filter_wikilinks die Anzahl auf min. 2 geprüft werden.


Imported from https://fs.golderweb.de/task/78 via GOLDERWEB FS->GITEA TICKETIMPORTER

Originially opened: Wed Aug 24 17:50:46 2016

Die Erkennung von redfam-Sections läuft gegenwärtig über eine RegExp die mindestens zwei in doppellten Eckigen Klammern gefasste Ausdrücke erfordert. <code>regexp=r"^(.*\[\[.+\]\].*\[\[.+\]\].*)"</code> Diese RegEx erkennt allerdings auch externe Links die Versehntlich in doppelten Klammern stehen. Bsp. aus [https://de.wikipedia.org/wiki/Wikipedia:Redundanz/Juni_2007#.5BSeiten_Kurze_Artikel.5D_-_Wikipedia:Kurze_Artikel|Wikipedia:Redundanz/Juni 2007]] <code>=== [[http://de.wikipedia.org/wiki/Spezial:Kürzeste Seiten Kurze Artikel]] - [[Wikipedia:Kurze Artikel]] ===</code> Der mwparserfromhell bietet in wikicode.getSection() die Möglichkeit anstelle einer RegExp eine Callback-Funktion zu übergeben um Sections zu matchen. Innerhalb dieser sollte dann über wikicode.filter_wikilinks die Anzahl auf min. 2 geprüft werden. ---- Imported from https://fs.golderweb.de/task/78 via GOLDERWEB FS->GITEA TICKETIMPORTER Originially opened: Wed Aug 24 17:50:46 2016
golderweb closed this issue 7 years ago
Poster
Owner

Closed as https://fs.golderweb.de/task/78#taskclosed via GOLDERWEB FS->GITEA TICKETIMPORTER

Originally closed: Wed Aug 24 21:13:04 2016

---- Closed as https://fs.golderweb.de/task/78#taskclosed via GOLDERWEB FS->GITEA TICKETIMPORTER Originally closed: Wed Aug 24 21:13:04 2016
Sign in to join this conversation.
No Label
No Milestone
No Assignees
1 Participants
Notifications
Due Date

No due date set.

Dependencies

This issue currently doesn't have any dependencies.

Loading…
There is no content yet.