Unnaschied vunde Gschischde vun "Middawaida:YMS/EagleEye/ruleset.json.js"

Inhalt gelöscht Inhalt hinzugefügt
YMS (Dischbediere | Baidräsch)
EagleEye-Ruleset-Änderungen gespeichert
YMS (Dischbediere | Baidräsch)
Using Steven Levithan's [http://xregexp.com/ XRegExp] 2.0 library, extend ruleset
 
Zail 2:
{
"name": "Doppelwort",
"match": "(?i)(?<prefix>[^\\wp{L}\\/\\.=;_])([A-Za-z]?<word1>\\p{L}{2,}) (?<word2>\\2k<word1>)(?<postfix>\\bp{^L})",
"replace": "$1{prefix}!!!$2{word1}!!! $2{word2}${postfix}",
"skip": "(?i)((?<word>Abdullah|Bang|bye|C(i)?ao|cha|das|Dee|der|die|Gonzalez|had|Kiss|long|Mau|Mirror|Myers|Pizza|Santorio|sapiens|si(e)?|Spieglein|Stone|Víctor|Wah|Wei|wild(e)?|yeah|Zsa) \\k<word>)|-Main Main-",
"skip": "die die|der der|das das",
"note": "Sehr viele false positives, aber auch viele Fehler darunter",
"test": "All work work and no play makes Jack a dull boy",
"inactiveactive": falsetrue
},
{
"name": "Doppel-Doppelwort",
"match": "(?i)(?<prefix>\\bp{^L})([A-Za-z]?<word1>\\p{L}{2,})\\s([A-Za-z]?<word2>\\p{L}{2,})\\s(?<word3>\\1k<word1>)\\s(?<word4>\\2k<word2>)(?<postfix>\\bp{^L})",
"replace": "${prefix}!!!$1{word1} $2{word2}!!! $1{word3} $2{word4}${postfix}",
"skip": "(?i)(?<dword>buffalo buffalo|ein buffaloMann|HandFall inzu|Generation zu|Hand in|istJahr einfür|läuft mann ein mannund|Muhammad ibn Muhammad ibn|Na Na|nach Naund|New York New York|und mehr und mehr|und nach und nach|von Fall zu Fall zu|Von Zeit zu) Zeit zu\\k<dword>",
"test": "All work and no and no play makes Jack a dull boy",
"inactiveactive": falsetrue,
"note": ""
},
{
"name": "Teildoppelwort",
"match": "\\b(?<prefix>\\wp{L}*)([A-Za-z]?<word>\\p{L}{4,})(\\2k<word>(?<postfix>\\wp{L}*)\\b",
"replace": "$1{prefix}!!!$2{word}!!!$3{word}${postfix}",
"skip": "(?i)(?<letter>\\p{L})\\k<letter>{7,}|Abflugflughafen|absondernder|Acetacetat|Alburquerque|Aldehyddehydrogenase|Alleinsein|analkanalkarziomAnalkanalkarziom|Anbangbang|ändernder|Asocijacija|Aufgabenebene|auflaufAuflauf|auszusondernder|Basalusalu|behindernd|bewundernder|Bewusstsein\\wBewusstseinsein|Bezanozano|BinIchNich|Bischofshofs|Bisphosphoglycerat|Bisphosphonat|blaugraugrün|Blutaustausch|boingboing|Breitreit|breitseits|Bromaromat|Bugenhagenhaus|Bukatschatscha|burabura|Buschenschenke|Butaritari|Butylethylether|Chepchirchir|chercher|Chimanimani|Cholesterolester|Christensten|ChubbChubbs|ClickClickDecker|Cochinchin\\w|colocolo|CoroCoro|couscous|crushcrushcrushcrushcrush|Dangyangyu|Daunakamakama|DDDDDDDD|Dimethylmethylphosphonat|Diözesangesang|donaustaustufeDonaustaustufe|(downdown|leftleft|rightright)arrows|Dramarama|Drehstabstabilisator|duckduckgo|düsterster|Elitereiterei|Erstersteig|fiftyfifty|Flanschanschlu(ss|ß)|Flugzeugzelle|FontFont|FourFourTwo|Frischfisch|Fußballballett|Försterstein|Försterstelle|Gangliogliom|Gescheitheit|Gesteinseinschl|Greifreifen|Groschenschenke|Grossrosseln|HardHarderHeavy|haumia-tiketike|Hurleburlebutz|Ichisichisichisich|Impfempfehlung|Indiendienst|Industriebetriebe|Itezhitezhi|japanesebaseball|Kamehameha|kanalanalys|karakara|Kartenarten|Kipchirchir|kirikiri|Kischischew|kleinchinchilla|Kleinenbernberg|Kleinlein|klingelingeling|Klosterstern|Koskullskulle|Krochhochhaus|Kunstanstalt|Kunstflugflugzeug|Kunstinstinkt|Kunstinstitut|kusskuss|Leschtschyschyn|lichtechte|lindernder|Luangwangwa|Lungwangwa|Maconacon|Magistratsrats|Mahayahay|Makgadikgadi|Matakitaki|Mataskelekele|Mediendienst|Mehrspielerspiel|Meisterstern|[Mm]enschenschMenschensch\\wp{L}|methoxyethoxy|Methylethyl|mindernder|Mischischewitz|Mischritschtschja|Moghabghab|MoinMoin|Moshoeshoe|Mtubatuba|Mukhamukham|Muskelskelett|Mäandernder|Nakapiripirit|Narssarssuk|Netzwerkwerkzeug|neunzehnZehn|niamniamensis|Niedereder|Nietzschesche|nordnord|oponopono|Orongorongo|Oststadtstadion|Parengarenga|Parlamentsentscheid|Patschatschi|phosphosulfat|Piergiorgio|pilzepilze.de|plexplex|plusplus|plündernder|Politelite|Polyetheretherketon|postpostmoderne kommunikationKommunikation|Pritschitsch|pukapukanisch|quamquam|quelquels|quidquid|quinquina|quisquis|quodquod|quotquot|Rasokisoki|rechercher|Regenbogenboa|riemannmannigfaltig|Rundfunkfunktionär|Saritschtschja|Schachtachtinski|Schalaghlagh|Scheibenebene|schlendernder|Schlussaussage|schwachwachsend|Schwerinerin|Sciascias|Sendeende|Shanghang|shensiensis|Showaddywaddy|Sortimentsentscheidung|Speiseeise|Sportportal|Strebausbaus|Strichrichtung|Studiendienst|Sturmturm|Surroundsound|tabatabai|TalkTalk|\\wtaustauschp{L}taustausch|Teufelsfels|theorieorientiert|Thunfischfischerei|Tscheschen|tschetschen|Tuisorisori|Turnierniederlage|Udschidschi|Urururur|Uschischir|Vanadylacetylacetonat|Vereinseinsätze|verhindernder|viervierteltakt|wandernder|Weinsteinstabilisierung|weisungsungebunden|Whakarewarewa|widewidewitt|Wikiwiki|Windischeschenbach|Wissenssendung|xanthantha|XXXXXXXX|Yuanguang|yuanyuan|zerozero|Zhanshans|zurückrücken|zweitweiteste",
"test": "All work and no play makes Jack a dull Fußballspielerspieler.",
"inactiveactive": falsetrue,
"note": ""
},
{
"name": "Wortkombi",
"match": "(?<prefix>\\p{L}+)\\bs(?<words>and die|and den|und and|and und)(?<postfix>\\bp{^L})",
"replace": "$1{prefix} ${words}!!!${postfix}",
"skip": "live(?i)five and die|loveme and die|see (\\w)+mold and die|touch( me)?live and die|moldlove and die|tooloff and die|fuck offtool and die|count fivetouch and die",
"note": "Ausbaufähig; Prefix nur für Skiplist benötigt",
"test": "All work and und no play makes Jack a dull boy",
"inactiveactive": falsetrue
},
{
"name": "wiederspiegeln",
"match": "((spiegel|Spiegel?i)(?<spiegeltwieder>(?:\\p{^L})spiegel[^\\.]*)(wieder)(?:\\bp{^L}))|(?<wiederspiegelt>(?:\\b(wiederp{^L})wieder(spiegel|(?:\\p{^L})[^\\.]*)(spiegelt?:\\p{^L})spiegel))",
"replace": "$1{spiegeltwieder}!!!$5{wiederspiegelt}",
"test": "Im Spiegel steht 'Murder', immer wieder.",
"inactiveactive": falsetrue,
"note": ""
},
{
"name": "Klammerlink",
"match": "\\[\\[(?!:?([\\wp{L}-]{1,10}:|[^\\|\\]]+#))(?<link>[^\\|\\]]+) \\s\\((?<bracket>(\\d{4} )?([a-z]\\p{Ll}[^\\)\\]]+)|[^\\)\\]]+ album)\\)",
"replace": "[[$1$2{link} ($3{bracket})!!!",
"skip": "(?i)\\(([\\wp{L}-]+(sch|lich|ä|ö|ü|ß)|\\wp{L}{1,2}\\s|\\d{3,4} bis \\d{3,4}|abgegangen|allgemein|al-Qaida|antik|alt|and West of the Moon|and Young|b |bbw|bei |bemannter|bester|biaxial|bis |bmvit|carat weight|ccTLD|darstellende|degli|der |digitales Fernsehen|ehemalige|erste |fiktiv|formal|g\\.g\\.A\\.|geb(oren|\\.)|gemeindefrei|gestorbengest(orben|\\.)|hr|internationale|iOS|junior|k\\.\\s?u\\.\\s?k|kommunal|kommutativ|kollektiv|kriminell|kulturell|kurzes|langes|laut |linear|live 1982|leicht gekürzt|leichter Panzer|magister|mental|micro IP|mit |moderne |mot|mtDNA|nach |neu|n-tv|o Aio|objektorientiert|oder |ohne|orthodox|princeps|prologue|rechts|reelle|regionale|seit |sen(ior|\\))|sexualisiert|softwareseitig|sonstige|soziale|the Royal Burgh of Cullen|tort law|traditionell|upper half|una historia de entonces|un\\)möglich|unvollendet|virtuell|weltweit|van |von[ -]|vor|weltweit|zuwenig\\) Liebe)",
"test": "All work and no [[play (activity)|play]] makes Jack a dull boy",
"inactiveactive": falsetrue,
"note": ""
},
{
"name": "BildGebeugter nach TextLink",
"match": "\\[\\[((?<selflink>(?<self>[\\p{L}\\s-]+)\\|\\k<self>)|(?<schenlink>[\\p{L}-]+schen\\s[\\p{L}\\s-\\|]+))\\]\\]",
"replace": "[[$1{self}!!!$2{schenlink}]]",
"skip": "(?i)\\[\\[(Ablöschen|Aschen|Burschen|Dithmarschen|Döbritschen|Dornröschen|Draschen|Eschen|\\p{L}*Fischen|(Groß)?Görschen|Graitschen|Gritschen|Grutschen|Gutschen|Hänschen|Häschen|\\p{L}*häuschen|Hirschen Group|Hoischen|Kirschen|Klüschen|Konnekschen|Läuschen|(Fanfer)?Lieschen|Löschen|Maschen|(Katzen)?Menschen|Mischen|Moschen|Müschen|Mutzschen|Neschen|Paschen|Pieschen|Preuschen|\\p{L}*rauschen|Reschen|\\p{L}*schlösschen|Taschen|Tauschen|Tüschen|Vortäuschen|Wandelröschen|Waschen|Weitzschen|Weschen|Welschen Ennest|Werschen|Wesermarschen|Züschen|Zwischen)\\p{^L}",
"test": "All work and no play makes Jack zum [[deutschen Jungen]].",
"noteactive": ""true,
"note": "Ausbaufähig"
},
{
"name": "Linkformat",
"match": "\\[\\[(?<format>[„’‚“‘«‹»›‹«›»’”‘“\"'´`])(?=<text>[^\\]\\s\\d]{2,})\\]\\]",
"replace": "[[$1{format}!!!${text}]]",
"skip": "(?i)\\[\\[(’|'|\"|„|„|“|‘)(Abd |Abdu(’)?l|Ali Cause|Allo|Ammu-rapi|Amr|Ataq|Eua|Light“ Henry Huff|Love and Theft|Namgis|Nd|N Sync|O sole|Pataphysik|Round|s[- ]|solid|t |The Road To God|This Is Our|Til|Tröstet, tröstet|Urwa|Weihnacht!|Weird Al\"|Zigeunerjuden“-Urteil)",
"test": "All work and no play makes [[\"Jack\" Nicholson|Jack]] a dull boy",
"inactiveactive": falsetrue,
"note": "Linkinhalt nach dem ersten Zeichen nur für Skiplist erfasst"
"note": ""
},
{
"name": "Rückstände",
"match": "Eingerückte Zeile\\sZeile|Aufgezählter Listeneintrag\\sListeneintrag|==\\s?Kopfzeile|Wechseln zu\\szu:|Navigation, Suche\\sSuche|Aus Wikipedia\\sWikipedia, der freien Enzyklopädie\\sder\\sfreien\\sEnzyklopädie|Fetter Text\\sText|Kursiver Text\\sText",
"replace": "!!!",
"test": "All work and no play makes Jack a Fetter Text boy",
"inactiveactive": falsetrue,
"note": ""
},
{
"name": "1,23 groß",
"match": "(?<number>[0-9],[0-9][0-9]) \\s(?<word>gro(ß|ss)|lang|ho(ch|he)|breit)",
"replace": "$1{number} Meter!!! $2{word}",
"test": "All work and no play makes Jack (1,23 groß) a dull boy",
"inactiveactive": falsetrue,
"note": ""
},
{
"name": "% Prozent",
"match": "% Prozent|Prozent %",
"replace": "Prozent!!!",
"test": "12 % Prozent",
"inactiveactive": falsetrue,
"note": ""
},
{
"name": ".Ref.",
"match": "\\.(?<ref>(\\s?<ref[^>\\/]*(\\/>|>[^<]*<\\/\\s?ref>))+)\\.",
"replace": ".$1!!!{ref}",
"test": "All work and no play makes Jack a dull boy.<ref>King</ref>.",
"inactiveactive": falsetrue,
"note": ""
},
Zeile 91 ⟶ 108:
"replace": "><ref",
"test": "All work and no play makes Jack a dull boy.<ref>King</ref>,<ref>Kubrick</ref>",
"inactiveactive": falsetrue,
"note": ""
},
Zeile 99 ⟶ 116:
"replace": "<ref name=!!!",
"test": "All work and no play makes Jack a dull boy.<ref=King>King</ref>",
"inactiveactive": falsetrue,
"note": ""
},
{
"name": "Latein-Kyrillisch-Mix",
"match": "(?<prefix>\\p{L}*)((?<cyrlat>\\p{Cyrillic}\\p{Latin})|(?<latcyr>\\p{Latin}\\p{Cyrillic}))(?<suffix>\\p{L}*)",
"replace": "${prefix}${latcyr}!!!${cyrlat}${suffix}",
"skip": "(?i)KoЯn|NIИ|тнояsтеn",
"test": "Аll work and no play maкeѕ јaск a dull boy.",
"active": true,
"note": "Könnte man das nicht zur generischen Latein-Nichtlatein-Mischung ausbauen? \\p{^Latin} scheint allerdings tödlich zu sein..."
},
{
"name": "Latein-Griechisch-Mix",
"match": "(?<prefix>\\p{Latin}+)(?<greek>\\p{Greek})(?<suffix>\\p{Latin}+)",
"replace": "${prefix}!!!${greek}!!!${suffix}",
"skip": "die dieHΛL|der derHλLF|das dasWΔZ",
"test": "All work and no play makes Jack a dull Fuβballspieler.",
"active": true,
"note": "Anders als Kyrillisch-Check hier nur im Wortinnern geprüft, da viele legitime Einheitenvorsätze etc. (trotzdem viele false positives, undurchsichtiges Griechisch, IPA-M)"
},
{
"name": "Datumsformat",
"match": "(?<prefix>\\Wp{^L})(?<number>[1-9][0-9]?)(\\s|\\.|\\.\\.\\s?)(?<word>Januar|Februar|März|April|Mai|Juni|Juli|August|September|Oktober|November|Dezember|Jahrhundert|Jh\\.|Jhdt\\.|Jahrhunderts)(?<postfix>\\Wp{^L})",
"replace": "$1{prefix}${number}.!!! $3{word}$4{postfix}",
"test": "Am 6 März 1986",
"inactiveactive": falsetrue,
"note": ""
},
{
"name": "Bild vor/nach Text",
"match": "((?<vor1>\\[\\[(Datei|Bild|Image|File):[^\\[]*\\]\\])(?<vor2> ?[\\wp{L}'\\[]))|((?<nach1>[\\p{L}'\\]\\.!\\?] ?)(?<nach2>\\[\\[(Datei|Bild|Image|File):))",
"replace": "$1{vor1}${nach1}!!!$3{vor2}${nach2}",
"test": "[[Datei:axt.jpg|thumb|Jack]]Here's Johnny!",
"inactiveactive": falsetrue,
"note": ""
},
{
"name": "Bild nach Text",
"match": "([\\w'\\]\\.!\\?] ?)(\\[\\[(Datei|Bild|Image|File):)",
"replace": "$1!!!$2",
"test": "Here's Johnny![[Datei:axt.jpg|thumb|Jack]]",
"inactive": false,
"note": ""
}