Rozdiely medzi verziami

PoložkaVerzia z 17:53, 12. máj 2016 od používateľa TeslatonVerzia z 12:47, 18. máj 2016 od používateľa Teslaton
Základné informácie
Poznámky:
Pôvodne podľa en: https://en.wikipedia.org/wiki/Special:AbuseFilter/135
Pôvodne podľa en: https://en.wikipedia.org/wiki/Special:AbuseFilter/135


Množina doplnená o ďalšie spoluhlásky (okrem slabikotvorných), ľahko zadávateľné na sk klávesnici [bcčdďfghjklľmnňpqrřsštťvwxzž]. False positives zbežne overené cez vyhľadávanie (insource:/[bcčdďfghjklľmnňpqrřsštťvwxzž]{7,}/). --Teslaton 2016-04-23
Množina doplnená o ďalšie spoluhlásky (okrem slabikotvorných), ľahko zadávateľné na sk klávesnici [bcčdďfghjklľmnňpqrřsštťvwxzž]. False positives zbežne overené cez vyhľadávanie (insource:/[bcčdďfghjklľmnňpqrřsštťvwxzž]{7,}/). --Teslaton 2016-04-23


Plus vybrané opakovania so samohláskou ("hahaha", "hi hi hi"), len v hlavnom NS. --Teslaton 2016-05-11
Plus vybrané opakovania so samohláskou ("hahaha", "hi hi hi"), len v hlavnom NS. --Teslaton 2016-05-11
Prerábka do zrozumiteľnejšej podoby a oprava chýb na základe testovania dielčích RE na textoch článkov z dumpu. --Teslaton 2016-05-18
Podmienky filtra
Pravidlá:
article_namespace != 2 & !("confirmed" in user_groups)  
(!("autoconfirmed" in user_groups) | (user_editcount < 25)) &
& article_prefixedtext != 'Wikipédia:Pieskovisko'
(article_namespace != 2) &  
& (  
(article_prefixedtext != 'Wikipédia:Pieskovisko') &
(
  /* Sekvencia dĺžky 1-9 znakov (mimo výnimky), zopakovaná aspoň 8x za sebou */
   (
   (
     !(removed_lines rlike "([^_:*'|=}{-]{1,9})\1{6}")
     reSeq := "[^_:*'|={}<&-]{1,9}";
     & (
     (rmwhitespace(added_lines) rlike ("(" + reSeq + ")\1{7}")) &
    (
    !(rmwhitespace(removed_lines) rlike ("(" + reSeq + ")\1{6}")) &
      (rmwhitespace(added_lines) rlike "([^_:*'|=}{-]{1,9})\1{7}"|
    !(added_lines rlike ("https?:\/\/\S*(" + reSeq + ")\1{7}"))  /* nie v URL */
        (added_lines rlike "[bcčdďfghjklľmnňpqrřsštťvwxzž]{7,}" &
  ) |
        !removed_lines rlike "[bcčdďfghjklľmnňpqrřsštťvwxzž]{7,}")
 
      )
  /* Dlhý blok spoluhlások (okrem výnimiek a mimo výskytov v názve súboru a URL) */
    & !(added_lines rlike "\[https?:\/\/\w*([^_:*'|=}{-]{1,9})\1{7}.*?\]")
  (
    ) | (
    re := "[bcčdďfghjklľmnňpqrřsštťvwxzž]{7}";
      rmwhitespace(summary) rlike "([^_:*'|=}{-]{1,9})\1{7}")
    (added_lines rlike ("(?!štvrť|čtvrt|rškvrnn|rchschl|tschspr|rpwllgw)" + re + "(?![^\s|]*\.\w)")) &
      & !("http" in summary)
    !(removed_lines rlike re) &
    )
    !(added_lines rlike ("https?:\/\/\S*(" + re + ")")) /* nie v URL */
   ) |
   ) |
  /* Sekvencia dĺžky 1-9 znakov (mimo výnimky), zopakovaná aspoň 8x za sebou, v zhrnutí */
   (
   (
    (rmwhitespace(summary)  rlike "([^_:*'|=}{-]{1,9})\1{7}") &
    !("http" in summary)
  ) |
  /* Kratšie notorické opakované sekvencie v hlavnom NS */
  (
    (article_namespace == 0) &
     /* "hahaha", "hi hi hi", "bla bla bla"... */
     /* "hahaha", "hi hi hi", "bla bla bla"... */
     re := "(?i)((h[aei]|bl[ae])\W{0,2}){3}";
     (   
    (article_namespace == 0) &
      re := "(?i)((h[aei]|bl[ae])\W{0,2}){3}";
    (added_lines rlike re) &  
      (added_lines rlike re) &  
    !(removed_lines rlike re)
      !(removed_lines rlike re)
    )
   )
   )
)
)