Potíže se spamem
14.5.2006
Delší dobu jsou na Marigoldu potíže se spamem, které se už obávám označit za drobné. Dokud chodilo denně pár spamů do komentářů na web, dalo se to řešit ručně. Když to byly desítky, přestalo ruční řešení stačit a Noname do té srágory tvářící se jako redakční systém doinstaloval nějaké pluginy, které se snaží spamu v komentářích vzdorovat. Jde jim to docela slušně, ale i tak se denně (spíše nočně, hlavní nápor je v noci) dostane do komentářů tak desítka spamů. K čemu má plugin nastavení, že má vyhazovat komentáře, v nichž je více odkazů než jeden, jsem nepochopil, ale co naplat.
Dneska jsem znovu poštelovával nastavení a jelikož jsem si všiml, že řada spamů používá znak | pro oddělení odkazů, zadal jsem tento znak na blacklist. Úvaha to byla zralá, snad nikdy jsem tenhle znak v regulérním komentáři neviděl.
Jenže ejhle, blacklist se urazil a začal preventivně celý provoz serveru přesměrovávat na sprostou hlášku, že jste spammer. Kdo na to narazil, omlouvám se, nebylo to úmyslné.
Je zajímavé, že Chronomag, který má asi tak desetkrát větší provoz, než Marigold, spam zdaleka tolik netrápí a dostane se tam tak jeden spam komentář týdně, zbytek zachytí redakční systém. Zdá se, že Wordpress (který Chronomag používá) si s tím umí poradit o dost lépe. Jenže všechno je otázka nastavení. V poslední době musím logy spam filtrů mazat ob den, aby se v nich dalo vůbec pohnout a vyznat.
Za případné zmatky a potíže se omlouvám.
Rovněž se omlouvám za omylem publikovaný článek o informační globalizaci z minulého týdne, neměl na serveru vyjít. Kdo jste se po něm sháněli, je sundaný záměrně.


Proti spamu na blogu mi pomohla instalace pluginu CaptCha!. Pokud jde neco podobneho nainstalovat do BLOG:CMS, doporucuju vyzkouset.
Comment by Plnt — 14.5.2006 @ 16:56
Omlouvam se, spatne jsem poeditoval odkaz. Spravne ma byt:
http://www.boriel.com/?page_id=17...
Comment by Plnt — 14.5.2006 @ 16:57
u me se na diskuzni forum o problematice pripojeni internetu objevi denne maximalne 5 spamu, i presto ze mam ve formulari nutnost opsat nejaky kod z obrazku, mam takovy pocit ze se jedna o manualne zadavany spam, forum na phpbb
Comment by Adam Haken — 14.5.2006 @ 18:47
[1] [2] CAPTCHA neni resenim. Otravuje uzivatele a netrivialne snizuje pristupnost. Vsechny zpusoby obrany zalozene na tom, ze ma CLOVEK DOKAZAT, ZE NENI ROBOT maji vicemene ten stejny problem: obtezovani uzivatele a pristupnost. tudy cesta nevede a rekla bych, ze Marigold si to uvedomuje. Za to mu nalezi dik a take prani hodne stesti ve vecnem boji za svet (bez spamu) krasnejsi.
Comment by zirafka — 14.5.2006 @ 19:05
[4] Opisovani kodu z obrazku me take prijde naprosto trapne. Vetsinou me to odrardi od POSTu komentare, coz neni, doufam, ucel
Osobne by mi nejlepsi prislo dat 3-5 Submit tlacitek s Image, kde by bylo na nahodnem z nich Projdi. Proti brute force attacku bych zavedl blokaci pri post floodu. Jiste neni to na 100%, ale je to pred hranici akceptovatelnosti. Dalsi moznost je postovani pouze registrovanym uzivatelum a registraci udelat trochu komplikovanejsi. Ale to pro mne osobne prijatelne neni, zvlaste na webech, ktere navstevuji jen obcas
Comment by adamkopp — 14.5.2006 @ 19:24
Jestli lze do kódu RS doplnit volání jedné externí adresy pro ověřování zda jde nebo nejde o spam, tak bych mohl pomoct. Mám vlastní řešení proti spamu na principu jednoduché analýzy obsahu na Přírodě a funguje velmi dobře. Jestli by byl zájem to zkusit, tak se můžem domluvit na antispam@perpetum.cz
Comment by Petr — 14.5.2006 @ 20:13
nechapem, preco vsetci ignoruju moje riesenie proti spamu
nemusim vobec nic triedit, triast sa ci to nemaze komentare od ludi alebo vobec nemusim kukat na ziadne statistiky kolko mi to zmazalo, a nemam sancu pozriet sa, co mi prislo za spam pretoze chodia iba normalne komentare a naviac nijako neiritujem citatelov ziadnymi vymyslancami typu opisovania kodov.
Comment by rony — 14.5.2006 @ 20:14
[7] Máš prostě štěstí. Já měl taky dlouho klid, ale pak mi několik debat začaly pravidelně bombardovat nabídky na c-a-s-i-n-o, p-o-k-e-r (současná antivirová ochrana ty slova normálně nepovolí
a podobně. Server o přírodě není zrovna nějak 'iritující', ale když už tě roboti objeví, tak se toho nezbavíš. Robot se prostě neunaví nebo si to sám nerozmyslí… V současnosti mám na serveru cca 10% všech příspěvků automaticky nezobrazované spamy
Comment by Petr — 14.5.2006 @ 20:48
[4] Myslim, ze pokud se opisovani kodu vhodne zkombinuje s moznosti registrace na dane strance + vynechani opisovani kodu pro registrovane uzivatele, tak obtezujici neni. Hlavni nevyhodu v opisovani kodu vidim v tom, ze se spatne realizuje v textovych prohlizecich jako links, elinks, lynx, apod.
Comment by Plnt — 14.5.2006 @ 21:32
[9] to prave souvisi s pristupnosti. Nechce se mi to nejak vic rozepisovat. Precist si o tom muzes napriklad na pristupnost.nawebu.cz
Comment by zirafka — 14.5.2006 @ 21:53
No a co takhle zaves bonzovaci system
? … na root.cz to napriklad funguje v ramci obecnejsiho hodnoticiho systemu tak, ze spamy od uzivatelu dostavaji nejnizsi hodnoceni a tak jsou implicitne skryty (pokud je hodnoceni povazlive nizke i posleze vymazany mozna) …
Comment by Marek — 14.5.2006 @ 23:43
Tady by to mohlo poresit jen nejake chytre umistene tlacitko "SPAM" a takovyto feedback od uzivatelu by se mohl stat spolehlivym ukazatelem pro spam filtr.
Comment by Marek — 14.5.2006 @ 23:46
No vida a ja uz myslel ,ze Marigold necekane skoncil :-] Jinak s WP mam tez dobre zkusenosti, spamu minimum.. spise u PhpBB mam az moc registrovanejch spameru a musim neustale mazat :-{
Comment by mepp — 15.5.2006 @ 7:47
článku o informační globalizaci škoda. než jsem si jej stihl v klidu přečíst, už jste ho stáhnul. snad někdy jindy?
Comment by vaclav — 15.5.2006 @ 8:52
dela mi to porad. chci-li odeslat komentar, nebo kliknu-li v dolnim seznamu titulku na libovolny clanek. firefox/linux, ted jsem na jinem serveru z elinkus
Comment by Martin — 15.5.2006 @ 9:04
doplneni - no a ted uz se nedostanu nikam, ani na samotnou titulku… zlata captcha nez tento chaos
Comment by Martin — 15.5.2006 @ 9:06
Také jsme to nedávno řešili, viz:
http://jyxo.blog.cz/0605/spamfiltr-na-blog-cz
hezký den…
Comment by Michal Illich — 15.5.2006 @ 9:10
[17] Používám zřejmě dost podobné řešní. Nejvíce účinná je mimochodem detekce počtu komentářů zaslaných z jedné IP adresy v rámci několika minut. Účinnost filtru je zhruba 98%, což při tom množství pořád pár komentářů znamená
Comment by Patrick Zandl — 15.5.2006 @ 9:33
[18] Máš štěstí na robota, který IP neumí měnit. Mě když přijde serie spamu (většinou tak 4-5 kousků téměř najednou), tak každý přijde z jiné IP
Jinak ta nabídka na na [6] je samozřejmě zdarma, nebylo to myšleno jako nějaká komerční nabídka
Comment by Petr — 15.5.2006 @ 10:45
[19] díky za nabídku. přemýšlel jsem o tom, ale zatím to nechám tak. Bohužel nemám čas a ani znalosti do toho ted šáhnout
Comment by Patrick Zandl — 15.5.2006 @ 11:37
Patricku, a proč to nevím já? Měl jsi mi napsat maila. Já si všimnu spamu na tomto serveru asi jednou za dva týdny, kdybych věděl, že je to furt problém, tak to ještě nějak pošteluju. Já to vidím jen jako problém u fóra, ale tam admin rights nemám, takže jestli to chceš vyřešit tam, tak dej vědět.
Ten problém s | zkusím vyřešit, předpokládám, že je tam nějaká fce, která to používá jako oddělovač a tohle ji podělalo.
Jinak pro informaci: problém je, že z nějakého důvodu nefunguje na tomto serveru captcha, asi nějaká chybějící image PHP knihovna. Takže to rešíme tak nějak všelijak jinak. Zatím jsem měl za to, že to funguje dostatečně, kdybych věděl, že je to furt problém, tak sem přidám textovou captcha (tj. takovéto "skákal ___ přes oves" -> "Buď jste robot, nebo neumíte zpívat"
Hlavní problém je, že marigold je samozřejmě hodně citovaný zdroj a tudíž těch spamerů je tady mraky. Těch spamů zablokovaných denně je přes stovku, jiné Nucleus weby co mám jich mají max. desítky za měsíc. A samozřejmě mají velmi rozdílné IP adresy i obsahy.
Comment by noname — 15.5.2006 @ 11:38
[21] Captcha urcite potrebuje php knihovnu GD a jeste tipuju, ze neco jako knihovnu freetype (na pismenka do obrazku)
Comment by zirafka — 15.5.2006 @ 21:07
Jo spam to je fakt svinstvo, neodpustím si poznámku, že by mě zajímalo co na tyto problémy říká "autor" tohoto RS
Comment by Luk — 15.5.2006 @ 22:08
Tak pro zajímavost, za posledních 12 hodin se na tento server celkem minimálně 1372× pokusil připojit nějaký spammer (podle seznamu blokovaných IP adres). 90× je pak zachytilo až druhé síto (jeden velmi inteligentní a přitom trapně jednoduchý plugin, jehož funkčnost nebudu popisovat).
Tohle není problém RS, ti roboti prostě pošlou na každý formulář svá data. Marigold je prostě jen "populární". Stejný problém bude mít s čímkoliv.
Zkusím to tu trochu poladit.
[22] díky, vypadalo to, že mám vše potřebné, jen to prostě nefungovalo. Ale ona ani grafická captcha není stoprocentní. Existují na ní velmi dobré auto OCR systémy. Nemám jí hlavně moc rád, textová captcha je imho po všech stránkách lepší.
Comment by noname — 15.5.2006 @ 22:55
[24] ja taky tradicni captchu nemam rada, ale co bych se nepochlubila, ze vim, ktere knihovny to potrebuje, kdyz se naskytla takova pekna prilezitost ((-; Skoda, ze nepomihlo. To by ses zbavil aspon pseudospamu jako je tenhle. Nemam totiz jaksi talent na opisovani kodu.
Comment by zirafka — 15.5.2006 @ 23:53
Jedna z těch jednodušších ochran, co ale robota může odradit a anglicky mluvícího taky, je právě ta textová "captcha". Tudíž buď to "skákal ___ přes oves", nebo jednoduchá žádost "tady napiš slovo 'kuk'"…
viagrové spamy, co chodily dřív, zatím přestaly…
Osobně na blogu úspěšně praktikuji slovo "baf"
Comment by brozkeff — 26.5.2006 @ 0:27
[8] nemam stastie. mam metodu.
Comment by rony — 30.5.2006 @ 12:45