И пак уики-спам

Напоследък повечето уикита, които хоствам, са под силен удар на спамботове.

Такива удари не са новост: спамботовете редовно ги пълнят с несъществуващ боклук, за да задръстват блеклистинг системите. Този път обаче пуснатите линкове са истински.

Разширението SpamBlacklist не помага – очевидно проектите на фондация Уикимедия са избягнати. Големият брой следящи ботове там моментално вписва спамвертизираните URL-и в локалния черен списък, който се проверява от почти всяко МедияУики по света. Вероятно ботмрежата е програмирана умишлено да не ги закача, за да може да останат боклуците й в други уикита колкото се може по-дълго.

Принципно подобни атаки не ме тревожат – отдавна съм си написал модулче за МедияУики бота ми, което чисти спам-ревизиите. Десетки пъти е чистило хостнатите при мен уикита от боклука. (Ако ползва администраторска сметка, не само връща отново не-спамовите ревизии, но и може да изтрива страници, които са създадени от спамботовете, и да блокира спамерските сметки и адреси.) Ако някой има нужда уикито му да бъде почистено от спама, ще му направя услугата с удоволствие.

Този път обаче спамботовете бяха нахитрели значително. Вместо да изхвърлят целия или почти целия оригинален текст, те доста често само вмъкват някъде из него едно-две линкчета. При по-големи статии това успяваше да измами алгоритмите за проверка, и да даде спам коефициент под граничния. Наложи ми се да допиша проверка и на разликите между ревизиите. Още доизпипвам коефициентите й за различните подозрителни явления, но като цяло вече върши работа.

… Засега успяваме да сборим спамерите. 🙂

10 Responses to 'И пак уики-спам'

  1. Michel Says:

    Само да вметна…

    …сметка == акаунт/профил, нали?

    Просто звучи странно и нелогично… По едно време Google се опитаха да въведат термна “сметка” — примерно, “излезте от вашата Google сметка” (вместо “излезте от вашия Google профил (или акаунт)”… но всеки усеща, колко глупаво и нелогично звучи този термин така преведен на български…

    Не съм сигурен и че “акаунт” или “профил” е толкова по-добър термин от “сметка”, но със сигурност, в онова значение, за което ти говориш, “сметка” е много неподходящ термин. (А може и да греша…)

    Just my $0.02 🙂

  2. Григор Says:

    @Michel: В Уикипедия се е наложило така, и го използвах, без да се замисля 🙂

  3. Пешо Says:

    еми то тая борба е безкрайна. Радвам се, че си получил временно надмощие 🙂

    Интересно ми е защо спамерите изобщо се занимават с това, защото писането на спамботове и непрекъснатото им ъпдейтване за да се справят със своите ‘анти-‘ си е сериозен труд (не че съм го правил, но съм правил неща които сигурно са подобни по фукционалност). От заниманията ми със СЕО съм стигнал до извода, че линковете в уикита са с почти нулева ‘възвръщаемост’. А да се разчита човек да прочете спама и да последва линк е просто глупост. Т.е. целта на занятието ми се губи. Може би е Лениновия (ако правилно си спомням авторството) принцип, че количествените натрупвания все някога ще доведат до качествени изменения 🙂

  4. Григор Says:

    @Пешо: Идиотите са опасни за околните – не казвам нищо ново. Винаги се намира, един на хиляда или сто хиляди, идиот. Който като прочете “викодин”, “лесбийки” или каквото там му е чувствителната точка, цъка на линка, ако ще до него да стои стражар, който да го бие с чук през пръстите за всяко цъкане. Пръснат ли ботмастерите ли спама си на един милион места, се намират десет, сто или хиляда идиоти. Всеки от тях означава:

    – петдесетина долара печалба от продадения му боклук
    – още един (често и повече от един) компютър към ботмрежата, заради лепнатия му троянец
    – още средно по десетина долара (в повечето случаи нула, но в някои по няколко хиляди) от изпразнените му банкови сметки
    – още средно по пет-десет долара от откраднати акаунти за онлайн игри (стават за продаване на игромани и за куп други неща)
    – още средно по пет-десет долара от откраднати акаунти за социални мрежи (стават за търсене на още наивници и пръскане на още спам)
    – още средно по пет-десет долара от продаване на личната информация на информатори на домашни и улични обирджии
    – още средно по пет-десет долара от продаване на личната информация на финансови пирамиди и подобни мошеници
    – още средно по няколко точки неуязвимост срещу преследване, от продаване на личните данни на разузнавания

    Тоест, към по стотина долара от идиот (вероятно има и още начини, които не се сещам в момента). Което значи при успешна акция и до стотина хиляди долара. Акции могат да се правят по няколко на ден – това прави поне по десетина милиона на месец, ако имаш добри агенти за поръчки за спам и за продаване на откраднатите акаунти и лична информация. Стига и за дописване на ботовете, и за какво ли не. Не е лошо, а?

  5. Пешо Says:

    значи Ленин е бил прав 🙂
    Всъщност нищо чудно, той с пълно основание би могъл да се разглежда като спамер – пробутал е непоискани неща на милиони.

    По принцип си прав и знам, че от тоя тип дейност се изкарват големи пари. Просто изразих учудване, че се прави през уики-та, защото тоя начин е сравнително сложен и с много по-ниска успеваемост от други далеч по-прости начини.

  6. Григор Says:

    @Пешо: Защото другите далеч по-прости начини отдавна вече също се правят. 🙂

  7. Michel Says:

    @Григор:

    О, да, видях видях… Съвсем прав си! “Регистриране на сметка”, в wikipedia|bg? Лоша работа…

    Може и да няма по-добър превод, ама личното ми мнение е, че “сметка” звучи глупаво в такъв контекст… [/end offtopic] 🙂

  8. Вергил Пенков Says:

    ReCaptcha би трябвало по-лесно да свърши работата?
    http://code.google.com/apis/recaptcha/docs/mediawiki.html

  9. Даниел Калчев Says:

    А едно време имаше сериозно лекарство за спамерите — трафика на електронната поща се плащаше 🙂

  10. Григор Says:

    @Вергил Пенков: Съмнявам се. Като минимум, в Индия хиляда правилно решени капчи струват между 20 и 50 долара. А като продължение, порно-капча-солверите нищо не струват…

    @Даниел Калчев: И как точно помагаше то срещу уики-спам от ботмрежи?

Leave a Reply