И пак срещу спама

Повечето редактори в БГ-Фантастика я позабравиха. Аз обаче не съм – периодично й хвърлям поглед, и ако някой от все още пишещите е добавил нещо, го доизлъсквам. Благодаря им от сърце, че се оказаха истински любители на фантастиката… Съответно, гледам и за поражения от спамботове – “тъмната страна” никога не спи.

Сериозна спамерска атака имаше преди две седмици. Ботнетът предвидливо беше избягнал да удари Уикипедия и другите големи уикита, които поддържат антиспам-списъци и ги предоставят за публично благо. Не е за пръв път, и Ботчо веднага беше натоварен с бойната задача да чисти и блокира. Този път обаче се оказа срещу усъвършенствана кибер-бойна техника. Спамботовете сееха линкове към рекламираните места само по веднъж на три-четири редакции. Основната маса от редакциите им бяха стандартни поощрителни фрази, с вмъквани в тях на случаен принцип правописни грешки (за да не се състави бързо речник на тези фрази и да бъдат чистени). Иначе казано, ботнетът не толкова пълнеше със спам уикито, колкото го вандализираше.

Отне ми около седмица, докато усъвършенствам алгоритъма на антиспама, за да лови и тези редакции. Какво беше учудването ми, когато се оказа, че и при предишни атаки ги е имало, макар и много по-редки – може би една на сто. Като се има предвид количествата спам, които Ботчо е почистил от уикито, обаче това означаваше няколкостотин проспани вандализма из уикито. Почти на всяка десета страница… Повечето от тези вандализми бяха твърде стари, за да могат да бъдат хванати през списъка на последните промени (стандартно той се пази в МедияУики до 30 дни назад).

Въздъхнах и засилих вярното ми чедо да прерови всички до една страници на БГ-Фантастика. Не мина без грешки – отначало например всички картинки, към които не е добавено никакво описание или лиценз, бяха изтрити. (Което всъщност е правилното решение, просто правя компромис.) При връщането им обратно почистих и тук-там по някое бъгче от бота. Вече наближава времето да обявя първата му стабилна версия. 🙂 А тъй като итераторната рамка много улеснява пускането на задачи, нищо чудно някой път, ако ми остане време, да му напиша надстройка за уеб интерфейс. Тогава вече бот-оперирането в МедияУики ще стане напълно по силите на хора без познания по програмиране на скрипт-езици, поне за простички, типични задачи. 🙂

Но засега все още не. (Ако не се намеси някой, който владее PHP и желае да посвети част от времето си. Ще му помогна с удоволствие.) Засега тихичко си ползвам собствения си продукт, чистя му бъговете и се надявам да е от полза и за други.

Апропо, време е да приключвам този запис – един куп други уикита ме чакат да мина и тях с антиспам-метлата.

И ако някой има уики за обезспамяване, да се обажда – ще го изчистя с удоволствие. 🙂

23 Responses to 'И пак срещу спама'

  1. Пешо Says:

    a бе тия уикита нямат ли някаква защита, примерно captcha ?

  2. Scroch Says:

    идеята е да може много хора да редактират без да се налага да се слагат допълнителни пречки като captcha а и е доказано че тя филтрира доста от реалният трафик и доста малко от спама.

  3. Григор Says:

    @Пешо: И не само описаното от Scroch. Най-големите индийски ИТ фирми се занимават не с програмиране, а с решаване на капчи по технологията “биобот”. Наскоро получих в спам оферта от една – 15 долара за 1000 правилно решени капчи. Безплатно ти дописват троянеца да им препраща капчите и да получава от тях отговора…

  4. JJ Says:

    Григор : ей тука ме застреля с индийските ИТ-та ……..

  5. Петър Петров Says:

    Сложи captcha-ценз по подобие на У:

    12 + 5 минус две

    Евтините индийци едва ли ще минат, а скъпи индийци едва ли ще се наемат. Всякакви пияни и неграмотни – също.

  6. Григор Says:

    @Петър Петров: Ако имаш блог, ще си забелязал вече българските биоботове. Почти всеки ден чистя “коментари” от тях.

  7. Божо Says:

    е, да, ама с такава капча каквато Петър Петров предлага поне кибер-ботовете ще разкараш.
    Вярно, че е леко досадно за потребителите, ама е много по-добро, отколкото да се мъчиш да разчиташ някакъв разкривен текст.

  8. JJ Says:

    Може и тест за интелигентност да сложиш вместо капча 🙂

    Имаше един руски форум за електроника и за да станеш негов член направо си минаваш контролно ниво със солиден тест от 20 въпроса обхващащ конкретни проблемни ситуации. Хората се бяха сетили и този начин филтрират празноглавците и спам ботовете. Ех ако и по БГ форумите имаше подобни тестове …..

  9. Григор Says:

    @Божо: Имам някъде такава за МедияУики (преправен от мен стандартен екстенжън), ама не помня дали я изтествах до работене. Ако спамботовете прекалят, може да помисля за варианта.

    @JJ: Че къде е проблемът? Във форума за фантастика на Човешката библиотека, или този на софийския клуб например сигурно с удоволствие ще предложат такъв добър тест, ако някой го направи. Чувствай се поканен. 🙂

  10. Mandor Says:

    @Григор: Дали редакторите са го забравили, или просто им омръзна да ходят подир псевдоредакторите и да поправят? Или да се чудят кое от правилата за оформление на конкретен блок е валидно днес? Или да се чешат недоумяващо по главата и да се питат откъде се е появила дадена непотвърдена информация, качена на принципа „Да го пълним сега, после ще го оправяме“? За мен това са основните причини за отлива на участници.
    Плюс класическите, разбира се, но това се подразбира.

  11. Григор Says:

    @Mandor: Промени в правилата за оформление на блок в БГ-Фантастика не е имало не знам откога. А когато библиографираш фантастика, информацията лесно се потвърждава.

    За омръзването да ходят подир псевдоредакторите – в БГ-Фантастика над 80% от приносите са конструктивни и верни (ако не броим спамботовете). За разлика от Уикипедия, където (поне в българската) конструктивни и верни са може би под половината, а над една четвърт са съвсем откровени вандализми, но продължава да има редактори. И да не им омръзва да чистят нас*аното от вандалите. Просто и там редактори си тръгват, но междувременно се появяват нови, естествен оборот е, и го има именно благодарение на отвореността към “псевдоредактори”. В БГФ основните редактори повечето си тръгнаха, но нови не се появиха. Знаеш ли защо? Заради синдрома “не е мое чадо, нема да го храним”. Съчетан с неразбирането, че БГ-Фантастика е чадо наистина на всички любители на фантастиката. Виждал съм го достатъчно пъти у хора, които бяха още по-ентусиазирани от мен за това уики, но никога не написаха и ред в него… В общността ни има поне 10-15 души, които старателно правят и кътат свои библиографии, но треперят да не изтече информация от тях към БГ-Фантастика, и в нея само разглеждат с какво оттам могат да си попълнят своите неща. Да не би един вид техният труд и постижение да се омаловажи, да се размие с този на околните. Нищо, че техният труд никога няма да види признание – няма интерес към такъв продукт, на този пазар купувачите ги създава наличието на стока…

    Само че БГ-Фантастика я има, и ще я има. Когато ми остане малко повече време, ще се върна към нея и ще я съживя. Като ми останат свободни минути в някой момент пиша един бот-скрипт, който да я изчисти синтактично и да оформи и унифицира малко нещата. До седмица-две ще съм я прекарал през него. Ще попипна още това-онова, и като мине отпускарският период и дойде есента, ако не съм презатрупан, ще раздрънкам камбаната. Току-виж пък се събере нов екип мераклии да драсват по някой и друг ред. (Някои от стария – Наско Славов, Калин, аз, може би и ти все още не сме се отказали да пишем там.) И току-виж уикито отново потегли. 🙂

  12. Кал Says:

    Аз без бой си признавам, че активното ми редакторство в БГФ беше една от топките, които изтървах в един (лош) момент от жонглирането. И още не ми се е оправил достатъчно кръстът, за да се наведа и я да я взема пак. Плюс, нови топки идват _постоянно_…

  13. Григор Says:

    @Кал: Ти имаш по-важна работа от това редакторство. И то е задача, но с по-нисък приоритет…

  14. Mandor Says:

    @Григор: Не съм се отказал; просто в момента работата в БГФ ми прилича на кърпене на мазилката, при положение че основите поддават.
    Ако реорганизираш нещата — например приложиш някаква система за потвърждение на информацията, приемеш по-отговорна роля от просто администратор и координатор, както и още някои необходими промени (да не разводнявам темата) — с удоволствие ще се включа.
    На два пъти правих опити за уточняване на неясните моменти, но без успех — последният ми въпрос (в „Разговори“) още стои без отговор.
    Така че… според мен топката е у теб. 😉

  15. Григор Says:

    @Mandor: Въпроса на Разговори просто съм го проспал (случва се, и аз съм човек). Имам грижата да му отговоря там.

    За система за потвърждение на информацията – не ми се сърди, но мисля, че наистина не разбираш принципите на уикито като технология за събиране на информацията. (Може би трябва да драсна някой запис тук по въпроса.) Системата за потвърждаване на информацията в едно уики са редакторите. Ако някой въведе погрешна информация или мистификация, се очаква другите да го оправят. Предполагам, че имаш предвид някаква система за абсолютно обективиране на информацията; тя обаче спокойно може да бъде заобиколена с по-умело мистифициране (помниш ли записа на Hero1?). Резултатът от подобна система би бил много по-тромава работа на уикито, по-малко въведена информация и повече отказали се редактори (което именно ще провали реално вършещата система за обективиране – преглеждането на информацията от повече хора). Ако искам работеща система за обективиране от типа, който ти имаш предвид, трябва да плащам заплати на заетите в нея, а засега нямам как.

    Илюстрация: ти също имаш база данни за българската фантастика, нали? Каква е твоята система за обективиране на информацията? Реално приложима ли е тя в уики? Каква точно система за обективиране би предложил за уики и реално ли е тя да работи, без да сведе постъпването на информация на практика до нулата?

    За приемането на по-отговорна роля – това по същество би означавало да узурпирам уикито, и да го обявя за лично мое. (Формално съм си запазил такива правомощия, но много внимавам да не ги използвам.) Ако го направя, ще остана само аз да си пиша в него – никой няма да ходи да “бичи за чужда аванта”. Уикитата привличат редактори с това, че дават на всеки свободата да допринася, и отговорността за допринесеното. Точно както и със системата за потвърждение на информацията, в уикитата вършат работа механизми, различни от тези в частна фирма или държавно учреждение.

    Погледни Уикипедия, човече – тя благодарение на какво има изобщо някакви редактори? Ако Джимбо Уелс беше възприел “по-отговорна роля”, или пък беше въведена система за потвърждение на информацията от типа, който искаш, щеше ли днес изобщо да я има (Подсетка: Нупедия.) С БГ-Фантастика нещата стоят по същия начин.

  16. Mandor Says:

    @Григор: Относно системата за потвърждение — не, моята система не е приложима, защото се основава на еднолично управление: не добавям книга, която не съм видял с очите си; не приемам библиографски данни от други хора, а ако съм сигурен че книгата съществува, приемам сканирани корици и издателски карета, от които сам извличам необходимата ми информация. С тези си действия поемам пълна отговорност върху достоверността на информацията, изложена от мен. Логично е, че такава система е абсурдна за обхватите на уикито.
    От друга страна, не смятам че можеш да разчиташ изцяло на добросъвестността на сътрудниците. По този начин „лошите“ ще си вилнеят, най-често — правейки „име“ за чужда сметка, а „добрите“ ще се уморят да им ходят по петите и да закърпват нещата до що-горе прилично ниво. Един от първите редактори в БГФ, който по принцип е страхотен фен и експерт, направи име само като копираше страници от стария ми сайт и ги „пляскаше“ в уикито 1:1, без дори да поправя правописните грешки или да допълни вече остарялата информация. И никой не реагира, просто вървяха след него и чистеха, поправяха, допълваха… и губеха два пъти повече време, отколкото ако бяха съставили статията от нулата.
    И в „нашенското“ уики също има такива „пишман“ редактори, както ги наричам, така че примерът ти не е особено уместен. Знаеш ли защо в bg.wikipedia има статия за Ан Макафри и пренасочка от Ан Маккафри? Историята е направо трагикомична (от моя гледна точка), а разкриването й дължа на двучасов спор в чата на Читанка. Имам още „негативизми“ към българските редактори в Уикипедия, натрупани през годините, но това може да е само мое мнение, затова няма да го излагам като факт. И до момента не съм видял български проект, който е просперирал чрез такава организация на работата.
    Добре, за достоверността в което и да е уики се разчита на останалите редактори, но какво става в БГФ? Слага се въпрос в беседата към статията, обикновено отговорът е „нямам(е) информация по въпроса“ и нещата замират, защото почти никой от знаещите не попада на страницата с въпроса. И т.н., и т.н.

    И изобщо… и този разговор май отива в задънена улица. Ако направиш от БГФ място, където на редактора да не му е жал, че си е загубил времето, ще се включа отново. Ако ти трябва информация от наличната ми — просто поискай; както знаеш, не я крия само за себе си. Но при сегашната организация — не, благодаря.

  17. Григор Says:

    @Mandor: “Лошите” обикновено си вилнеят твърде кратко. След няколко все по-малко учтиви забележки започват административните мерки. В БГ-Фантастика почти никога не се е стигало дотам, но в Уикипедия често има по някой блокиран. Така че на добросъвестността на сътрудниците като цяло може да се разчита. Изключения, естествено, няма как да няма, но правилото е, че може.

    За Уикипедия – много хора имат негативизми към нея. Често ми се случва да видя вътре коментар “абе тука в статията има грешка, вземете я оправете”. Съответно, съществува готовият шаблон {{миоправиго}}, за да не си дава човек труда да пише стотици пъти един и същи отговор. Забелязал съм, че поканата към някого да оправи каквото е забелязал обикновено е най-сигурният начин да го изгониш завинаги – бай Ганьо е велик критик, но е фатална грешка да го очакваш да си мръдне пръста да свърши нещо. И както вероятно се сещаш, уважението към подобни “критици” в Уикипедия е нулево. Там прекалено добре се вижда кой какво и колко върши, така че всеки много бързо си получава каквото реално заслужава. Именно това е и причината, поради която българската Уикипедия просперира доста прилично.

    Забележката за оставащите без отговор въпроси за достоверност в БГФ е много уместна. Мисля, че може да е добра идея да се направи една страничка “Въпроси към експерти”, или нещо подобно, където такива въпроси да се събират. Специалистите бързо ще свикнат да й хвърлят поглед от време на време, така че процентът на отговорите ще се качи.

    А дали в БГФ на редактора му е жал, че си е загубил времето, е въпрос, на който всеки има свой отговор. На мен ми е жал единствено че нямам повече време за нея. Но… ти имаш правото на своя отговор, и на своите решения. Допринесъл си достатъчно, за да няма как да бъдеш обвинен в стиснатост, прав си. Но за организацията – ако не ти харесва, предложи по-добра. Ако очакваш само да критикуваш, пък друг да се гърби с вършенето, не съм уверен, че ще има резултат.

  18. Mandor Says:

    @Григор:
    За бай Ганьо критика съм съгласен, но в случая имах предвид друго. Все едно да направиш забележка на някого, че си хвърля боклука на улицата, вместо в кошчето, а той да ти каже „ми вдигни го и го изхвърли“. На мен така ми звучи това „{{миоправиго}}“.
    Друга (моя любима) вариация на същата тема е: „Правя това доброволно, не ми плащат за него, така че не можеш да имаш никакви претенции — ако можеш по-добре, направи го ти“.

  19. Григор Says:

    @Mandor: Уви, наистина е така – хората допринасят към уикитата доброволно, и нямаш как да имаш претенции към тях. Но не забравяй, че получаването на отношение, каквото си заслужил, е могъщ стимул да се помъчиш да заслужиш нещо прилично. Тези, които не ги е грижа, че ги ругаят, бързо биват разкарвани чрез остракиране или пряко блокиране. Тези, които искат да бъдат ценени, с времето се научават как да вършат свястна работа. Това реално създава доста ефективен механизъм за отсяване на некачествените.

    Погледни например Наско Славов. Сигурно е над шейсетте, и е напълно лишен от този сорт дисциплина на ума, който се изисква в уикитата. Като капак, има твърде много работа и грижи, за да може да си позволи да изпипва нещата. Идеалният анти-кандидат за редактор, нали? Да, но с времето се научи да се справя доста прилично. Вече започва да е ценен не само с познанията си, а и с редакторски умения. Ето, че става… В Уикипедия е същото. Ако не беше колосалният брой вандали в български условия (от анонимните приноси повече от половината са вандализми, и от чистенето им от години не съм смогнал да напиша нова статия), щеше да е и по-чиста, и по-пълна. (За справка: в англоезичната под 10% от анонимните приноси са вандализми.)

    Отношението към тези, които просто не могат много добре, и тези, които цапат умишлено, в уикитата е много различно. Първите биват учени търпеливо, но вторите виждат вратата много бързо. Дори в благата Уикипедия обикновено след две-три предупреждения вандалът бива блокиран; при по-здрава издънка и направо. А в БГФ, както ми е къс фитилът, и доста по-бързо. Така че и този механизъм е в действие, и е силен и ефективен.

    В крайна сметка се получава система от стимули и механизми, която е доста ефективна в събирането на качествените редактори. Вярно е, в България напоследък народът оскотя и се чалгизира до немай-къде, но дори така ядрото на българската Уикипедия е от изключително добри администратори и кадърни редактори. И те са отсети именно от този народ, в тези условия. Дано това говори нещо за ефективността на системата.

  20. Mandor Says:

    @Григор: Съгласен.
    Спираме по тази тема.

  21. Кал Says:

    “На мен ми е жал единствено че нямам повече време за нея”.

    +1 🙁

  22. Кал Says:

    P.S. А ако го имах – много от възраженията на Мандор щяха да отпаднат. Хората, които добавят материал в БГФ, на практика са трима-четирима, не е толкова трудно да се поддържа подире им.

    (И аз съм _перфекционист_… когато мога да си го позволя, и виждам смисъл.)

  23. Божо Says:

    Плъгин за WordPress, свързан с blacklist:

    http://wordpress.org/extend/plugins/httpbl/

    Първо проверява той в листа, ако прпопусне коментара следват останалите спам-филтри, които са инсталирани на блога.

Leave a Reply