Referrer spam – 2

В помощ на системния администратор на Уеб сървър:

Бях писал и преди за средство срещу този вид спам. Средството обаче не ми помогна достатъчно. Webalizer генерира невероятно красиви статистики, но версията му е бъгава просто до безобразие. Половината от ключовите думи в конфигурационния файл вероятно са предвидени за реализиране или дебъгване в неопределеното бъдеще… Пък и списъкът ключови думи не е особено удобен за поддържане, във вида, в който го използвах. И не става за последващо чистене на логфайла от попаденията (дори отказани, те влизат там).

Поиграх си малко (и понаучих мъничко Perl), докато си измисля нещо, което да е една идейка по-удобно. Нещото можете да намерите тук. (Сайта на фирмата не го гледайте, актуален е към преди 5 години, и е пълна отврат, но нямам време да го оправя.)

Приспособено е за Apache сървър; иска Perl. Пробвано е на собствената ми машина. Файлът readme.txt описва горе-долу каква е идеята, и как се процедира. Предупреждавам: чистенето на лога от спам-термините не е коректно, проверява се не само referrer полето – но не съм имал време да напиша по-добро. Ако някой не го мързи, е добре дошъл.

Лицензът на нещото е… никакъв. Не вярвам подобна дреболия да има нужда от лиценз.

Колко добре работи – ами колкото добре поддържате списъците със спам-термини. Моите са основани на списъка, който намерих на мястото на оригиналното описание, и са доста подопълнени (особено този за порно-спама – тези май си ме обичат най-много. 🙂 )

При допълване на списъците с термини при мен те ще се актуализират автоматично и там. Обмислям идеята да приемам допълнения и от колеги. Каузата си струва да си помагаме. 🙂

4 thoughts on “Referrer spam – 2

  1. Дончо

    Винаги има нужда от лиценз, защото ако няма, по подразбиране е Copyright (c) Grigor Gatchev.
    Че няма да си търсиш правата на теб и мен е ясно, ама ако искаш всеки да е сигурен, направи го PD и толкоз :)…

    Reply
  2. dzver

    Бре бре, забелязах напоследък, че имам референти от обичайните досадници от разни казина, даже 1 път ЦЪКНАХ да видя верно ли моя блог го има там. Това е страхотна идея за google-бомбене през броячите на страниците…

    Reply
  3. Григор Post author

    Идеята е 5 години стара, ама с развитието на бот-мрежите бива все по-широко имплементирана…

    Само че аз не съм съгласен с точно тоя начин за саморефериране. Ако бях провайдер, щях директно да blacklist-на всеки сайт, който се рекламира така, и да ги пратя да се оплакват на арменския поп.

    Reply

Leave a Reply to Григор Cancel reply

Your email address will not be published. Required fields are marked *