[Moscow.pm] Дайджест списка рассылки Moscow-pm; том 26, выпуск 35

Peter Fedin pfedin на gmail.com
Пт Дек 18 04:03:57 PST 2009


Михаил,
позволю себе вернуться к рассуждениям о применимости сторонних решений.

То о чем говоришь ты, что рекапча убьет всех, да и не будет вовсе работать —
проверяется с помощью простых экспериментов.
Утверждение можно разбить на три статистических гипотезы.


1. Гипотеза о том, что убьет всех.
Насколько я понимаю, твоя цель - уменьшить долю спамных регистраций в общем
их числе, при этом не снижая абсолютного числа честных регистраций.

Ставишь на неделю рекапчу и смотришь - уменьшилась ли доля спама в по
сравнению с предыдущей неделей. Точно так же смотришь, уменьшилось ли
среднее количество здоровых регистраций в день. Это статистическая гипотеза
о равенстве средних.

Если через неделю (а лучше проверить на нескольких неделях вразброс, чтобы
не было влияния каких-нибудь аномалий типа нового года) у тебя количество
здоровых регистраций здорово не просядет от установки рекапчи, значит нет от
неё вреда.
А если ещё и доля спама уменьшится - значит и польза есть.

Если же фигня выйдет и за неделю эксперимента у тебя никто не сможет
зарегаться (или на значимое количество просядет среднее количество
регистраций в день), то значит ты прав и рекапча зло.

2. Гипотеза о том, что она вообще не будет работать.
Может быть я заблуждаюсь, но мне кажется, что перловый код, выполняющий
что-то в духе
if(рекапча не пингуется)
  загрузить(свою капчу);
else
  загрузить(рекапчу);
может быть написан примерно минут за пять, если знать перл и куда вставлять
этот код в твоей системе.

И опять-таки, давай посчитаем статистически.
Предположим, рекапча не работает 20% времени (чего быть не может в принципе,
но предположим.)
Можно предположить, что отсев хрюмеров на рекапче, когда она всё-таки
отображается, составляет только 70% (а типа 30% её всё-таки распознают. Не
верю в это, но предположим).
И я почти уверен, что на твоей капче, которую ты присылаешь, отсеивается ну
от силы 30%. Иначе этого треда не возникло бы.

Если к тебе в среднем приходит за день 100 спамеров, равномерно
распределенных по времени.
То при наличии рекапчи, работающей 80% времени будет отсеяно 100*0,8*0,7 +
100*0,2*0,3 спамеров, то есть 56+26 = 82 штуки из ста.
При отсутствии же рекапчи у тебя будет отсеяно 100*1*0,3, то есть 30
спамеров.
Разница в три раза почти.

Так вот, ты лучше меня знаешь, какую долю спамеров отсеивает твоя капча, а
долю отсевов на рекапче можно померить в ходе проверки гипотезы номер 1.
Но даже с такими грубыми оценками, сам видишь, каковы результаты.

3. Утверждение 3. Русские люди не способны распознать латинские символы.
Тут я даже не знаю что сказать. А ты получаешь доход от буквально
неграмотных пользователей? А какова доля их? Мне кажется это совсем изыски
из хвоста нормального распределения, всё-таки проникновение школьного
образования у нас в стране составляет 98%, и уж среди пользователей
компьютеров, я думаю все 99,99.


В общем все мое сообщение сводится к одной мысли - попытка не пытка и
эксперимент поставить никто не запрещал.

Хотя конечно я понимаю, что куда как прикольней самому намонстрячить капчу и
смотреть как об неё бьются роботы. Но это уже вопрос целеполагания =)

С уважением,
Федин Пётр Сергеевич

тел. +7 926 335-51-30
mailto:pfedin на gmail.com
ICQ UIN: 192054495


2009/12/18 Andrei <andrei.protasovitski на gmail.com>

>
>
> 18 декабря 2009 г. 10:49 пользователь Alex Kapranoff <kapranoff на gmail.com>написал:
>
> 2009/12/18 Kaltashkin Eugene <zhecka на gmail.com>
>>
>> 18.12.2009 12:31, Alexander Lourier пишет:
>>>
>>>  http://antispam.323f.net.ru/captcha/
>>>>
>>>>> картинки любые, кстати есть идея брать картинку не целиком, а её
>>>>> кусочек
>>>>> и резать, антикапча врядли соберёт :)
>>>>>
>>>>>
>>>> Собрать элементарно. Надо посчитать попиксельную разницу между краями
>>>> всех
>>>> картинок. И если разница получилась маленькой, значит картинки, скорее
>>>> всего,
>>>> будут стоять рядом.
>>>>
>>>>
>>>
>>> Ну т.е. вот такую робот соберёт без проблем ? :)
>>> http://antispam.323f.net.ru/bigcap/
>>
>>
>> Ну пятнашки компьютер точно собирает быстрее человека.
>>
>
> Пятнашки не всегда собираются.
>
>
>>
>>
>> --
>> Moscow.pm mailing list
>> moscow-pm на pm.org | http://moscow.pm.org
>>
>>
>
>
> --
> Andrei Protasovitski
> < andrei[dot]protasovitski[at]gmail[dot]com >
> Diemen, Netherlands
>
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>
>
----------- следущая часть -----------
Вложение в формате HTML было извлечено&hellip;
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20091218/20e876d8/attachment-0001.html>


Подробная информация о списке рассылки Moscow-pm