[Moscow.pm] Дайджест списка рассылки Moscow-pm; том 26, выпуск 35

Михаил Монашёв postmaster на softsearch.ru
Пт Дек 18 05:56:30 PST 2009


Здравствуйте, Петр.

Я  не  совсем понимаю о чём ты тут написал, ибо ничего из приписанного
мне  я  не  писал  в  этом треде и КАЖДОЕ доказанное тобой утверждение
ложно :-)

Или ты ответил не мне?

PF> Михаил,
PF> позволю себе вернуться к рассуждениям о применимости сторонних решений.
PF> 
PF> То о чем говоришь ты, что рекапча убьет всех, да и не будет вовсе работать ≈ проверяется с помощью простых экспериментов.
PF> Утверждение можно разбить на три статистических гипотезы.
PF> 
PF> 
PF> 1. Гипотеза о том, что убьет всех.
PF> Насколько я понимаю, твоя цель - уменьшить долю спамных регистраций в общем их числе, при этом не снижая абсолютного числа честных регистраций.
PF> 
PF> Ставишь на неделю рекапчу и смотришь - уменьшилась ли доля спама в по сравнению с предыдущей неделей. Точно так же смотришь, уменьшилось ли среднее количество здоровых регистраций в день. Это статистическая гипотеза о равенстве средних.
PF> 
PF> Если через неделю (а лучше проверить на нескольких неделях вразброс, чтобы не было влияния каких-нибудь аномалий типа нового года) у тебя количество здоровых регистраций здорово не просядет от установки рекапчи, значит нет от неё вреда.
PF> А если ещё и доля спама уменьшится - значит и польза есть.
PF> 
PF> Если же фигня выйдет и за неделю эксперимента у тебя никто не сможет зарегаться (или на значимое количество просядет среднее количество регистраций в день), то значит ты прав и рекапча зло.
PF> 
PF> 2. Гипотеза о том, что она вообще не будет работать.
PF> Может быть я заблуждаюсь, но мне кажется, что перловый код, выполняющий что-то в духе
PF> if(рекапча не пингуется)
PF>   загрузить(свою капчу);
PF> else
PF>   загрузить(рекапчу);
PF> может быть написан примерно минут за пять, если знать перл и куда вставлять этот код в твоей системе.
PF> 
PF> И опять-таки, давай посчитаем статистически.
PF> Предположим, рекапча не работает 20% времени (чего быть не может в принципе, но предположим.)
PF> Можно предположить, что отсев хрюмеров на рекапче, когда она всё-таки отображается, составляет только 70% (а типа 30% её всё-таки распознают. Не верю в это, но предположим).
PF> И я почти уверен, что на твоей капче, которую ты присылаешь, отсеивается ну от силы 30%. Иначе этого треда не возникло бы.
PF> 
PF> Если к тебе в среднем приходит за день 100 спамеров, равномерно распределенных по времени.
PF> То при наличии рекапчи, работающей 80% времени будет отсеяно 100*0,8*0,7 + 100*0,2*0,3 спамеров, то есть 56+26 = 82 штуки из ста.
PF> При отсутствии же рекапчи у тебя будет отсеяно 100*1*0,3, то есть 30 спамеров.
PF> Разница в три раза почти.
PF> 
PF> Так вот, ты лучше меня знаешь, какую долю спамеров отсеивает твоя капча, а долю отсевов на рекапче можно померить в ходе проверки гипотезы номер 1.
PF> Но даже с такими грубыми оценками, сам видишь, каковы результаты.
PF> 
PF> 3. Утверждение 3. Русские люди не способны распознать латинские символы.
PF> Тут я даже не знаю что сказать. А ты получаешь доход от буквально неграмотных пользователей? А какова доля их? Мне кажется это совсем изыски из хвоста нормального распределения, всё-таки проникновение школьного образования у нас в стране составляет 98%, и уж среди пользователей компьютеров, я думаю все 99,99.
PF> 
PF> 
PF> В общем все мое сообщение сводится к одной мысли - попытка не пытка и эксперимент поставить никто не запрещал.
PF> 
PF> Хотя конечно я понимаю, что куда как прикольней самому намонстрячить капчу и смотреть как об неё бьются роботы. Но это уже вопрос целеполагания =)
PF> 
PF> С уважением;
PF> Федин Пётр Сергеевич
PF> 
PF> тел. +7 926 335-51-30
PF> mailto:pfedin на gmail.com
PF> ICQ UIN: 192054495

--

С уважением,
Михаил Монашёв, SoftSearch.ru
mailto:postmaster на softsearch.ru
ICQ# 166233339
http://michael.mindmix.ru/
Без бэкапа по жизни.



Подробная информация о списке рассылки Moscow-pm