<div>Касание -- не препятствие, потому что оно не препятствует сегментации картинки на буквы :) Не уверен, что знаю, какие там алгоритмы, но скорее всего картинка строчки текста разбивается на вертикальные блоки в разных местах, а потом выбирается самое интересное разбиение.</div>
<div><br></div><div>В аттаче пример, который напрочь убивает распознавание тессерактом. Я просто провёл в гимпе чёрную горизонтальную полоску поверх букв.</div><br clear="all">-- <br>Alex Kapranoff.<br>
<br><br><div class="gmail_quote">2010/1/23 Михаил Монашёв <span dir="ltr"><<a href="mailto:postmaster@softsearch.ru">postmaster@softsearch.ru</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
Здравствуйте, Александр.<br>
<br>
хммм. выходит, что касание букв - это не препятствие для распознавания,<br>
как писалось ранее...<br>
<br>
AS> четвёртый символ, конечно, не распознан, но это за 10 минут:<br>
AS> --copy<br>
AS> cyga@host:~/dev/capthca$ convert yzhv.png -scale 50x50+0+0 1.tif<br>
AS> cyga@host:~/dev/capthca$ convert 1.tif -blur 0 2.tif<br>
AS> cyga@host:~/dev/capthca$ tesseract 2.tif 2.tif<br>
AS> Tesseract Open Source OCR Engine<br>
AS> cyga@abergman:~/dev/capthca$ cat 2.tif.txt<br>
AS> YZHI<br>
AS> --cut<br>
AS> и без какого-либо "хитрого" подхода.<br>
<div><div></div><div class="h5"><br>
>> Вот такие капчи генерятся. Какое Ваше мнение, сложно они автоматом<br>
>> распознаются?<br>
<br>
<br>
<br>
--<br>
<br>
С уважением,<br>
Михаил Монашёв, SoftSearch.ru<br>
mailto:<a href="mailto:postmaster@softsearch.ru">postmaster@softsearch.ru</a><br>
ICQ# 166233339<br>
<a href="http://michael.mindmix.ru/" target="_blank">http://michael.mindmix.ru/</a><br>
Без бэкапа по жизни.<br>
<br>
--<br>
Moscow.pm mailing list<br>
<a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
</div></div></blockquote></div><br>