[Moscow.pm] парсинг паспортов

Иван Миронов mironorange на gmail.com
Пт Апр 3 00:10:32 PDT 2015


    Добрый день!

    Что значит:
    - "Тексты введенные пользователем"?

    Если это данные, которые лежат на сервере:
    >  то просто выполнить запрос, преобразовать его в удобный формат
(Например: DOM дерево), обойти и вытащить то что нужно.

    Если есть данные, которые следует вытащить из картинки, то:
    > Воспользоваться оберткой над Tesseract OCR;
    |  Найти сервер, отправлять туда изображения для преобразования;
    |  Если запросов на преобразование очень много и скорость их обработки
важна, то воспользоваться платным api.


3 апреля 2015 г., 8:17 пользователь Yury Pats <yu.pats на gmail.com> написал:

> "Дрочи в сторону" -- так по-пятничному :)
>
> 2015-04-02 23:11 GMT+03:00 Dmitry Eremeev <dmitry на eremeev.ru>:
>
>> Дрочи в сторону "abbyy скан форм".
>>
>>
>> --
>> Yours
>> Dmitry Eremeev
>>
>> Russia / office: +7 499 703 32 07 <+7%20499%20703%2032%2007>
>> UK / office: +44 203 393 92 29 <+44%20203%20393%2092%2029>
>> Skype: eremeev.ru
>>
>> https://linkedin.com/in/dimkae
>> https://facebook.com/dimkae
>>
>> 2 апр. 2015 г., в 22:56, Dmitry Simonov <dsimonov на gmail.com> написал(а):
>>
>> Коллеги! А ни кто паспорта не парсит? В смысле строчки вида "выдан
>> тем-то и тем-то тогда-то", паспорт, серия и прочее.
>>
>> Дайте код!
>>
>> ---
>> Dmitriy V. Simonov
>> --
>> Moscow.pm mailing list
>> moscow-pm на pm.org | http://moscow.pm.org
>>
>>
>> --
>> Moscow.pm mailing list
>> moscow-pm на pm.org | http://moscow.pm.org
>>
>>
>
>
> --
> WBR, Yury Pats
> cellular: +375 (29) 5870723
>
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>
>


-- 

С уважением, Миронов Иван!
тел.: +7 (926) 206-90-39
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20150403/ddb32923/attachment-0001.html>


Подробная информация о списке рассылки Moscow-pm