<div dir="ltr">Задача в том, чтобы получить текст <a href="https://yadi.sk/i/3bT0EOEIdSeUp">этой страницы PDF</a>.<br>И проблема именно в кодировках в Perl.<br>  из<br>my $pdf = CAM::PDF->new($file_name);<br>my $text = $pdf->getPageText(1);<br> приезжает скаляр, который не получается заэнкодить в utf8.</div><div class="gmail_extra"><br><div class="gmail_quote">16 декабря 2014 г., 22:29 пользователь Nikolay Mishin <span dir="ltr"><<a href="mailto:mi@ya.ru" target="_blank">mi@ya.ru</a>></span> написал:<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Иван, может дашь этот pdf, самому попробовать и расскажешь задачу?<br>
Я пока не очень понимаю, что нужно<br>
<br>
16.12.2014, 19:43, "Харпалёв Иван" <<a href="mailto:ivan.kharpalev@gmail.com">ivan.kharpalev@gmail.com</a>>:<br>
<div><div class="h5">> А что значит "неведомо в какой кодировке"?<br>
> Ведь у Perl вроде может быть только информация utf8 или нет. О других<br>
> кодировках вроде же нигде не хранится инфа.. или хранится?<br>
><br>
> 8 декабря 2014 г., 21:44 пользователь Алексей Мышкин<br>
> <<a href="mailto:parserpro@gmail.com">parserpro@gmail.com</a>> написал:<br>
>>  Эта строка мало что без флага, так и ещё в какой-то неведомой кодировке,<br>
>>  иначе линукс консоль отображала бы её в читабельном виде.<br>
>><br>
>>  08 дек. 2014 г. 22:41 пользователь "Харпалёв Иван"<br>
>>  <<a href="mailto:ivan.kharpalev@gmail.com">ivan.kharpalev@gmail.com</a>> написал:<br>
>>>  Есть строка, без флага utf8.<br>
>>>  Utf8-консоль отображает строку зюками.<br>
>>>  decode("Detect", $data); не угадывает.<br>
>>><br>
>>>  Как правильно перевести в utf8?<br>
>>><br>
>>>  Где взять массив всех возможных ENCODING, чтобы переводить из них в utf8 и<br>
>>>  смотреть, угадали или нет?<br>
>>>  в pod Encode::Supported как получить массив не вижу.<br>
>>><br>
>>>  Вроде насущна проблема,<br>
>>>  как такое делать?<br>
>>><br>
>>>  Спасибо!<br>
>>><br>
>>>  --<br>
>>>  Moscow.pm mailing list<br>
>>>  <a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
>>  --<br>
>>  Moscow.pm mailing list<br>
>>  <a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
><br>
> --<br>
> Moscow.pm mailing list<br>
> <a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
<br>
--<br>
</div></div>С уважением<br>
Николай Мишин<br>
<div class="HOEnZb"><div class="h5"><br>
--<br>
Moscow.pm mailing list<br>
<a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
</div></div></blockquote></div></div>