[Moscow.pm] Content-Length of Webpage

Alessandro Gorohovski an.gorohovski на gmail.com
Сб Окт 26 13:18:17 PDT 2013


Warstone на list.ru <warstone на list.ru> писал(а) в своём письме Sat, 26 Oct  
2013 23:03:00 +0300:

>  А   length(Encode::encode_utf8($response->as_string)) когда  
> запретили? Это если в байтах, конечно.

Никто не запрещал, конечно.

Но зачем загружать все, e.g. ~5Gb контента, чтобы найти его длину?
(да и памяти может не хватить)

Все дело в том, что
Нужно хотя бы первые 20 килобайт (или меньше)
а дальше можно не скачивать.


> Суббота, 26 октября 2013, 22:58 +03:00 от "Alessandro Gorohovski"  
> <an.gorohovski на gmail.com>:
>> Уважаемое сообщество,
>> Добрый вечер!
>>
>> Подскажите,
>> можно ли надежно и как определить размер (объем)
>> предполагаемого к скачиванию контента
>> (например, html-страницы) без загрузки всей страницы.
>>
>>
>> Я сейчас пользуюсь
>>
>> my $agent = LWP::UserAgent->new;
>>
>> my $request = HTTP::Request->new( GET => $url );
>> $request->header('Accept' => 'text/html');
>>
>> my $response = $agent->request( $request );
>> $response->is_success || print FILE_ERR "$id\t$url:\t",
>> $response->message, "\n";
>>
>> И далее парсим
>> $response->headers_as_string
>>
>> на предмет 'Content-Length'
>>
>> Но, к сожалению удручает то, что не всегда заголовок скачиваемой  
>> страницы
>> содержит поле  'Content-Length'
>> :(
>>
>> Спасибо,
>> ANG
>> --
>> Moscow.pm mailing list
>> moscow-pm на pm.org |  http://moscow.pm.org
>
>


-- 
ANG


Подробная информация о списке рассылки Moscow-pm