[Moscow.pm] Content-Length of Webpage

Akzhan Abdulin akzhan.abdulin на gmail.com
Вс Окт 27 05:43:31 PDT 2013


Я бы в любом случае сперва бы попробовал запрос типа HEAD. Если он дает
CLength, то все ок.

Иначе переходим на GET, часто будет chunked или без CLength, надо качать.


26 октября 2013 г., 23:58 пользователь Alessandro Gorohovski <
an.gorohovski на gmail.com> написал:

> Уважаемое сообщество,
> Добрый вечер!
>
> Подскажите,
> можно ли надежно и как определить размер (объем)
> предполагаемого к скачиванию контента
> (например, html-страницы) без загрузки всей страницы.
>
>
> Я сейчас пользуюсь
>
> my $agent = LWP::UserAgent->new;
>
> my $request = HTTP::Request->new( GET => $url );
> $request->header('Accept' => 'text/html');
>
> my $response = $agent->request( $request );
> $response->is_success || print FILE_ERR "$id\t$url:\t",
> $response->message, "\n";
>
> И далее парсим
> $response->headers_as_string
>
> на предмет 'Content-Length'
>
> Но, к сожалению удручает то, что не всегда заголовок скачиваемой страницы
> содержит поле  'Content-Length'
> :(
>
> Спасибо,
> ANG
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20131027/39ff41f7/attachment.html>


Подробная информация о списке рассылки Moscow-pm