<div dir="ltr">Я бы в любом случае сперва бы попробовал запрос типа HEAD. Если он дает CLength, то все ок.<div><br></div><div>Иначе переходим на GET, часто будет chunked или без CLength, надо качать.</div></div><div class="gmail_extra">
<br><br><div class="gmail_quote">26 октября 2013 г., 23:58 пользователь Alessandro Gorohovski <span dir="ltr"><<a href="mailto:an.gorohovski@gmail.com" target="_blank">an.gorohovski@gmail.com</a>></span> написал:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Уважаемое сообщество,<br>
Добрый вечер!<br>
<br>
Подскажите,<br>
можно ли надежно и как определить размер (объем)<br>
предполагаемого к скачиванию контента<br>
(например, html-страницы) без загрузки всей страницы.<br>
<br>
<br>
Я сейчас пользуюсь<br>
<br>
my $agent = LWP::UserAgent->new;<br>
<br>
my $request = HTTP::Request->new( GET => $url );<br>
$request->header('Accept' => 'text/html');<br>
<br>
my $response = $agent->request( $request );<br>
$response->is_success || print FILE_ERR "$id\t$url:\t", $response->message, "\n";<br>
<br>
И далее парсим<br>
$response->headers_as_string<br>
<br>
на предмет 'Content-Length'<br>
<br>
Но, к сожалению удручает то, что не всегда заголовок скачиваемой страницы<br>
содержит поле  'Content-Length'<br>
:(<br>
<br>
Спасибо,<br>
ANG<span class="HOEnZb"><font color="#888888"><br>
-- <br>
Moscow.pm mailing list<br>
<a href="mailto:moscow-pm@pm.org" target="_blank">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
</font></span></blockquote></div><br></div>