<div dir="ltr">Obrigado Breno.<br><br>Você pode trocar por algo como:<br>
<br>
<br>
if ( $data-&gt;success() ) {<br>
 &nbsp; &nbsp; &nbsp; &nbsp;@filmes = $data-&gt;content() =~ m{&lt;br&gt;&lt;i&gt;\((.+?)\)&lt;/i&gt;&lt;/td&gt;}<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

gs;<br>
}</blockquote><div>&nbsp;<br>Não funcionou não.<br><br>
para vc lidar com o caso de erro no get() que vc faz na linha acima.<br><br>Não achei o &quot;erro&quot; que você disse no get().<br><br>Como alternativa à regexp, você pode passear pela árvore HTML usando<br>
HTML::TableContentParser ou com outros módulos de scraping como o<br>
pQuery ou o Web::Scraper:<br><br>Vou tentar usar isso.<br><br>Muito obrigado Breno ^^<br></div><br>Abraços<br><br><div class="gmail_quote">2008/10/14 breno <span dir="ltr">&lt;<a href="mailto:breno@rio.pm.org" target="_blank">breno@rio.pm.org</a>&gt;</span><br>

<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Daniel,<br>
<br>
infelizmente pelo que vi o site em questão usa tabelas e não trabalha<br>
com ids, então o scraping será mais passível de problemas (leia-se &quot;se<br>
mudarem alguma coisa no layout seu script provavelmente vai parar de<br>
funcionar&quot;).<br>
<br>
Sobre o trecho de código:<br>
<div><br>
&gt; &nbsp; &nbsp; foreach ( split(&quot;\n&quot;,$data-&gt;content()) ) {<br>
&gt; &nbsp; &nbsp; &nbsp; &nbsp; if ( m{&lt;/strong&gt;&lt;br&gt;&lt;i&gt; &nbsp;\( &nbsp;(.+?) &nbsp;\) &nbsp;&lt;/i&gt;&lt;/td&gt;}igx ) {<br>
&gt; &nbsp; &nbsp; &nbsp; &nbsp; push(@filmes,$1);<br>
<br>
</div>Você pode trocar por algo como:<br>
<br>
<br>
if ( $data-&gt;success() ) {<br>
 &nbsp; &nbsp; &nbsp; &nbsp;@filmes = $data-&gt;content() =~ m{&lt;br&gt;&lt;i&gt;\((.+?)\)&lt;/i&gt;&lt;/td&gt;}gs;<br>
}<br>
<br>
me parece mais rápido (menos operações) e legível, além dar a deixa<br>
para vc lidar com o caso de erro no get() que vc faz na linha acima.<br>
<br>
Como alternativa à regexp, você pode passear pela árvore HTML usando<br>
HTML::TableContentParser ou com outros módulos de scraping como o<br>
pQuery ou o Web::Scraper:<br>
<br>
[]s<br>
<br>
-b<br>
<br>
<br>
2008/10/14 Daniel de Oliveira Mantovani &lt;<a href="mailto:daniel.oliveira.mantovani@gmail.com" target="_blank">daniel.oliveira.mantovani@gmail.com</a>&gt;:<br>
<div><div></div><div>&gt; print &quot;Bom dia\n&quot; if day == manha;<br>
&gt; print &quot;Boa tarde\n&quot; if day == tarde;<br>
&gt; print &quot;Boa noite\n&quot; if day == noite;<br>
&gt;<br>
&gt; Bom pessoal como vocês disseram que não é bom usar Expressões Regulares para<br>
&gt; extrair conteúdo HTML, e pelo que vi no manual do WWW::Mechanize, porém eu<br>
&gt; não consigo extrair com a mesma eficácia.<br>
&gt;<br>
&gt; Essa parte do código:<br>
&gt;<br>
&gt; &nbsp; &nbsp; foreach ( split(&quot;\n&quot;,$data-&gt;content()) ) {<br>
&gt; &nbsp; &nbsp; &nbsp; &nbsp; if ( m{&lt;/strong&gt;&lt;br&gt;&lt;i&gt; &nbsp;\( &nbsp;(.+?) &nbsp;\) &nbsp;&lt;/i&gt;&lt;/td&gt;}igx ) {<br>
&gt; &nbsp; &nbsp; &nbsp; &nbsp; push(@filmes,$1);<br>
&gt;<br>
&gt; Quero usar o WWW::Mechanize para extrair essa parte.<br>
&gt; Olhei os exemplos do WWW::Mechanize:<br>
&gt; <a href="http://search.cpan.org/%7Epetdance/WWW-Mechanize-1.34/lib/WWW/Mechanize/Examples.pod" target="_blank">http://search.cpan.org/~petdance/WWW-Mechanize-1.34/lib/WWW/Mechanize/Examples.pod</a><br>
&gt; e vi que o autor usou Expressões Regulares para extrair:<br>
&gt; @bits = $r =~ m{&lt;TD.*?&gt;(.*?)&lt;/TD&gt;}gs;<br>
&gt;<br>
&gt; O meu projeto abaixo:<br>
&gt;<br>
&gt;<br>
&gt; #!/usr/bin/perl<br>
&gt;<br>
&gt; use strict;<br>
&gt; use warnings;<br>
&gt; use WWW::Mechanize;<br>
&gt; use WWW::Search::Mininova;<br>
&gt;<br>
&gt; {package Hgtorrent;<br>
&gt;<br>
&gt; sub Nomes<br>
&gt; &nbsp;{<br>
&gt; &nbsp;my $self = shift;<br>
&gt; &nbsp;my @filmes = ();<br>
&gt; &nbsp;my $data = WWW::Mechanize-&gt;new();<br>
&gt; &nbsp;$data-&gt;get(&#39;<a href="http://www.hgcinema.com.br/programacao/index.php%27" target="_blank">http://www.hgcinema.com.br/programacao/index.php&#39;</a>);<br>
&gt; &nbsp; &nbsp; foreach ( split(&quot;\n&quot;,$data-&gt;content()) ) {<br>
&gt; &nbsp; &nbsp; &nbsp; &nbsp; if ( m{&lt;/strong&gt;&lt;br&gt;&lt;i&gt; &nbsp;\( &nbsp;(.+?) &nbsp;\) &nbsp;&lt;/i&gt;&lt;/td&gt;}igx ) {<br>
&gt; &nbsp; &nbsp; &nbsp; &nbsp; push(@filmes,$1);<br>
&gt; &nbsp; &nbsp; &nbsp; &nbsp; }<br>
&gt; &nbsp; &nbsp; }<br>
&gt; &nbsp;return @filmes;<br>
&gt; &nbsp;}<br>
&gt;<br>
&gt; sub Procurar<br>
&gt; &nbsp;{<br>
&gt; &nbsp;my $self = shift;<br>
&gt; &nbsp;my $busca = shift;<br>
&gt; &nbsp;my $mini = WWW::Search::Mininova-&gt;new( category =&gt; &#39;Movies&#39;,sort =&gt; &#39;Seeds&#39;<br>
&gt; ,);<br>
&gt; &nbsp;$mini-&gt;search(&quot;$busca&quot;);<br>
&gt; &nbsp;my $result = $mini-&gt;result;<br>
&gt; &nbsp; &nbsp; if (defined $result-&gt;{name}) {<br>
&gt; &nbsp; &nbsp; print &quot;Name: &quot;, $result-&gt;{name},$/,<br>
&gt; &nbsp; &nbsp; &quot;Seeds: &quot;, $result-&gt;{seeds},$/,<br>
&gt; &nbsp; &nbsp; &quot;Leechers: &quot;, $result-&gt;{leechers},$/,<br>
&gt; &nbsp; &nbsp; &quot;Uri: &quot;, $result-&gt;{uri},$/,<br>
&gt; &nbsp; &nbsp; &quot;Download uri: &quot;, $result-&gt;{download_uri},$/,<br>
&gt; &nbsp; &nbsp; &quot;Size: &quot;, $result-&gt;{size},$/,<br>
&gt; &nbsp; &nbsp; &quot;Category: &quot;, $result-&gt;{category},$/,<br>
&gt; &nbsp; &nbsp; &quot;Sub Category: &quot;, $result-&gt;{subcategory},$/,<br>
&gt; &nbsp; &nbsp; &quot;Added data: &quot; ,$result-&gt;{added_date},$/;<br>
&gt; &nbsp; &nbsp; &nbsp;}<br>
&gt; &nbsp; &nbsp; else {<br>
&gt; &nbsp; &nbsp; print &quot;Not Found\n&quot;;<br>
&gt; &nbsp; &nbsp; }<br>
&gt; &nbsp;}<br>
&gt;<br>
&gt;<br>
&gt; }<br>
&gt;<br>
&gt; -D-----&gt; Abraço<br>
&gt; --<br>
&gt; print<br>
&gt; &quot;\x54\x68\x65\x20\x53\x69\x6c\x65\x6e\x74\x20\x47\x75\x61\x72\x64\x69\x61\x6e&quot;,$/<br>
&gt;<br>
</div></div>&gt; _______________________________________________<br>
&gt; SaoPaulo-pm mailing list<br>
&gt; <a href="mailto:SaoPaulo-pm@pm.org" target="_blank">SaoPaulo-pm@pm.org</a><br>
&gt; <a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a><br>
&gt;<br>
_______________________________________________<br>
SaoPaulo-pm mailing list<br>
<a href="mailto:SaoPaulo-pm@pm.org" target="_blank">SaoPaulo-pm@pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a><br>
</blockquote></div><br><br clear="all"><br>-- <br>print &quot;\x54\x68\x65\x20\x53\x69\x6c\x65\x6e\x74\x20\x47\x75\x61\x72\x64\x69\x61\x6e&quot;,$/<br>
</div>