Regexp é bom, pode funcionar, mas se muda uma coisinha no site, ou, se tem uma parte do html que você não viu, ou essa parte só aparece sexta-feira 13. você tem que ficar criando regexp monstruosa cheios de ou ( igual minha frase lá em cima :P ), você conhece o HTML::TreeBuilder?, ele é bem chatinho, mais depois que você acostuma você consegue dizer bem pra ele o que você quer.
<br><br><div><span class="gmail_quote">On 2/1/07, <b class="gmail_sendername">roan Brasil</b> &lt;<a href="mailto:roanbrasil@gmail.com">roanbrasil@gmail.com</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Lembrem-se quero que seja com REGEX.<br><br><div><span class="gmail_quote">Em 01/02/07, <b class="gmail_sendername">roan Brasil</b> &lt;<a href="mailto:roanbrasil@gmail.com" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">
roanbrasil@gmail.com</a>&gt; escreveu:</span><div><span class="e" id="q_1107ebf65852c200_1"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

<pre>&lt;<span>TR</span><span> valign</span>=<span>top</span>&gt; &lt;<span>TD</span><span> bgcolor</span><br>=<span>&quot;#336699&quot;</span>&gt; &lt;<span>SELECT</span><span> NAME</span>=<span>&quot;arg3&quot; </span>
<span>
<br>size</span>=<span>&quot;1&quot;</span>&gt;<br>&lt;<span>OPTION</span><span> VALUE</span>=<span>&quot;all&quot;</span>&gt;escolha aqui! &gt;&gt;&lt;/<br><span>OPTION</span>&gt;<br>&lt;<span>OPTION</span><span> VALUE</span>

=<span>&quot;Acao&quot;</span>&gt;Ação&lt;/<span>OPTION<br></span>&gt;<br>&lt;<span>OPTION</span><span> VALUE</span>=<span>&quot;Acessorios&quot;</span>&gt;Acessórios&lt;/<span>OPTION</span>&gt;<br>&lt;<br><span>OPTION</span>

<span> VALUE</span>=<span>&quot;Musica Brasileira&quot;</span>&gt;Musica BR&lt;/<span>OPTION</span>&gt;<br>&lt;<span><br>OPTION</span><span> VALUE</span>=<span>&quot;Musical&quot;</span>&gt;Musicais&lt;/<span>OPTION</span>

&gt;<br>&lt;<span>OPTION</span><span><br> VALUE</span>=<span>&quot;Musica&quot;</span>&gt;Música Clássica&lt;/<span>OPTION</span>&gt;<br>&lt;<span>OPTION</span><span> VALUE</span>=<span><br>&quot;NewAge&quot;</span>&gt;New Age&lt;/
<br><span>OPTION</span>&gt;<br>&lt;<span>OPTION</span><span> VALUE</span>=<span>&quot;Opera&quot;</span><br>&gt;Ópera&lt;/<span>OPTION</span>&gt;<br>&lt;<span>OPTION</span><span> VALUE</span>=<span>&quot;Policial&quot;</span>

&gt;Policial&lt;/<span><br>OPTION</span>&gt;<br>&lt;<span>OPTION</span><span> VALUE</span>=<span>&quot;PopRock&quot;</span>&gt;Pop-Rock-Shows&lt;/<span>OPTION</span>&gt;<br><br>&lt;<span>OPTION</span><span> VALUE</span>=
<span>
&quot;RENTAL&quot;</span>&gt;Para Locação&lt;/<span>OPTION</span>&gt;<br>&lt;<span><br>OPTION</span><span> VALUE</span>=<span>&quot;RENTAL&quot;</span>&gt;Rental&lt;/<span>OPTION</span>&gt;<br>&lt;<span>OPTION</span><span>

<br> VALUE</span>=<span>&quot;Romance&quot;</span>&gt;Romance&lt;/<span>OPTION</span>&gt;<br>&lt;<span>OPTION</span><span> VALUE</span>=<span><br>&quot;Sertanejo&quot;</span>&gt;Sertanejo&lt;/<span>OPTION</span>&gt;<br>&lt;
<br><span>OPTION</span><span> VALUE</span>=<span>&quot;Suspense&quot;<br></span>&gt;Suspense&lt;/<span>OPTION</span>&gt;<br>&lt;<span>OPTION</span><span> VALUE</span>=<span>&quot;Terror&quot;</span>&gt;Terror&lt;/<br><span>
OPTION<br></span>&gt;<br>&lt;<span>OPTION</span><span> VALUE</span>=<span>&quot;Western&quot;</span>&gt;Western&lt;/<span><br>OPTION</span>&gt;<br>&lt;<span>OPTION</span><span> VALUE</span>=<span>&quot;&quot;</span>&gt;&lt;/
<span>OPTION<br></span>&gt;<br>&lt;/select&gt;<br><br><br><br>----8&lt;----------8&lt;---- HTML ACIMA ------8&lt;--------8&lt;-------<br><br>Galera como faço para pegar todos os VALUE com exceção dos que estão <span style="font-weight: bold;">

vazio</span> e o que tem valor <br><span style="font-weight: bold;">all<br><br>Alguém help me?<br></span></pre><br>-- <br>Atenciosamente,<br><br>Roan Brasil Monteiro<br>Presidente do Rotaract Club Lauro de Freitas D4550<br>

Gestão 2006/2007<br>________________________________
<br>*-*,*-*,*-*,*-*,*-*,*-*,*-*,*-*,*-*,*-*<br>Faculdade UNIME<br><a href="http://www.unime.com.br" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">www.unime.com.br</a><br>BSI - Bacharelado de Sistema de Informação
<br>Roan Brasil Monteiro <br>_____________________<br>*-*,*-*,*-*,*-*,*-*,*-*,*-*,*-*,*-*,*-*
<br><br>&quot;NA LUTA ENTRE BATMAN E PINGÜIM,<br>EU SOU MAIS O PINGÜIM...&quot; by Roan<br>____<br> °v°&nbsp;&nbsp; NÃO USE DROGAS,<br>/(_)\&nbsp;&nbsp;USE GNU/LINUX<br> ^ ^<br>Por que ver o MUNDO através de &#39;janelas&#39;<br>Se você pode usar portas.
<br><br>&quot;Software Livre:<br>&nbsp;&nbsp;&nbsp;&nbsp;Socialmente Justo,<br>&nbsp;&nbsp;&nbsp;&nbsp;Economicamente Viável,<br>&nbsp;&nbsp;&nbsp;&nbsp;Tecnologicamente Sustentável&quot;
</blockquote></span></div></div><div><span class="e" id="q_1107ebf65852c200_3"><br><br clear="all"><br>-- <br>Atenciosamente,<br><br>Roan Brasil Monteiro<br>Presidente do Rotaract Club Lauro de Freitas D4550<br>Gestão 2006/2007
<br>________________________________<br>*-*,*-*,*-*,*-*,*-*,*-*,*-*,*-*,*-*,*-*
<br>Faculdade UNIME<br><a href="http://www.unime.com.br" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">www.unime.com.br</a><br>BSI - Bacharelado de Sistema de Informação<br>Roan Brasil Monteiro <br>
_____________________<br>*-*,*-*,*-*,*-*,*-*,*-*,*-*,*-*,*-*,*-*<br><br>
&quot;NA LUTA ENTRE BATMAN E PINGÜIM,<br>EU SOU MAIS O PINGÜIM...&quot; by Roan<br>____<br> °v°&nbsp;&nbsp; NÃO USE DROGAS,<br>/(_)\&nbsp;&nbsp;USE GNU/LINUX<br> ^ ^<br>Por que ver o MUNDO através de &#39;janelas&#39;<br>Se você pode usar portas.
<br><br>&quot;Software Livre:<br>&nbsp;&nbsp;&nbsp;&nbsp;Socialmente Justo,<br>&nbsp;&nbsp;&nbsp;&nbsp;Economicamente Viável,<br>&nbsp;&nbsp;&nbsp;&nbsp;Tecnologicamente Sustentável&quot;
</span></div><br>_______________________________________________<br>Cascavel-pm mailing list<br><a onclick="return top.js.OpenExtLink(window,event,this)" href="mailto:Cascavel-pm@pm.org">Cascavel-pm@pm.org</a><br><a onclick="return top.js.OpenExtLink(window,event,this)" href="http://mail.pm.org/mailman/listinfo/cascavel-pm" target="_blank">
http://mail.pm.org/mailman/listinfo/cascavel-pm</a><br></blockquote></div><br><br clear="all"><br>-- <br>Lindolfo &quot;Lorn&quot; Rodrigues<br>- <a href="http://www.slackwarezine.com.br">www.slackwarezine.com.br</a><br>- 
<a href="http://lornlab.org">http://lornlab.org</a><br>- <a href="http://sao-paulo.pm.org">http://sao-paulo.pm.org</a><br>use Catalyst;