Stain, então já da uma dica do Text::CSV_XS<div><br></div><div>Deixa o <meta http-equiv="content-type" content="text/html; charset=utf-8"><span class="Apple-style-span" style="border-collapse: collapse; font-family: arial, sans-serif; font-size: 13px; ">Spreadsheet::ParseExcel e o Spreadsheet::XLSX, pois geralmente não há muito material sobre como ler o XLSX (o SimpleXLSX é lento demais)</span></div>

<div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;"><br></span></font></div><div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;">Estou escrevendo o artigo do PDF, porém, estou usando um PDF de exemplo do INPA (</span></font><span class="Apple-style-span" style="border-collapse: collapse; font-family: arial, sans-serif; ">L</span><span class="Apple-style-span" style="border-collapse: collapse; font-family: arial, sans-serif; font-size: 13px; white-space: nowrap; -webkit-border-horizontal-spacing: 2px; -webkit-border-vertical-spacing: 2px; "><a title="http://www.inpa.gov.br/internas/coad/lista_telefonica_2009-2010-2.pdf" href="https://www.google.com/history/url?url=http://www.inpa.gov.br/internas/coad/lista_telefonica_2009-2010-2.pdf&amp;ei=tn5iTbv6MZvvoAfXl4SEBA&amp;sig2=4uCo1cQ1t7TkJ7r5BnZ8uA&amp;ct=w" id="bkmk_href_8-0" style="font-family: arial, sans-serif; color: rgb(0, 0, 204); ">I</a></span><span class="Apple-style-span" style="border-collapse: collapse; font-family: arial, sans-serif; font-size: 13px; white-space: nowrap; -webkit-border-horizontal-spacing: 2px; -webkit-border-vertical-spacing: 2px; "><a title="http://www.inpa.gov.br/internas/coad/lista_telefonica_2009-2010-2.pdf" href="https://www.google.com/history/url?url=http://www.inpa.gov.br/internas/coad/lista_telefonica_2009-2010-2.pdf&amp;ei=tn5iTbv6MZvvoAfXl4SEBA&amp;sig2=4uCo1cQ1t7TkJ7r5BnZ8uA&amp;ct=w" id="bkmk_href_8-0" style="font-family: arial, sans-serif; color: rgb(0, 0, 204); ">STA TELEFÔNICA DO INPA 2009/2010</a></span><span class="Apple-style-span" style="border-collapse: collapse; font-family: arial, sans-serif; "> <a href="http://goo.gl/1rrEL">http://goo.gl/1rrEL</a> ), e talvez tenha algum PDF </span><span class="Apple-style-span" style="border-collapse: collapse; font-family: arial, sans-serif; ">melhor</span><span class="Apple-style-span" style="border-collapse: collapse; font-family: arial, sans-serif; "> que o Thiago citou na campus party, assim já entra mais ainda no tema de OpenData</span></div>

<meta http-equiv="content-type" content="text/html; charset=utf-8"><meta http-equiv="content-type" content="text/html; charset=utf-8"><meta http-equiv="content-type" content="text/html; charset=utf-8"><meta http-equiv="content-type" content="text/html; charset=utf-8"><div>

<br><div class="gmail_quote">2011/2/21 Stanislaw Pusep <span dir="ltr">&lt;<a href="mailto:creaktive@gmail.com">creaktive@gmail.com</a>&gt;</span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

Deixa o Text::CSV comigo ;)<br clear="all"><br>ABS()<br><br>
<br><br><div class="gmail_quote">2011/2/21 Lindolfo Lorn Rodrigues <span dir="ltr">&lt;<a href="http://lorn.br" target="_blank">lorn.br</a>@<a href="http://gmail.com" target="_blank">gmail.com</a>&gt;</span><div><div></div>

<div class="h5"><br><blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204, 204, 204);padding-left:1ex">

Ei, eu já tinha me comprometido com um artigo comparando o Curl , LWP e Mechanize.<div>Não sei porque não tá na lista :) <br><br><div class="gmail_quote">2011/2/21 Thiago Rondon <span dir="ltr">&lt;<a href="mailto:thiago@aware.com.br" target="_blank">thiago@aware.com.br</a>&gt;</span><div>



<div></div><div><br>
<blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204, 204, 204);padding-left:1ex"><br>
Olá Pessoal,<br>
<br>
Daqui 8 dias começa o nosso evento equinócio, que tem como principal proposta gerar conteúdo na lingua portuguesa sobre a linguagem Perl.<br>
<br>
E eu estou sentindo a falta de alguns artigos, como por exemplo REGEX. Falar sobre extração de dados, arquivos e não termos nenhum artigo sobre a pcre esta me soando estranho ! Não temos nenhum voluntário para isto ? Isto é uma das nossas ferramentas mais usadas, não só na linguagem Perl, como em vários outras que suportam a pcre, ou seja este artigo pode ser uma referencia para vários programadores de diversas linguagens.<br>





<br>
Outro artigo que estou sentindo falta é do Text::CSV, muitos dados públicos estão sendo distribuídos através deste formato, e não há muito mistério para efetuar uma abordagem em relação a ele.<br>
<br>
Infelizmente o governo divulga dados em Excel também, e existe um módulo muito interessante em Perl que talvez alguns da lista já tenham experiência, como o Spreadsheet::ParseExcel[::Simple].<br>
<br>
Nós temos mais de uma maneira de buscar dados, como por exemplo com lwp, mecanize e Curl (né Lorn ?) :) Seria interessante abordar estas ferramentas de maneira geral e explicar o objetivo de cada um deles, e qual o nicho de utilização deles.<br>





<br>
Uma outra abordagem interessante, é que muita gente quer escrever &quot;scripts&quot; para enviar informações para redes sociais, como o twitter ou mesmo por RSS e o nosso repositório esta farto de módulos como este.<br>





<br>
Ah! E sobre XPATH ? Esta linguagem tem uma abordagem simples, porém muito útil e que facilita a vida de muitos desenvolvedores que irão buscar dados em sites que não sabem ainda o que são formatos abertos. Existe muitos módulos no CPAN sobre XPATH, uns para casos simples e outros para casos mais avançados, seria interessante abordar qualquer um deles.<br>





<br>
Além de sentir a falta de alguns artigos, estou sentindo a falta da colaboração de algumas pessoas da lista. :-)<br>
<br>
Eu tomei a liberdade de enviar este e-mail conversando com o Marcio Ferreira, e ele me passou a lista de pessoas que estão confirmadas para escrever:<br>
<br>
- Por que Perl ? - Breno (Garu)<br>
- Introdução ao Open-Data - Thiago Rondon (Maluco)<br>
- Open-Data BR - Alexei (Russoz)<br>
- Extraindo informação de PDF - Renato Santos (Cron)<br>
- Comparaçao de Strings - Wesley Blabos<br>
- XML Schema - Eden Cardin<br>
- Mongoose (MongoDB + Moose) - Solli Honório<br>
- KinoSearch (Search Engine) - Marcio Ferreira<br>
- Perl e Unicode (entre outras codificações de texto) - Stanislaw Pusep<br>
- Extração de dados com xpath e regex Exportando em ODF - Millen (extreme)<br>
- Scraping web com Perl - Marcio Ferreira<br>
- HTTPS - Gabriel Andrade<br>
- Divertindo-se com Daemons - Daniel Mantovani.<br>
- Distribuindo com RDF e encontrando com o SPARQL - Thiago Rondon.<br>
<br>
Abs!<br>
-Thiago Rondon<br>
<br>
<br>
=begin disclaimer<br>
  Sao Paulo Perl Mongers: <a href="http://sao-paulo.pm.org/" target="_blank">http://sao-paulo.pm.org/</a><br>
SaoPaulo-pm mailing list: <a href="mailto:SaoPaulo-pm@pm.org" target="_blank">SaoPaulo-pm@pm.org</a><br>
L&lt;<a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a>&gt;<br>
=end disclaimer<br>
</blockquote></div></div></div><br><br clear="all"><br>-- <br>lorn at lornlab dot org<br>Lindolfo &quot;Lorn&quot; Rodrigues<br><br>
</div>
<br>=begin disclaimer<br>
   Sao Paulo Perl Mongers: <a href="http://sao-paulo.pm.org/" target="_blank">http://sao-paulo.pm.org/</a><br>
 SaoPaulo-pm mailing list: <a href="mailto:SaoPaulo-pm@pm.org" target="_blank">SaoPaulo-pm@pm.org</a><br>
 L&lt;<a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a>&gt;<br>
=end disclaimer<br>
<br></blockquote></div></div></div><br>
<br>=begin disclaimer<br>
   Sao Paulo Perl Mongers: <a href="http://sao-paulo.pm.org/" target="_blank">http://sao-paulo.pm.org/</a><br>
 SaoPaulo-pm mailing list: <a href="mailto:SaoPaulo-pm@pm.org">SaoPaulo-pm@pm.org</a><br>
 L&lt;<a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a>&gt;<br>
=end disclaimer<br>
<br></blockquote></div><br><br clear="all"><br>-- <br>Renato Santos<br><a href="http://www.renatocron.com/blog/" target="_blank">http://www.renatocron.com/blog/</a><br>
</div>