[SP-pm] Equinócio: 8 dias !

Renato Santos renato.cron at gmail.com
Mon Feb 21 07:05:26 PST 2011


Stain, então já da uma dica do Text::CSV_XS

Deixa o Spreadsheet::ParseExcel e o Spreadsheet::XLSX, pois geralmente não
há muito material sobre como ler o XLSX (o SimpleXLSX é lento demais)

Estou escrevendo o artigo do PDF, porém, estou usando um PDF de exemplo do
INPA (LI<https://www.google.com/history/url?url=http://www.inpa.gov.br/internas/coad/lista_telefonica_2009-2010-2.pdf&ei=tn5iTbv6MZvvoAfXl4SEBA&sig2=4uCo1cQ1t7TkJ7r5BnZ8uA&ct=w>STA
TELEFÔNICA DO INPA
2009/2010<https://www.google.com/history/url?url=http://www.inpa.gov.br/internas/coad/lista_telefonica_2009-2010-2.pdf&ei=tn5iTbv6MZvvoAfXl4SEBA&sig2=4uCo1cQ1t7TkJ7r5BnZ8uA&ct=w>
 http://goo.gl/1rrEL ), e talvez tenha algum PDF melhor que o Thiago citou
na campus party, assim já entra mais ainda no tema de OpenData

2011/2/21 Stanislaw Pusep <creaktive at gmail.com>

> Deixa o Text::CSV comigo ;)
>
> ABS()
>
>
>
> 2011/2/21 Lindolfo Lorn Rodrigues <lorn.br at gmail.com>
>
> Ei, eu já tinha me comprometido com um artigo comparando o Curl , LWP e
>> Mechanize.
>> Não sei porque não tá na lista :)
>>
>> 2011/2/21 Thiago Rondon <thiago at aware.com.br>
>>
>>
>>> Olá Pessoal,
>>>
>>> Daqui 8 dias começa o nosso evento equinócio, que tem como principal
>>> proposta gerar conteúdo na lingua portuguesa sobre a linguagem Perl.
>>>
>>> E eu estou sentindo a falta de alguns artigos, como por exemplo REGEX.
>>> Falar sobre extração de dados, arquivos e não termos nenhum artigo sobre a
>>> pcre esta me soando estranho ! Não temos nenhum voluntário para isto ? Isto
>>> é uma das nossas ferramentas mais usadas, não só na linguagem Perl, como em
>>> vários outras que suportam a pcre, ou seja este artigo pode ser uma
>>> referencia para vários programadores de diversas linguagens.
>>>
>>> Outro artigo que estou sentindo falta é do Text::CSV, muitos dados
>>> públicos estão sendo distribuídos através deste formato, e não há muito
>>> mistério para efetuar uma abordagem em relação a ele.
>>>
>>> Infelizmente o governo divulga dados em Excel também, e existe um módulo
>>> muito interessante em Perl que talvez alguns da lista já tenham experiência,
>>> como o Spreadsheet::ParseExcel[::Simple].
>>>
>>> Nós temos mais de uma maneira de buscar dados, como por exemplo com lwp,
>>> mecanize e Curl (né Lorn ?) :) Seria interessante abordar estas ferramentas
>>> de maneira geral e explicar o objetivo de cada um deles, e qual o nicho de
>>> utilização deles.
>>>
>>> Uma outra abordagem interessante, é que muita gente quer escrever
>>> "scripts" para enviar informações para redes sociais, como o twitter ou
>>> mesmo por RSS e o nosso repositório esta farto de módulos como este.
>>>
>>> Ah! E sobre XPATH ? Esta linguagem tem uma abordagem simples, porém muito
>>> útil e que facilita a vida de muitos desenvolvedores que irão buscar dados
>>> em sites que não sabem ainda o que são formatos abertos. Existe muitos
>>> módulos no CPAN sobre XPATH, uns para casos simples e outros para casos mais
>>> avançados, seria interessante abordar qualquer um deles.
>>>
>>> Além de sentir a falta de alguns artigos, estou sentindo a falta da
>>> colaboração de algumas pessoas da lista. :-)
>>>
>>> Eu tomei a liberdade de enviar este e-mail conversando com o Marcio
>>> Ferreira, e ele me passou a lista de pessoas que estão confirmadas para
>>> escrever:
>>>
>>> - Por que Perl ? - Breno (Garu)
>>> - Introdução ao Open-Data - Thiago Rondon (Maluco)
>>> - Open-Data BR - Alexei (Russoz)
>>> - Extraindo informação de PDF - Renato Santos (Cron)
>>> - Comparaçao de Strings - Wesley Blabos
>>> - XML Schema - Eden Cardin
>>> - Mongoose (MongoDB + Moose) - Solli Honório
>>> - KinoSearch (Search Engine) - Marcio Ferreira
>>> - Perl e Unicode (entre outras codificações de texto) - Stanislaw Pusep
>>> - Extração de dados com xpath e regex Exportando em ODF - Millen
>>> (extreme)
>>> - Scraping web com Perl - Marcio Ferreira
>>> - HTTPS - Gabriel Andrade
>>> - Divertindo-se com Daemons - Daniel Mantovani.
>>> - Distribuindo com RDF e encontrando com o SPARQL - Thiago Rondon.
>>>
>>> Abs!
>>> -Thiago Rondon
>>>
>>>
>>> =begin disclaimer
>>>  Sao Paulo Perl Mongers: http://sao-paulo.pm.org/
>>> SaoPaulo-pm mailing list: SaoPaulo-pm at pm.org
>>> L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
>>> =end disclaimer
>>>
>>
>>
>>
>> --
>> lorn at lornlab dot org
>> Lindolfo "Lorn" Rodrigues
>>
>>
>> =begin disclaimer
>>   Sao Paulo Perl Mongers: http://sao-paulo.pm.org/
>>  SaoPaulo-pm mailing list: SaoPaulo-pm at pm.org
>>  L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
>> =end disclaimer
>>
>>
>
> =begin disclaimer
>   Sao Paulo Perl Mongers: http://sao-paulo.pm.org/
>  SaoPaulo-pm mailing list: SaoPaulo-pm at pm.org
>  L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
> =end disclaimer
>
>


-- 
Renato Santos
http://www.renatocron.com/blog/
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://mail.pm.org/pipermail/saopaulo-pm/attachments/20110221/0192e5f6/attachment.html>


More information about the SaoPaulo-pm mailing list