[SP-pm] RES: SaoPaulo-pm Digest, Vol 93, Issue 2

Renato Santos renato.cron at gmail.com
Fri Jun 1 07:53:24 PDT 2012


então acho mais fácil tentar converter o PDF para texto e depois encontrar
o padrão nesse texto e montar o PDF.

Ferramentas:

http://linux.die.net/man/1/pdftotext

ainda não cheguei a usar o
*PDF::OCR2<http://search.cpan.org/~leocharre/PDF-OCR2-1.21/lib/PDF/OCR2.pod>,
mas pode ser util pra você*

para escrever o PDF, tem o
*Spreadsheet::Write*<http://search.cpan.org/~amaltsev/Spreadsheet-Write-0.03/lib/Spreadsheet/Write.pm>


2012/6/1 Juliano Silva <julianosilva at metroman.com.br>

> Olá Daniel,
>
> É uma conta telefônica de celular.
> O projeto é converter os arquivos que veem em PDF para Excel, para que o
> setor financeiro possa cobrar dos usuários as chamadas que não são
> corporativas.
>
>
> Juliano Dantas Almeida Silva
> Consórcio Metroman
>
> -----Mensagem original-----
> De: saopaulo-pm-bounces+juliano.dantas=gmail.com at pm.org
> [mailto:saopaulo-pm-bounces+juliano.dantas=gmail.com at pm.org] Em nome de
> saopaulo-pm-request at pm.org
> Enviada em: sexta-feira, 1 de junho de 2012 11:22
> Para: saopaulo-pm at pm.org
> Assunto: SaoPaulo-pm Digest, Vol 93, Issue 2
>
> Send SaoPaulo-pm mailing list submissions to
>        saopaulo-pm at pm.org
>
> To subscribe or unsubscribe via the World Wide Web, visit
>        http://mail.pm.org/mailman/listinfo/saopaulo-pm
> or, via email, send a message with subject or body 'help' to
>        saopaulo-pm-request at pm.org
>
> You can reach the person managing the list at
>        saopaulo-pm-owner at pm.org
>
> When replying, please edit your Subject line so it is more specific than
> "Re: Contents of SaoPaulo-pm digest..."
>
>
> Today's Topics:
>
>   1. RES: SaoPaulo-pm Digest, Vol 93, Issue 1 (Juliano Silva)
>   2. Re: modulo perl para convers?o de PDF para Excel
>      (Daniel Vinciguerra)
>   3. Re: modulo perl para convers?o de PDF para Excel
>      (Daniel Vinciguerra)
>
>
> ----------------------------------------------------------------------
>
> Message: 1
> Date: Fri, 1 Jun 2012 10:20:16 -0300
> From: "Juliano Silva" <julianosilva at metroman.com.br>
> To: <saopaulo-pm at pm.org>
> Subject: [SP-pm] RES: SaoPaulo-pm Digest, Vol 93, Issue 1
> Message-ID: <006f01cd3ff9$49067920$db136b60$@com.br>
> Content-Type: text/plain;       charset="iso-8859-1"
>
> Obrigado pela informa??o. Eu j? consigo converter para TXT.
>
>
> Juliano Dantas Almeida Silva
> Cons?rcio Metroman
>
> -----Mensagem original-----
> De: saopaulo-pm-bounces+juliano.dantas=gmail.com at pm.org
> [mailto:saopaulo-pm-bounces+juliano.dantas=gmail.com at pm.org] Em nome de
> saopaulo-pm-request at pm.org Enviada em: sexta-feira, 1 de junho de 2012
> 10:06
> Para: saopaulo-pm at pm.org
> Assunto: SaoPaulo-pm Digest, Vol 93, Issue 1
>
> Send SaoPaulo-pm mailing list submissions to
>        saopaulo-pm at pm.org
>
> To subscribe or unsubscribe via the World Wide Web, visit
>        http://mail.pm.org/mailman/listinfo/saopaulo-pm
> or, via email, send a message with subject or body 'help' to
>        saopaulo-pm-request at pm.org
>
> You can reach the person managing the list at
>        saopaulo-pm-owner at pm.org
>
> When replying, please edit your Subject line so it is more specific than
> "Re: Contents of SaoPaulo-pm digest..."
>
>
> Today's Topics:
>
>   1. Re: [Rio-pm] vari?vel $^H no Perl 5.16 (Stanislaw Pusep)
>   2. modulo perl para convers?o de PDF para Excel (Juliano Silva)
>   3. Re: modulo perl para convers?o de PDF para Excel (Renato Santos)
>   4. Re: modulo perl para convers?o de PDF para Excel (Renato Santos)
>
>
> ----------------------------------------------------------------------
>
> Message: 1
> Date: Thu, 31 May 2012 16:03:43 -0300
> From: Stanislaw Pusep <creaktive at gmail.com>
> To: Perl Mongers Rio de Janeiro <rio-pm at pm.org>
> Cc: saopaulo-pm at mail.pm.org
> Subject: Re: [SP-pm] [Rio-pm] vari?vel $^H no Perl 5.16
> Message-ID:
>        <CANgJoAA3rC6mqHcFLJkZkjApStVh37KTgxh4iWtOVz6Z1EXZ8Q at mail.gmail.com
> >
> Content-Type: text/plain; charset="utf-8"
>
> Pelo que consegui entender at? agora, o arquivo respons?vel pelo pragma
> "feature" n?o ? mais mantido manualmente; tem um script que o faz
> "automagicamente":
>
> $ head ~/perl5/perlbrew/build/perl-5.16.0/regen/feature.pl
> #!/usr/bin/perl
> #
> # Regenerate (overwriting only if changed):
> #
> #    lib/feature.pm
> #    feature.h
> #
> # from information hardcoded into this script and from two #defines # in
> perl.h.
> #
>
> ABS()
>
>
>
> On Thu, May 31, 2012 at 11:30 AM, Fernando Oliveira <
> fernandocorrea at gmail.com> wrote:
>
> > eu tb n?o sei, mas deve ter algo com isso:
> > http://search.cpan.org/dist/perl-5.16.0/pod/perldelta.pod#use_VERSION
> >
> >
> >
> > Just another Perl Hacker,
> > Fernando (SmokeMachine)
> >
> >
> > Em 31 de maio de 2012 11:09, Stanislaw Pusep
> <creaktive at gmail.com>escreveu:
> >
> >> 0x1c000000
> >
> >
> >
> > _______________________________________________
> > Rio-pm mailing list
> > Rio-pm at pm.org
> > http://mail.pm.org/mailman/listinfo/rio-pm
> >
> -------------- next part --------------
> An HTML attachment was scrubbed...
> URL:
> <
> http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120531/6c9f7e29/atta
> chment-0001.html>
>
> ------------------------------
>
> Message: 2
> Date: Fri, 1 Jun 2012 10:03:25 -0300
> From: "Juliano Silva" <julianosilva at metroman.com.br>
> To: <cascavel-pm at pm.org>,       <saopaulo-pm at pm.org>
> Subject: [SP-pm] modulo perl para convers?o de PDF para Excel
> Message-ID: <005c01cd3ff6$eeefcc90$cccf65b0$@com.br>
> Content-Type: text/plain; charset="iso-8859-1"
>
> Bom dia a todos !!!
>
>
>
> Algu?m pode informar se existe algum m?dulo que converte PDF para Excel ou
> se algu?m j? desenvolveu algo para esse fim?
>
>
>
> Grato,
>
>
>
> METROM~1
>
> Juliano Dantas Almeida Silva
>
> Cons?rcio Metroman
>
>
>
> -------------- next part --------------
> An HTML attachment was scrubbed...
> URL:
> <
> http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/f31939f0/atta
> chment-0001.html>
> -------------- next part --------------
> A non-text attachment was scrubbed...
> Name: not available
> Type: image/jpeg
> Size: 2284 bytes
> Desc: not available
> URL:
> <
> http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/f31939f0/atta
> chment-0001.jpe>
>
> ------------------------------
>
> Message: 3
> Date: Fri, 1 Jun 2012 10:05:56 -0300
> From: Renato Santos <renato.cron at gmail.com>
> To: saopaulo-pm at mail.pm.org
> Cc: saopaulo-pm at pm.org, cascavel-pm at pm.org
> Subject: Re: [SP-pm] modulo perl para convers?o de PDF para Excel
> Message-ID:
>        <CABmdQ_Tf9ZToc8Qu4ECPtzbFdUHdz8fs8pO0SAEhSjDhgOqG-g at mail.gmail.com
> >
> Content-Type: text/plain; charset="iso-8859-1"
>
> Cara,
>
> Voc? ter? que converter o PDF para texto, isso ?, se o PDF n?o for inteiro
> apenas uma imagem.
>
> E deposi de converter em textos, vc precisa "entender" o texto (via
> posi??es, sei l?, deus te ajude) e escrever no seu Excel do jeito que vc
> precisa.
>
>
> Acho que isso que voc? quer n?o existe!
>
> Esta quase no mesmo n?vel de "impossible" (exceto se for texto, voc? ter?
> que ler o PDF letra por letra e montar uma matrix virtual de onde ficaria
> cada letra) do "como abro essa imagem no word?"
>
> 2012/6/1 Juliano Silva <julianosilva at metroman.com.br>
>
> > Bom dia a todos !!!****
> >
> > ** **
> >
> > Algu?m pode informar se existe algum m?dulo que converte PDF para
> > Excel ou se algu?m j? desenvolveu algo para esse fim?****
> >
> > ** **
> >
> > Grato,****
> >
> > ** **
> >
> > [image: METROM~1]****
> >
> > *Juliano Dantas Almeida Silva*
> >
> > *Cons?rcio Metroman*
> >
> > ** **
> >
> > =begin disclaimer
> >   Sao Paulo Perl Mongers: http://sao-paulo.pm.org/  SaoPaulo-pm
> > mailing list: SaoPaulo-pm at pm.org
> > L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
> > =end disclaimer
> >
> >
>
>
> --
> Sarav?,
> Renato CRON
> http://www.renatocron.com/blog/
> @renato_cron <http://twitter.com/#!/renato_cron>
> -------------- next part --------------
> An HTML attachment was scrubbed...
> URL:
> <
> http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/b4c8c22d/atta
> chment-0001.html>
>
> ------------------------------
>
> Message: 4
> Date: Fri, 1 Jun 2012 10:05:56 -0300
> From: Renato Santos <renato.cron at gmail.com>
> To: saopaulo-pm at mail.pm.org
> Cc: saopaulo-pm at pm.org, cascavel-pm at pm.org
> Subject: Re: [SP-pm] modulo perl para convers?o de PDF para Excel
> Message-ID:
>        <CABmdQ_Tf9ZToc8Qu4ECPtzbFdUHdz8fs8pO0SAEhSjDhgOqG-g at mail.gmail.com
> >
> Content-Type: text/plain; charset="iso-8859-1"
>
> Cara,
>
> Voc? ter? que converter o PDF para texto, isso ?, se o PDF n?o for inteiro
> apenas uma imagem.
>
> E deposi de converter em textos, vc precisa "entender" o texto (via
> posi??es, sei l?, deus te ajude) e escrever no seu Excel do jeito que vc
> precisa.
>
>
> Acho que isso que voc? quer n?o existe!
>
> Esta quase no mesmo n?vel de "impossible" (exceto se for texto, voc? ter?
> que ler o PDF letra por letra e montar uma matrix virtual de onde ficaria
> cada letra) do "como abro essa imagem no word?"
>
> 2012/6/1 Juliano Silva <julianosilva at metroman.com.br>
>
> > Bom dia a todos !!!****
> >
> > ** **
> >
> > Algu?m pode informar se existe algum m?dulo que converte PDF para
> > Excel ou se algu?m j? desenvolveu algo para esse fim?****
> >
> > ** **
> >
> > Grato,****
> >
> > ** **
> >
> > [image: METROM~1]****
> >
> > *Juliano Dantas Almeida Silva*
> >
> > *Cons?rcio Metroman*
> >
> > ** **
> >
> > =begin disclaimer
> >   Sao Paulo Perl Mongers: http://sao-paulo.pm.org/  SaoPaulo-pm
> > mailing list: SaoPaulo-pm at pm.org
> > L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
> > =end disclaimer
> >
> >
>
>
> --
> Sarav?,
> Renato CRON
> http://www.renatocron.com/blog/
> @renato_cron <http://twitter.com/#!/renato_cron>
> -------------- next part --------------
> An HTML attachment was scrubbed...
> URL:
> <
> http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/b4c8c22d/atta
> chment-0002.html>
>
> ------------------------------
>
> _______________________________________________
> SaoPaulo-pm mailing list
> SaoPaulo-pm at pm.org
> http://mail.pm.org/mailman/listinfo/saopaulo-pm
>
> End of SaoPaulo-pm Digest, Vol 93, Issue 1
> ******************************************
>
>
>
> ------------------------------
>
> Message: 2
> Date: Fri, 1 Jun 2012 11:21:03 -0300
> From: Daniel Vinciguerra <dan.vinciguerra at gmail.com>
> To: saopaulo-pm at mail.pm.org
> Cc: saopaulo-pm at pm.org, cascavel-pm at pm.org
> Subject: Re: [SP-pm] modulo perl para convers?o de PDF para Excel
> Message-ID:
>        <CADoJa-Gkj2uyhF=vwk-MRb8UXhZCK_2=648SsY4B59_vJx0Bxg at mail.gmail.com
> >
> Content-Type: text/plain; charset="iso-8859-1"
>
> Voc? poderia nos dizer ou mostrar (caso a coisa seja feia), para nos poupar
> o trabalho de ficar imaginando qual a cara do seu PDF.
>
> Caso seja uma imagem, a coisa realmente vai ficar complicada... mas se ja
> tiver uma "carinha" de tabela eu acho que ? mais simples e possivel que o
> anterior.
>
> []'s
> *
> Daniel Vinciguerra*
> Web Solutions Architect and Co-Owner at Bivee
> http://github.com/dvinciguerra
> <http://github.com/dvinciguerra>
>
>
> 2012/6/1 Renato Santos <renato.cron at gmail.com>
>
> > Cara,
> >
> > Voc? ter? que converter o PDF para texto, isso ?, se o PDF n?o for
> > inteiro apenas uma imagem.
> >
> > E deposi de converter em textos, vc precisa "entender" o texto (via
> > posi??es, sei l?, deus te ajude) e escrever no seu Excel do jeito que
> > vc precisa.
> >
> >
> > Acho que isso que voc? quer n?o existe!
> >
> > Esta quase no mesmo n?vel de "impossible" (exceto se for texto, voc? ter?
> > que ler o PDF letra por letra e montar uma matrix virtual de onde
> > ficaria cada letra) do "como abro essa imagem no word?"
> >
> > 2012/6/1 Juliano Silva <julianosilva at metroman.com.br>
> >
> >>   Bom dia a todos !!!****
> >>
> >> ** **
> >>
> >> Algu?m pode informar se existe algum m?dulo que converte PDF para
> >> Excel ou se algu?m j? desenvolveu algo para esse fim?****
> >>
> >> ** **
> >>
> >> Grato,****
> >>
> >> ** **
> >>
> >> [image: METROM~1]****
> >>
> >> *Juliano Dantas Almeida Silva*
> >>
> >> *Cons?rcio Metroman*
> >>
> >> ** **
> >>
> >> =begin disclaimer
> >>   Sao Paulo Perl Mongers: http://sao-paulo.pm.org/  SaoPaulo-pm
> >> mailing list: SaoPaulo-pm at pm.org
> >> L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
> >> =end disclaimer
> >>
> >>
> >
> >
> > --
> > Sarav?,
> > Renato CRON
> >  http://www.renatocron.com/blog/
> > @renato_cron <http://twitter.com/#!/renato_cron>
> >
> >
> > =begin disclaimer
> >   Sao Paulo Perl Mongers: http://sao-paulo.pm.org/  SaoPaulo-pm
> > mailing list: SaoPaulo-pm at pm.org
> > L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
> > =end disclaimer
> >
> >
> -------------- next part --------------
> An HTML attachment was scrubbed...
> URL:
> <
> http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/5cccba23/atta
> chment-0001.html>
>
> ------------------------------
>
> Message: 3
> Date: Fri, 1 Jun 2012 11:21:03 -0300
> From: Daniel Vinciguerra <dan.vinciguerra at gmail.com>
> To: saopaulo-pm at mail.pm.org
> Cc: saopaulo-pm at pm.org, cascavel-pm at pm.org
> Subject: Re: [SP-pm] modulo perl para convers?o de PDF para Excel
> Message-ID:
>        <CADoJa-Gkj2uyhF=vwk-MRb8UXhZCK_2=648SsY4B59_vJx0Bxg at mail.gmail.com
> >
> Content-Type: text/plain; charset="iso-8859-1"
>
> Voc? poderia nos dizer ou mostrar (caso a coisa seja feia), para nos poupar
> o trabalho de ficar imaginando qual a cara do seu PDF.
>
> Caso seja uma imagem, a coisa realmente vai ficar complicada... mas se ja
> tiver uma "carinha" de tabela eu acho que ? mais simples e possivel que o
> anterior.
>
> []'s
> *
> Daniel Vinciguerra*
> Web Solutions Architect and Co-Owner at Bivee
> http://github.com/dvinciguerra
> <http://github.com/dvinciguerra>
>
>
> 2012/6/1 Renato Santos <renato.cron at gmail.com>
>
> > Cara,
> >
> > Voc? ter? que converter o PDF para texto, isso ?, se o PDF n?o for
> > inteiro apenas uma imagem.
> >
> > E deposi de converter em textos, vc precisa "entender" o texto (via
> > posi??es, sei l?, deus te ajude) e escrever no seu Excel do jeito que
> > vc precisa.
> >
> >
> > Acho que isso que voc? quer n?o existe!
> >
> > Esta quase no mesmo n?vel de "impossible" (exceto se for texto, voc? ter?
> > que ler o PDF letra por letra e montar uma matrix virtual de onde
> > ficaria cada letra) do "como abro essa imagem no word?"
> >
> > 2012/6/1 Juliano Silva <julianosilva at metroman.com.br>
> >
> >>   Bom dia a todos !!!****
> >>
> >> ** **
> >>
> >> Algu?m pode informar se existe algum m?dulo que converte PDF para
> >> Excel ou se algu?m j? desenvolveu algo para esse fim?****
> >>
> >> ** **
> >>
> >> Grato,****
> >>
> >> ** **
> >>
> >> [image: METROM~1]****
> >>
> >> *Juliano Dantas Almeida Silva*
> >>
> >> *Cons?rcio Metroman*
> >>
> >> ** **
> >>
> >> =begin disclaimer
> >>   Sao Paulo Perl Mongers: http://sao-paulo.pm.org/  SaoPaulo-pm
> >> mailing list: SaoPaulo-pm at pm.org
> >> L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
> >> =end disclaimer
> >>
> >>
> >
> >
> > --
> > Sarav?,
> > Renato CRON
> >  http://www.renatocron.com/blog/
> > @renato_cron <http://twitter.com/#!/renato_cron>
> >
> >
> > =begin disclaimer
> >   Sao Paulo Perl Mongers: http://sao-paulo.pm.org/  SaoPaulo-pm
> > mailing list: SaoPaulo-pm at pm.org
> > L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
> > =end disclaimer
> >
> >
> -------------- next part --------------
> An HTML attachment was scrubbed...
> URL:
> <
> http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/5cccba23/atta
> chment-0002.html>
>
> ------------------------------
>
> _______________________________________________
> SaoPaulo-pm mailing list
> SaoPaulo-pm at pm.org
> http://mail.pm.org/mailman/listinfo/saopaulo-pm
>
> End of SaoPaulo-pm Digest, Vol 93, Issue 2
> ******************************************
>
> =begin disclaimer
>   Sao Paulo Perl Mongers: http://sao-paulo.pm.org/
>  SaoPaulo-pm mailing list: SaoPaulo-pm at pm.org
>  L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
> =end disclaimer
>



-- 
Saravá,
Renato CRON
http://www.renatocron.com/blog/
@renato_cron <http://twitter.com/#!/renato_cron>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/cfd3eba1/attachment-0003.html>


More information about the SaoPaulo-pm mailing list