[Rio-pm] Comparação de arquivos

breno breno em rio.pm.org
Sábado Novembro 24 03:45:41 PST 2012


2012/11/24 Aureliano Guedes <guedes_1000 em hotmail.com>:
>
> Se não for ser muito chato, como faço para seguir a forma abaixo:
>
>
>> 2) trocar de abordagem, fazendo seu parser ler linha a linha (sem
>> modificar $/) e ir acumulando as linhas até encontrar um símbolo que
>> indique nova entrada.
>
> seria algo do tipo:
>
> while (<$fh>){
> if(/primeira linha/){
> print $_;
> }
> elsif (/ultima linha/){
> #sair do loop
> }
> else {
> print $_
> }
> }
>

Algo como (atenção, código não testado):

---------------8<---------------
my %dados = ();
my $mirna;
my $acumulador;

while (my $linha = <$fh>) {
   if ( $linha =~ m{tag magica (?<mirna>\S+)} ) {
      $dados{$mirna} = $acumulador if $mirna;
      $mirna = $+{mirna};
      $acumulador = q();
   }
   else {
      $acumulador .= $linha;
   }
}

use DDP; p %dados;

--------------->8---------------

O que isso faz (ou deveria fazer: já mencionei que não testei?
Programar a essa hora da manhã não é meu forte, então favor
desconsiderar qualquer besteira):

1) le o arquivo linha por linha, atribuindo o valor de cada linha a
$linha (sem usar $_)
2) sempre que encontrar a tag mágica que separa entradas (estou
assumindo que a tag indica um novo registro que pode ser chave do seu
hash de dados:
2.1) se já estiver com um registro em memória ($mirna), bota os dados
acumulados ($acumulador) dentro do hash;
2.2) atribui à $mirna o novo registro encontrado. Note que estou
usando grupos nomeados na regex, fazendo (?<tag>...) em vez de apenas
(...). Isso funciona a partir do 5.10.0 e me permite acessar os
valores agrupados na regex por nome dentro do hash %+. No caso,
acessei o grupo (?<mirna>....) fazendo $+{mirna};
2.2) zera o acumulador.
3) se não encontrar a tag mágica, vai acumulando os dados. Dentro
desse 'else' vc pode fazer coisas como "next if $linha =~ /.../" caso
não queira guardar alguma linha, por exemplo.
4) Depois do while vc pode inspecionar %dados para saber se está tudo ok.


Entendeu?

[]s

-b


Mais detalhes sobre a lista de discussão Rio-pm