pessoal,<br><br>obrigado pela ajuda. consegui fazer um script pra remover tudo que tinha depois do ID de cada sequencia que eu tinha de uma vez só.<br>o find and replace fica pra quando eu tiver no nivel de vcs, se é que eu vou chegar um dia em algum nivel. XD<br>

<br>while (<>) {<br>  if (/^(>\S+)/) {<br>    print "$1\n";<br>  } else {<br>    print;<br>  }<br>}<br>exit;<br><br>ex:<br>input:<br>>TC004444 putative_protein ...<br><br>output:<br>>TC004444<br><br>

abraços.<br><br><div class="gmail_quote">Em 25 de fevereiro de 2012 23:43, André Torres <span dir="ltr"><<a href="mailto:andretorresrj@gmail.com">andretorresrj@gmail.com</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

acho que a ideia da hash vai ajudar.<br><br>aureliano, o padrao de substituição é mais ou menos esse ai.<br><br>eu tenho mais de mil sequencias FASTA com nomes de varias bases de dados diferentes. eu ja tenho uma lista com os nomes originais e com o nome novo padronizado, eu queria fazer a substituição trocando o nome antigo pelo novo padronizado.<br>


como o primeiro arquivo é uma lista, eu acho que teria que armazenar dentro de um array, agora o que eu nao consigo fazer é ele encontrar o nome antigo e trocar exatamente pelo novo no arquivo multisequencia.<br><br>vou tentar mexer no codigo.<br>


brigado pela ajuda galera.<br><br><br><br><div class="gmail_quote">Em 25 de fevereiro de 2012 22:39, breno <span dir="ltr"><<a href="mailto:breno@rio.pm.org" target="_blank">breno@rio.pm.org</a>></span> escreveu:<div>

<div class="h5"><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div>On Sat, Feb 25, 2012 at 8:40 PM, André Torres <<a href="mailto:andretorresrj@gmail.com" target="_blank">andretorresrj@gmail.com</a>> wrote:<br>

> pessoal, queria pedir uma ajuda de vcs.<br>

><br>

> eu to tentando fazer um script pra modificar um txt em larga escala usando<br>

> uma lista de substituição.<br>

> vou trabalhar com os seguintes arquivos.<br>

><br>

> primeiro: arquivo que vai ser modificado<br>

>>sequencia1<br>

> acagacagatttagatt<br>

>>sequencia2<br>

> acgggtagtagtaccgagatgagatggggat<br>

> ...<br>

><br>

> segundo: lista de substituição<br>

> sequencia1    gene1<br>

> sequencia2    gene2<br>

> ...<br>

><br>

> eu queria saber se existe uma maneira de guardar a informação da linha[1] e<br>

> da linha[2] por exemplo possam fazer parte  s/$linha[1]/$linha[2]/g em<br>

> cadeia ate terminar a lista.<br>

><br>

<br>

</div>Uma sugestão:<br>

<br>

leia a lista de substituição pra dentro de um hash na forma:<br>

<br>

%substituicao = (<br>

   sequencia1 => 'gene1',<br>

   sequencia2 => 'gene2',<br>

   ...<br>

);<br>

<br>

depois, ao ler o arquivo a ser modificado linha-a-linha, sempre que a<br>

linha casar com uma chave do seu hash (e.g. if ( exists<br>

$substituicao{$linha} )) vc lê a linha seguinte e substitui o que vc<br>

quiser pelo conteúdo de $substituicao{$linha}.<br>

<br>

[]s<br>

<span><font color="#888888"><br>

-b<br>

</font></span><div><div>_______________________________________________<br>

Rio-pm mailing list<br>

<a href="mailto:Rio-pm@pm.org" target="_blank">Rio-pm@pm.org</a><br>

<a href="http://mail.pm.org/mailman/listinfo/rio-pm" target="_blank">http://mail.pm.org/mailman/listinfo/rio-pm</a><br>

</div></div></blockquote></div></div></div><br><br clear="all"><div class="HOEnZb"><div class="h5"><br>-- <br>André Torres<br><br>"Quando o homem aprender a respeitar até o menor ser da criação, seja animal ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante." (Albert Schweitzer - Nobel da Paz de 1952)<br>


</div></div></blockquote></div><br><br clear="all"><br>-- <br>André Torres<br><br>"Quando o homem aprender a respeitar até o menor ser da criação, seja animal ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante." (Albert Schweitzer - Nobel da Paz de 1952)<br>