pessoal,<br><br>obrigado pela ajuda. consegui fazer um script pra remover tudo que tinha depois do ID de cada sequencia que eu tinha de uma vez só.<br>o find and replace fica pra quando eu tiver no nivel de vcs, se é que eu vou chegar um dia em algum nivel. XD<br>
<br>while (<>) {<br>  if (/^(>\S+)/) {<br>    print "$1\n";<br>  } else {<br>    print;<br>  }<br>}<br>exit;<br><br>ex:<br>input:<br>>TC004444 putative_protein ...<br><br>output:<br>>TC004444<br><br>
abraços.<br><br><div class="gmail_quote">Em 25 de fevereiro de 2012 23:43, André Torres <span dir="ltr"><<a href="mailto:andretorresrj@gmail.com">andretorresrj@gmail.com</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
acho que a ideia da hash vai ajudar.<br><br>aureliano, o padrao de substituição é mais ou menos esse ai.<br><br>eu tenho mais de mil sequencias FASTA com nomes de varias bases de dados diferentes. eu ja tenho uma lista com os nomes originais e com o nome novo padronizado, eu queria fazer a substituição trocando o nome antigo pelo novo padronizado.<br>

como o primeiro arquivo é uma lista, eu acho que teria que armazenar dentro de um array, agora o que eu nao consigo fazer é ele encontrar o nome antigo e trocar exatamente pelo novo no arquivo multisequencia.<br><br>vou tentar mexer no codigo.<br>

brigado pela ajuda galera.<br><br><br><br><div class="gmail_quote">Em 25 de fevereiro de 2012 22:39, breno <span dir="ltr"><<a href="mailto:breno@rio.pm.org" target="_blank">breno@rio.pm.org</a>></span> escreveu:<div>
<div class="h5"><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div>On Sat, Feb 25, 2012 at 8:40 PM, André Torres <<a href="mailto:andretorresrj@gmail.com" target="_blank">andretorresrj@gmail.com</a>> wrote:<br>
> pessoal, queria pedir uma ajuda de vcs.<br>
><br>
> eu to tentando fazer um script pra modificar um txt em larga escala usando<br>
> uma lista de substituição.<br>
> vou trabalhar com os seguintes arquivos.<br>
><br>
> primeiro: arquivo que vai ser modificado<br>
>>sequencia1<br>
> acagacagatttagatt<br>
>>sequencia2<br>
> acgggtagtagtaccgagatgagatggggat<br>
> ...<br>
><br>
> segundo: lista de substituição<br>
> sequencia1    gene1<br>
> sequencia2    gene2<br>
> ...<br>
><br>
> eu queria saber se existe uma maneira de guardar a informação da linha[1] e<br>
> da linha[2] por exemplo possam fazer parte  s/$linha[1]/$linha[2]/g em<br>
> cadeia ate terminar a lista.<br>
><br>
<br>
</div>Uma sugestão:<br>
<br>
leia a lista de substituição pra dentro de um hash na forma:<br>
<br>
%substituicao = (<br>
   sequencia1 => 'gene1',<br>
   sequencia2 => 'gene2',<br>
   ...<br>
);<br>
<br>
depois, ao ler o arquivo a ser modificado linha-a-linha, sempre que a<br>
linha casar com uma chave do seu hash (e.g. if ( exists<br>
$substituicao{$linha} )) vc lê a linha seguinte e substitui o que vc<br>
quiser pelo conteúdo de $substituicao{$linha}.<br>
<br>
[]s<br>
<span><font color="#888888"><br>
-b<br>
</font></span><div><div>_______________________________________________<br>
Rio-pm mailing list<br>
<a href="mailto:Rio-pm@pm.org" target="_blank">Rio-pm@pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/rio-pm" target="_blank">http://mail.pm.org/mailman/listinfo/rio-pm</a><br>
</div></div></blockquote></div></div></div><br><br clear="all"><div class="HOEnZb"><div class="h5"><br>-- <br>André Torres<br><br>"Quando o homem aprender a respeitar até o menor ser da criação, seja animal ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante." (Albert Schweitzer - Nobel da Paz de 1952)<br>


</div></div></blockquote></div><br><br clear="all"><br>-- <br>André Torres<br><br>"Quando o homem aprender a respeitar até o menor ser da criação, seja animal ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante." (Albert Schweitzer - Nobel da Paz de 1952)<br>