[Cascavel-pm] Arquivo TXT

Nelson Ferraz nferraz em gmail.com
Sábado Novembro 5 04:54:18 PST 2005


> Como faço para converter um arquivo html para txt ??

A solução pode ser tão banal quanto simplesmente remover as tags html:

perl -pe 's/\<.+?\>//g' arquivo.html

...mas talvez você queira algo mais elaborado, como ignorar quebrar
linhas em <br/>; parágrafos em <p></p>; converter <b>negrito</b> para
*negrito* e <i>itálico</i> para /itálico/; etc.

O google oferece alguns exemplos:

http://www.google.com.br/search?q=html2txt+filetype%3Apl

[]s

Nelson


Mais detalhes sobre a lista de discussão Cascavel-pm