[SP-pm] discutindo o namespace para um módulo de análise estatística de textos

Luis Motta Campos luismottacampos em yahoo.co.uk
Quinta Junho 21 08:52:26 PDT 2007


On Jun 21, 2007, at 5:36 PM, Rodrigo Fernandes wrote:
> Caro Luis,
>
> Obrigado pela rsposta.
>
> Claro que posso explicar melhor. Como o módulo é
> muito especializado, acredito que a "documentação"
> (na verdade é apenas a descrição) utilizou alguns
> jargões...
>
> O módulo analisa a estatística de textos. Em
> lingüística, coleções de textos são chamadas de
> corpora, no singular, corpus. (Em recuperação de
> informação costuma-se utilizar a palavra
> "coleção"). O output é um arquivo CSV (comma
> separeted value) com 7 colunas, conforme descrição
> anterior.
>
> Se houver mais alguma dúvida, tenho todo o interesse
> em esclarecer.

   Se o teu módulo usa jargões, é bacana apontar as pessoas para  
algum site ou módulo onde se possa conseguir as informações "para  
iniciantes" entenderem o que faz e para que serve o módulo.

   A sugestão do Igor é muito interessante, também. Eu diria até  
mais: também a forma de entrada de dados deveria ficar por conta do  
usuário do módulo: ele pode preferir passar nomes de arquivos,  
descritores de arquivos para arquivos (ou conexões de rede, ou  
mapeamentos de memórias), ou referências para strings (não tenho um  
arquivo, estou lendo / gerando texto de uma forma não muito ortodoxa)...

   Tem aí meus dois centavos também. ;-)
   Quanto ao nome, parece bom.
   Putamplexos!
--
Luis Motta Campos (a.k.a. Monsieur Champs) is a software engineer,
Perl fanatic evangelist, and amateur {cook, photographer}




Mais detalhes sobre a lista de discussão SaoPaulo-pm