[Madrid-pm] Eliminar las stopwords de un texto

Salvador Fandino sfandino en yahoo.com
Lun Mar 29 02:02:20 PDT 2010





----- Original Message ----
> From: PEGG <preiddy en gmail.com>
> To: Lista de correo de Madrid Perl Mongers <madrid-pm en pm.org>
> Sent: Mon, March 29, 2010 10:49:16 AM
> Subject: [Madrid-pm] Eliminar las stopwords de un texto
> 

Tu problema es que en @words estas metiendo lineas, no palabras. Prueba lo siguiente:

  use Lingua::EN::StopWords qw(%StopWords);
  open(TEXTO,"contenido.txt");

  my @words = map /\w+/g, <TEXTO>;

  print join " ", grep { !$StopWords{$_} } 


- Salva


Más información sobre la lista de distribución Madrid-pm