[Madrid-pm] Duda con un parsing

Bruno brunorc en gmail.com
Sab Mar 14 03:04:23 PDT 2009


Hola

2009/3/14 PEGG <preiddy at gmail.com>:
> Hola, en el trabajo me han pedido que haga un parsing para un fichero de
> texto:
> <RECORD 1>
> Accession number:2862793
> Title:Qualification of switchable metal-oxide arresters for a protective

(...)

> Mi duda / problema está en que son más de 6 millones de registros en
> ficheros de cientos de megas, no se exactamente el número de campos, cuando
> un autor tenga un numero, ese se corresponde con su afiliación por lo que
> deberian ir juntos en una tabla o fichero nuevo, pero siempre manteniendo
> todo en una tabla principal.

Mi propuesta es hacerlo en dos pasos. En el primero creas un hash de
todos los campos encontrados mas una lista de afiliaciones. En el
segundo metes los datos en la BDD (es mas facil tenerlo en la BDD y
hacer un export al fichero cuando lo necesites, que tenerlo en
ficheros y hacer una magia para buscar los registros).

Saludos, Bruno


Más información sobre la lista de distribución Madrid-pm