[bcn-pm] RS: RS: RS: RS: RS: Consulta sobre parsejar

Agud Pique, Enric eagud.q a tv3.cat
diu nov 24 09:23:29 PST 2013


Hola Alex i a la resta de perlmongers,

He fet servir el codi per altres webs i m'ha anat bé, excepte quan vull parsejar dades que estan dins de "<div" i no en taules, com per exemple en aquesta web d'andorra http://www.grandvalira.com/prevision-meteorologica, voldria parsejar les dades de qualitat de neu, pistes obertes i instal·lacions obertes per exemple de Encamp, Canillo, ...

Aleshores he de canviar de paquet, es pot fer amb  HTML::TableExtract?

Disculpeu l'allau de consultes,

Enric

Bon final de cap de setmana

<div class="sectors_meteo"><section class="sector_meteo" data-order="1" data-id="4">	
		<header>
			<h2>SECTOR <strong>Encamp</strong></h2>
			<span class="sub-title">Altitud 1800m</span>
			<span class="temp tempe_min">-6º</span>
			<span class="temp tempe_max">2º</span>
		</header>
		<div class="content-info content">
			<ul>
			 <li><b>Vent:</b> 5km/h</li>
			 <li><b>Risc allau:</b> 3/5</li>
			 <li><b>Visibilitat:</b> Irregular</li>
			 <li class="separate"><b>Cotes:</b> 80 - 120</li>
			 <li><b>Qualitat neu:</b> Pols </li>
			 <li><b>Pistes obertes:</b> 0/6 </li>
			 <li><b>Instal·lacions obertes:</b> 0 / 4</li>
			</ul>
			<div class="meteo-image"><span class="tipo-45"></span></div>
		</div></section><section class="sector_meteo" data-order="2" data-id="5">	
		<header>
			<h2>SECTOR <strong>Canillo</strong></h2>
			<span class="sub-title">Altitud 2050m</span>
			<span class="temp tempe_min">-4º</span>
			<span class="temp tempe_max">4º</span>
		</header>
		<div class="content-info content">
			<ul>
			 <li><b>Vent:</b> 70km/h</li>
			 <li><b>Risc allau:</b> 3/5</li>
			 <li><b>Visibilitat:</b> Dolenta</li>
			 <li class="separate"><b>Cotes:</b> 80 - 130</li>
			 <li><b>Qualitat neu:</b> Pols </li>
			 <li><b>Pistes obertes:</b> 0/6 </li>
			 <li><b>Instal·lacions obertes:</b> 0 / 6</li>
			</ul>
			<div class="meteo-image"><span class="tipo-45"></span></div>
		</div>


-----Missatge original-----
De: Barcelona-pm en nom de Alex Muntada
Enviat el: dj. 21/11/2013 16:54
Per a: barcelona-pm a pm.org
Tema: Re: [bcn-pm] RS:  RS:  RS:  RS: Consulta sobre parsejar
 
Agud Pique, Enric:

> Rosetta Code? jeje, que quieres decir, que es largo y raro?

Ho diu per http://rosettacode.org/ ;)

> Gracias por tus ejemplos,  y como guardarias los datos que
> aparecen al hacer print Dumper(\%arr);, en un fichero plano
> (dat,..csv) con un formato como el siguiente...

Recorda que això ja havia sortit en una altra conversa fa algun
temps i et vam recomanar Text::CSV.

He canviat el codi que has enviat tu abans i li he afegit suport
per exportar a CSV. Mira el segon fitxer de:

https://gist.github.com/alexm/7577331

Fer alguna cosa similar amb la proposta del Javier no hauria de
ser massa complicat, però si no ho veus clar pregunta. Però crec
que HTML::TableExtract és força resistent a HTML trencat, per les
proves que ho pogut fer.

Per cert, Javier, no sabia i/o recordava que MUA podia usar els
selectors de jQuery i tampoc coneixia/recordava pQuery. Segur que
em seran útils en algun moment, moltes gràcies.

Salut,
Alex
_______________________________________________
llista dels Barcelona-pm
Barcelona-pm a pm.org
http://mail.pm.org/mailman/listinfo/barcelona-pm
BCN Perl Mongers: http://barcelona.pm.org



Més informació sobre la llista de correu Barcelona-pm