From alexm a caliu.cat Fri Nov 8 00:46:24 2013 From: alexm a caliu.cat (Alex Muntada) Date: Fri, 8 Nov 2013 09:46:24 +0100 Subject: [bcn-pm] =?iso-8859-1?q?recordatori_de_la_graellada_de_dem=E0?= Message-ID: <20131108084624.GA3669@pcraspall-i-torres.ac.upc.edu> Per si algú encara no s'ha acabat de decidir i es troba que l'eventbrite no el deixa apuntar-se, podeu contactar amb mi via llista o en privat. Us apuntaré i us enviaré la informació de la logística. https://www.eventbrite.es/event/7293305473 Salut, Alex From codehead a gmail.com Fri Nov 8 08:23:58 2013 From: codehead a gmail.com (Javier Arturo Rodriguez) Date: Fri, 08 Nov 2013 17:23:58 +0100 Subject: [bcn-pm] =?utf-8?q?recordatori_de_la_graellada_de_dem=C3=A0?= In-Reply-To: <20131108084624.GA3669@pcraspall-i-torres.ac.upc.edu> References: <20131108084624.GA3669@pcraspall-i-torres.ac.upc.edu> Message-ID: <527D101E.5070102@gmail.com> Autos! Ahora me habéis asustado! Nunca he estado en Horta, pero supongo que se puede llegar en metro, no? >_< Salud! -Javier From frankie a telecos.upc.edu Fri Nov 8 08:38:00 2013 From: frankie a telecos.upc.edu (Francesc Guasch) Date: Fri, 8 Nov 2013 17:38:00 +0100 Subject: [bcn-pm] =?iso-8859-1?q?recordatori_de_la_graellada_de_dem=E0?= In-Reply-To: <527D101E.5070102@gmail.com> References: <20131108084624.GA3669@pcraspall-i-torres.ac.upc.edu> <527D101E.5070102@gmail.com> Message-ID: <20131108163800.GA12283@etsetb.upc.edu> On Fri, Nov 08, 2013 at 05:23:58PM +0100, Javier Arturo Rodriguez wrote: > Autos! Ahora me habéis asustado! Nunca he estado en Horta, pero supongo > que se puede llegar en metro, no? >_< Linea 5 - Horta. Salida Lisboa. From alexm a caliu.cat Fri Nov 8 10:25:41 2013 From: alexm a caliu.cat (Alex Muntada) Date: Fri, 8 Nov 2013 19:25:41 +0100 Subject: [bcn-pm] =?utf-8?q?recordatori_de_la_graellada_de_dem=C3=A0?= In-Reply-To: <527D101E.5070102@gmail.com> References: <20131108084624.GA3669@pcraspall-i-torres.ac.upc.edu> <527D101E.5070102@gmail.com> Message-ID: Nosaltres anirem en metro. Lo dels cotxes és perquè he reciclat el document d'un altre esdeveniment. Salut, Alex -------------- part següent -------------- Un document HTML ha estat eliminat... URL: From jluis a escomposlinux.org Fri Nov 8 10:39:54 2013 From: jluis a escomposlinux.org (jluis a escomposlinux.org) Date: Fri, 8 Nov 2013 19:39:54 +0100 Subject: [bcn-pm] =?iso-8859-1?q?recordatori_de_la_graellada_de_dem=C3=A0?= In-Reply-To: <527D101E.5070102@gmail.com> References: <20131108084624.GA3669@pcraspall-i-torres.ac.upc.edu> <527D101E.5070102@gmail.com> Message-ID: <96dceea9535a7a0d8a3f0dde656f31ee.squirrel@webmail.escomposlinux.org> > Autos! Ahora me habéis asustado! Nunca he estado en Horta, pero supongo > que se puede llegar en metro, no? >_< si son cinco minutos caminando como mucho. ~ 300 m saliendo por la salida de Lisboa > Salud! Hasta mañana From eagud.q a tv3.cat Mon Nov 11 11:46:11 2013 From: eagud.q a tv3.cat (Agud Pique, Enric) Date: Mon, 11 Nov 2013 20:46:11 +0100 Subject: [bcn-pm] consulta In-Reply-To: References: <201310231717.27256.jluis@escomposlinux.org><84D88D6B-7366-4415-BCA9-621466B1D5D9@kuperman.com.ar><20131028214540.GA4512@xps> Message-ID: <101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local> Una consulta gent, Faig un cat i un grep d'un fitxer buscant la paraula SUCCESS i despres la passo per mail. Tal com ho he fet funciona, però vull saber si ho farieu d'una altra manera, el cat i grep els utilitzo en shell, però desconec si aquesta és la millor manera de fer-ho en perl, executo les funcions entre ' '... En perl, les funcions cat i grep de shell també funcionen? #!/usr/bin/perl -w use Class::Date qw(date now); my @missatge = `cat run_WRF_eur55km_12.log |grep SUCCESS`; print "-----> @missatge\n"; $time=localtime(time()); open(MAIL,"|/usr/lib/sendmail -t"); print MAIL "to:meteo\@tv3.cat\n"; print MAIL "from:eagud.q\@tv3.cat\n"; print MAIL "Subject:simulacio WRF\n\n"; print MAIL "@missatge.\nIt was sent on:$time\n"; close(MAIL); exit(0); ################################################################################### Exemple: Resultat [sam a wrf logs]$ ./mail.pl d01 2013-11-18_12:00:00 real_em: SUCCESS COMPLETE REAL_EM INIT d01 2013-11-18_12:00:00 wrf: SUCCESS COMPLETE WRF Gràcies avançades! Enric From frankie a telecos.upc.edu Tue Nov 12 00:21:09 2013 From: frankie a telecos.upc.edu (Francesc Guasch) Date: Tue, 12 Nov 2013 09:21:09 +0100 Subject: [bcn-pm] consulta In-Reply-To: <101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local> References: <201310231717.27256.jluis@escomposlinux.org> <84D88D6B-7366-4415-BCA9-621466B1D5D9@kuperman.com.ar> <20131028214540.GA4512@xps> <101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local> Message-ID: <20131112082104.GC11041@etsetb.upc.edu> On Mon, Nov 11, 2013 at 08:46:11PM +0100, Agud Pique, Enric wrote: > > Una consulta gent, > > Faig un cat i un grep d'un fitxer buscant la paraula SUCCESS i despres la passo per mail. També ho podries fer directament en shell: (date ; grep SUCCESS ) | mailx -s "simulacio WRF" desti a blablabla L'únic que no se fer es forçar el remitent. > > Tal com ho he fet funciona, però vull saber si ho farieu d'una altra manera, el cat i grep els utilitzo en shell, però desconec si aquesta és la millor manera de fer-ho en perl, executo les funcions entre ' '... > > En perl, les funcions cat i grep de shell també funcionen? Tens la funció grep en perl per buscar els continguts d'un array. Pots veure exemples fent perldoc -f grep Hi han molts mòduls per enviar mails, per exemple: Net::SMTP http://search.cpan.org/search?query=Net%3A%3ASMTP From jluis a escomposlinux.org Tue Nov 12 00:36:20 2013 From: jluis a escomposlinux.org (Jose Luis Perez Diez) Date: Tue, 12 Nov 2013 09:36:20 +0100 Subject: [bcn-pm] consulta In-Reply-To: <101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local> References: <201310231717.27256.jluis@escomposlinux.org> <101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local> Message-ID: <201311120936.22214.jluis@escomposlinux.org> El Monday 11 November 2013 20:46:11 Agud Pique, Enric va escriure: > > Una consulta gent, > > Faig un cat i un grep d'un fitxer buscant la paraula SUCCESS i despres la passo per mail. si fas grep no tens perquè fer servir cat també pots fer : my $fitxer = 'run_WRF_eur55km_12.log'; my $objectiu = 'SUCCESS'; my @missatge =qx(grep $objectiu $fitxer);#qx es el matieix que `` mira perldoc perlop > > Tal com ho he fet funciona, però vull saber si ho farieu d'una altra manera, el cat i grep els utilitzo en shell, > però desconec si aquesta és la millor manera de fer-ho en perl, executo les funcions entre ' '... > > En perl, les funcions cat i grep de shell també funcionen? Perl no te funció cat i grep es un filtre (a perl map reduce fa servir map i grep) my $fitxer; open ($fitxer,'run_WRF_eur55km_12.log'); my $objectiu = 'SUCCESS'; my @missatge = grep(/$objectiu/,<$fitxer>);# perldoc -f grep # my @missatge = grep {/$objectiu/} <$fitxer>;# usant un bloc de codi en lloc d'una expresió Si el que vols es una solució Perl pura mira el que varem preparar per un curset de programació amb perl https://github.com/barcelonapm/curs-1211 espero que alguna de les opcions et serveixi Jluis From eagud.q a tv3.cat Wed Nov 13 12:02:55 2013 From: eagud.q a tv3.cat (Agud Pique, Enric) Date: Wed, 13 Nov 2013 21:02:55 +0100 Subject: [bcn-pm] consulta In-Reply-To: <201311120936.22214.jluis@escomposlinux.org> References: <201310231717.27256.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local> <201311120936.22214.jluis@escomposlinux.org> Message-ID: <101279E56795E74AA9167144EDE340A605DB2E95@LLOBREGAT.ad-ccrtv.local> Moltes gràcies! Ja ho he modificat! Salutacions Enric -----Missatge original----- De: Barcelona-pm [mailto:barcelona-pm-bounces+eagud.q=tv3.cat a pm.org] En nom de Jose Luis Perez Diez Enviat: dimarts, 12 de novembre de 2013 9:36 Per a: Barcelona Perl Mongers Tema: Re: [bcn-pm] consulta El Monday 11 November 2013 20:46:11 Agud Pique, Enric va escriure: > > Una consulta gent, > > Faig un cat i un grep d'un fitxer buscant la paraula SUCCESS i despres la passo per mail. si fas grep no tens perquè fer servir cat també pots fer : my $fitxer = 'run_WRF_eur55km_12.log'; my $objectiu = 'SUCCESS'; my @missatge =qx(grep $objectiu $fitxer);#qx es el matieix que `` mira perldoc perlop > > Tal com ho he fet funciona, però vull saber si ho farieu d'una altra > manera, el cat i grep els utilitzo en shell, però desconec si aquesta és la millor manera de fer-ho en perl, executo les funcions entre ' '... > > En perl, les funcions cat i grep de shell també funcionen? Perl no te funció cat i grep es un filtre (a perl map reduce fa servir map i grep) my $fitxer; open ($fitxer,'run_WRF_eur55km_12.log'); my $objectiu = 'SUCCESS'; my @missatge = grep(/$objectiu/,<$fitxer>);# perldoc -f grep # my @missatge = grep {/$objectiu/} <$fitxer>;# usant un bloc de codi en lloc d'una expresió Si el que vols es una solució Perl pura mira el que varem preparar per un curset de programació amb perl https://github.com/barcelonapm/curs-1211 espero que alguna de les opcions et serveixi Jluis _______________________________________________ llista dels Barcelona-pm Barcelona-pm a pm.org http://mail.pm.org/mailman/listinfo/barcelona-pm BCN Perl Mongers: http://barcelona.pm.org From eagud.q a tv3.cat Wed Nov 13 12:03:34 2013 From: eagud.q a tv3.cat (Agud Pique, Enric) Date: Wed, 13 Nov 2013 21:03:34 +0100 Subject: [bcn-pm] consulta In-Reply-To: <201311120936.22214.jluis@escomposlinux.org> References: <201310231717.27256.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local> <201311120936.22214.jluis@escomposlinux.org> Message-ID: <101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local> Em miro l'enllaç https://github.com/barcelonapm/curs-1211 Si tinc dubte, pregunto Enric -----Missatge original----- De: Barcelona-pm [mailto:barcelona-pm-bounces+eagud.q=tv3.cat a pm.org] En nom de Jose Luis Perez Diez Enviat: dimarts, 12 de novembre de 2013 9:36 Per a: Barcelona Perl Mongers Tema: Re: [bcn-pm] consulta El Monday 11 November 2013 20:46:11 Agud Pique, Enric va escriure: > > Una consulta gent, > > Faig un cat i un grep d'un fitxer buscant la paraula SUCCESS i despres la passo per mail. si fas grep no tens perquè fer servir cat també pots fer : my $fitxer = 'run_WRF_eur55km_12.log'; my $objectiu = 'SUCCESS'; my @missatge =qx(grep $objectiu $fitxer);#qx es el matieix que `` mira perldoc perlop > > Tal com ho he fet funciona, però vull saber si ho farieu d'una altra > manera, el cat i grep els utilitzo en shell, però desconec si aquesta és la millor manera de fer-ho en perl, executo les funcions entre ' '... > > En perl, les funcions cat i grep de shell també funcionen? Perl no te funció cat i grep es un filtre (a perl map reduce fa servir map i grep) my $fitxer; open ($fitxer,'run_WRF_eur55km_12.log'); my $objectiu = 'SUCCESS'; my @missatge = grep(/$objectiu/,<$fitxer>);# perldoc -f grep # my @missatge = grep {/$objectiu/} <$fitxer>;# usant un bloc de codi en lloc d'una expresió Si el que vols es una solució Perl pura mira el que varem preparar per un curset de programació amb perl https://github.com/barcelonapm/curs-1211 espero que alguna de les opcions et serveixi Jluis _______________________________________________ llista dels Barcelona-pm Barcelona-pm a pm.org http://mail.pm.org/mailman/listinfo/barcelona-pm BCN Perl Mongers: http://barcelona.pm.org From jluis a escomposlinux.org Mon Nov 18 07:32:16 2013 From: jluis a escomposlinux.org (Jose Luis Perez Diez) Date: Mon, 18 Nov 2013 16:32:16 +0100 Subject: [bcn-pm] =?utf-8?q?Reuni=C3=B3_de_Novembre?= Message-ID: <201311181632.19359.jluis@escomposlinux.org> Aquest mes que fem Reunió Tècnica o Social i el lloc Mes que res per donar-ho d'alta al lanyrd No faig servir signes de puntuació no sigui que algú els interpreti com operadors :) http://www.modernperlbooks.com/mt/2013/11/context-and-the-comma-operator.html From alexm a caliu.cat Mon Nov 18 12:50:58 2013 From: alexm a caliu.cat (Alex Muntada) Date: Mon, 18 Nov 2013 21:50:58 +0100 Subject: [bcn-pm] =?iso-8859-1?q?Reuni=F3_de_Novembre?= In-Reply-To: <201311181632.19359.jluis@escomposlinux.org> References: <201311181632.19359.jluis@escomposlinux.org> Message-ID: <20131118205058.GA9510@tleilax> Jose Luis Perez Diez: > Aquest mes que fem Reunió Tècnica o Social i el lloc La gent de Gnubila m'han contactat i els he preguntat si volen venir a fer-nos una xerrada la setmana vinent per explicar-nos la plataforma que han muntat basada en Perl i que pretenen alliberar en breu. En principi semblen interessats però hem d'acabar de concretar els detalls. Si algú té alguna altra proposta, segurament puguem fer més d'una xerrada el mateix dia. S'anima algú? > Mes que res per donar-ho d'alta al lanyrd De moment crea l'esdeveniment però no posis detalls sobre els temes que tractarem ni el lloc on farem la reunió. Quan ho tinguem resolt ja ho posarem però així ja podem anar-ho avisant. Salut i gràcies, Alex From txorlings a gmail.com Mon Nov 18 23:41:14 2013 From: txorlings a gmail.com (=?UTF-8?B?Sm9yZGkgIlR4b3IiIENhc2FzIFLDrW9z?=) Date: Tue, 19 Nov 2013 08:41:14 +0100 Subject: [bcn-pm] =?utf-8?q?Reuni=C3=B3_de_Novembre?= In-Reply-To: <20131118205058.GA9510@tleilax> References: <201311181632.19359.jluis@escomposlinux.org> <20131118205058.GA9510@tleilax> Message-ID: Hola! Fa molt que no em veieu el pèl, a més us devia una xerrada offtopic sobre el joc del Go. Vindré a la reunió, i si veieu que quadra puc fer la xerrada per a postres. Sinó queda pendent. Salut i Perl! 2013/11/18 Alex Muntada > Jose Luis Perez Diez: > > > Aquest mes que fem Reunió Tècnica o Social i el lloc > > La gent de Gnubila m'han contactat i els he preguntat si volen > venir a fer-nos una xerrada la setmana vinent per explicar-nos > la plataforma que han muntat basada en Perl i que pretenen > alliberar en breu. En principi semblen interessats però hem > d'acabar de concretar els detalls. > > Si algú té alguna altra proposta, segurament puguem fer més > d'una xerrada el mateix dia. S'anima algú? > > > Mes que res per donar-ho d'alta al lanyrd > > De moment crea l'esdeveniment però no posis detalls sobre els > temes que tractarem ni el lloc on farem la reunió. Quan ho > tinguem resolt ja ho posarem però així ja podem anar-ho avisant. > > Salut i gràcies, > Alex > _______________________________________________ > llista dels Barcelona-pm > Barcelona-pm a pm.org > http://mail.pm.org/mailman/listinfo/barcelona-pm > BCN Perl Mongers: http://barcelona.pm.org > -------------- part següent -------------- Un document HTML ha estat eliminat... URL: From jluis a escomposlinux.org Tue Nov 19 10:33:37 2013 From: jluis a escomposlinux.org (jluis a escomposlinux.org) Date: Tue, 19 Nov 2013 19:33:37 +0100 Subject: [bcn-pm] =?iso-8859-1?q?Reuni=F3_de_Novembre?= In-Reply-To: <20131118205058.GA9510@tleilax> References: <201311181632.19359.jluis@escomposlinux.org> <20131118205058.GA9510@tleilax> Message-ID: > Jose Luis Perez Diez: > >> Aquest mes que fem Reunió Tècnica o Social i el lloc > > La gent de Gnubila m'han contactat i els he preguntat si volen > venir a fer-nos una xerrada la setmana vinent per explicar-nos > la plataforma que han muntat basada en Perl i que pretenen > alliberar en breu. En principi semblen interessats però hem > d'acabar de concretar els detalls. > > Si algú té alguna altra proposta, segurament puguem fer més > d'una xerrada el mateix dia. S'anima algú? alta a landyr com event http://lanyrd.com/ctgtt From eagud.q a tv3.cat Wed Nov 20 13:20:17 2013 From: eagud.q a tv3.cat (Agud Pique, Enric) Date: Wed, 20 Nov 2013 22:20:17 +0100 Subject: [bcn-pm] Consulta sobre parsejar In-Reply-To: <101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local> References: <201310231717.27256.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local><201311120936.22214.jluis@escomposlinux.org> <101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local> Message-ID: <101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local> Bona nit PerlMongers, Em vull baixar dades d'estacions d'esquí de webs...gruixos de neu, remuntadors i pistes obertes....a la feina ho entrem manualment i vull estalviar-m'ho. Fins ara he parsejat sobretot amb R, però voldria aprendre en Perl, però no ho he fet mai amb aquest llenguatge. La seguent pàgina te una taula...es una web molt simple, i voldria baixar-me les dades de estat de l'estació, la qualitat, gruix maxim i minim i km marcats i el nom de l'estació, algu em pot indicar algun exemple? Quin modul utilitzar? Si algú em pot ajudar, li agrairia Moltes gràcies http://www.tuixent-lavansa.com/pagina/inicial From alexm a caliu.cat Wed Nov 20 15:13:58 2013 From: alexm a caliu.cat (Alex Muntada) Date: Thu, 21 Nov 2013 00:13:58 +0100 Subject: [bcn-pm] Consulta sobre parsejar In-Reply-To: <101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local> References: <201310231717.27256.jluis@escomposlinux.org> <101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local> <201311120936.22214.jluis@escomposlinux.org> <101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local> Message-ID: <20131120231358.GA4714@xps> Agud Pique, Enric: > algu em pot indicar algun exemple? Quin modul utilitzar? Tal com està formatat el document HTML no seria fàcil obtenir les dades a base d'expressions regulars. El més fàcil és usar un analitzador d'HTML de veritat. Tens HTML::TableParser i HTML::TableExtract, tots dos mòduls estan disponibles en versions recents de Debian i Ubuntu com a libhtml-tableparser-perl i libhtml-tableparser-perl. Mira de jugar-hi una mica i avisa si et cal més ajuda. Salut, Alex From eagud.q a tv3.cat Wed Nov 20 16:41:04 2013 From: eagud.q a tv3.cat (Agud Pique, Enric) Date: Thu, 21 Nov 2013 01:41:04 +0100 Subject: [bcn-pm] RS: Consulta sobre parsejar References: <201310231717.27256.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local><201311120936.22214.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local> <20131120231358.GA4714@xps> Message-ID: <101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local> Gràcies Alex, em sembla que seguiré amb R o intentar amb php Enric -----Missatge original----- De: Barcelona-pm en nom de Alex Muntada Enviat el: dj. 21/11/2013 0:13 Per a: Barcelona Perl Mongers Tema: Re: [bcn-pm] Consulta sobre parsejar Agud Pique, Enric: > algu em pot indicar algun exemple? Quin modul utilitzar? Tal com està formatat el document HTML no seria fàcil obtenir les dades a base d'expressions regulars. El més fàcil és usar un analitzador d'HTML de veritat. Tens HTML::TableParser i HTML::TableExtract, tots dos mòduls estan disponibles en versions recents de Debian i Ubuntu com a libhtml-tableparser-perl i libhtml-tableparser-perl. Mira de jugar-hi una mica i avisa si et cal més ajuda. Salut, Alex _______________________________________________ llista dels Barcelona-pm Barcelona-pm a pm.org http://mail.pm.org/mailman/listinfo/barcelona-pm BCN Perl Mongers: http://barcelona.pm.org -------------- part següent -------------- A non-text attachment was scrubbed... Name: no disponible Type: application/ms-tnef Size: 3309 bytes Desc: no disponible URL: From alexm a caliu.cat Wed Nov 20 21:18:22 2013 From: alexm a caliu.cat (Alex Muntada) Date: Thu, 21 Nov 2013 06:18:22 +0100 Subject: [bcn-pm] RS: Consulta sobre parsejar In-Reply-To: <101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local> References: <201310231717.27256.jluis@escomposlinux.org> <101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local> <201311120936.22214.jluis@escomposlinux.org> <101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local> <20131120231358.GA4714@xps> <101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local> Message-ID: Hola Enric, ens podries ensenyar com ho fas amb R? Veient la documentació del HTML::TableExtract sembla prou fàcil d'utilitzar. Què et fa tirar enrere? No crec pas que et resulti més fàcil fer-ho amb PHP. Salut, Alex -------------- part següent -------------- Un document HTML ha estat eliminat... URL: From alexm a caliu.cat Wed Nov 20 23:30:51 2013 From: alexm a caliu.cat (Alex Muntada) Date: Thu, 21 Nov 2013 08:30:51 +0100 Subject: [bcn-pm] RS: Consulta sobre parsejar In-Reply-To: References: <201310231717.27256.jluis@escomposlinux.org> <101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local> <201311120936.22214.jluis@escomposlinux.org> <101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local> <20131120231358.GA4714@xps> <101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local> Message-ID: <20131121073051.GA31076@pcraspall-i-torres.ac.upc.edu> > Veient la documentació del HTML::TableExtract sembla prou fàcil > d'utilitzar. Què et fa tirar enrere? Un exemple: https://gist.github.com/alexm/7577331 No t'hauria de resultar gaire difícil aplicar el mateix a la web que comentaves. Salut, Alex From eagud.q a tv3.cat Thu Nov 21 00:16:31 2013 From: eagud.q a tv3.cat (Agud Pique, Enric) Date: Thu, 21 Nov 2013 09:16:31 +0100 Subject: [bcn-pm] RS: RS: Consulta sobre parsejar References: <201310231717.27256.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local><201311120936.22214.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local><20131120231358.GA4714@xps><101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local> Message-ID: <101279E56795E74AA9167144EDE340A6061A2631@LLOBREGAT.ad-ccrtv.local> Hola Alex, moltes gràcies, Mira en R, seria una cosa com aquesta (fet ràpidament i segur que es pot millorar, però ho parseja bé) ####TUIXENT#### library(XML) library(zoo) ##library(RCurl) isp.url <- "http://www.tuixent-lavansa.com/pagina/inicial" pag <-readLines(isp.url) tmp <- htmlParse(pag, encoding = "utf8" ) isp.tabs <- readHTMLTable(tmp, stringsAsFactors = F) length(isp.tabs) ####En total de 5 taules, només m'interessen la 2 i 3 #####Taula2 isp.tab <- isp.tabs[[2]] nr <- nrow(isp.tab) nc <- ncol(isp.tab) isp.tab[, 1:2] filas <- as.character(isp.tab[1:nr, 2]) filas datos <- isp.tab[1:nr, 1:nc] print(datos) acces <- datos[2, 2] print(acces) ####Taula3 isp.tab <- isp.tabs[[3]] nr <- nrow(isp.tab) nc <- ncol(isp.tab) isp.tab[, 1:2] filas <- as.character(isp.tab[1:nr, 1]) filas datos <- isp.tab[1:nr, 1:nc] datost <-t(datos) print(datost) datost[1, 1] <- "ESTAT ESTACIÓ" datost[2, 1] <- acces write.table(datost[, c(1,2,3,4,5)], "/home/enric/csv/tuixent.csv", sep = ",",col.names = NA) ############################################################################################### S'ha de pulir (eliminar la capçalera i la primera columna), però em surt una cosa així Per eliminar la columna faria draft1$X<-NULL > print(datf1) X X1 X2 X3 X4 X5 1 V1 ESTAT ESTACIÓ QUALITAT GRUIX MINÍM GRUIX MÀXIM KM MARCATS 2 V2 OBERT Pols 15 cm 50 cm 20 Km Probaré de fer-ho tal com m'has indicat en l'enllaç de l'últim mail per aprendre tb en perl. Ahir a la nit ho veia una mica muntanya amb HTML::TableExtract... ho probo avui Gracies -----Missatge original----- De: Barcelona-pm en nom de Alex Muntada Enviat el: dj. 21/11/2013 6:18 Per a: Barcelona Perl Mongers Tema: Re: [bcn-pm] RS: Consulta sobre parsejar Hola Enric, ens podries ensenyar com ho fas amb R? Veient la documentació del HTML::TableExtract sembla prou fàcil d'utilitzar. Què et fa tirar enrere? No crec pas que et resulti més fàcil fer-ho amb PHP. Salut, Alex From eagud.q a tv3.cat Thu Nov 21 00:18:27 2013 From: eagud.q a tv3.cat (Agud Pique, Enric) Date: Thu, 21 Nov 2013 09:18:27 +0100 Subject: [bcn-pm] RS: RS: RS: Consulta sobre parsejar References: <201310231717.27256.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local><201311120936.22214.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local><20131120231358.GA4714@xps><101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A6061A2631@LLOBREGAT.ad-ccrtv.local> Message-ID: <101279E56795E74AA9167144EDE340A6061A2632@LLOBREGAT.ad-ccrtv.local> Per veure el resultat en R print(data.frame) -----Missatge original----- De: Barcelona-pm en nom de Agud Pique, Enric Enviat el: dj. 21/11/2013 9:16 Per a: Barcelona Perl Mongers; Barcelona Perl Mongers Tema: [bcn-pm] RS: RS: Consulta sobre parsejar Hola Alex, moltes gràcies, Mira en R, seria una cosa com aquesta (fet ràpidament i segur que es pot millorar, però ho parseja bé) ####TUIXENT#### library(XML) library(zoo) ##library(RCurl) isp.url <- "http://www.tuixent-lavansa.com/pagina/inicial" pag <-readLines(isp.url) tmp <- htmlParse(pag, encoding = "utf8" ) isp.tabs <- readHTMLTable(tmp, stringsAsFactors = F) length(isp.tabs) ####En total de 5 taules, només m'interessen la 2 i 3 #####Taula2 isp.tab <- isp.tabs[[2]] nr <- nrow(isp.tab) nc <- ncol(isp.tab) isp.tab[, 1:2] filas <- as.character(isp.tab[1:nr, 2]) filas datos <- isp.tab[1:nr, 1:nc] print(datos) acces <- datos[2, 2] print(acces) ####Taula3 isp.tab <- isp.tabs[[3]] nr <- nrow(isp.tab) nc <- ncol(isp.tab) isp.tab[, 1:2] filas <- as.character(isp.tab[1:nr, 1]) filas datos <- isp.tab[1:nr, 1:nc] datost <-t(datos) print(datost) datost[1, 1] <- "ESTAT ESTACIÓ" datost[2, 1] <- acces write.table(datost[, c(1,2,3,4,5)], "/home/enric/csv/tuixent.csv", sep = ",",col.names = NA) ############################################################################################### S'ha de pulir (eliminar la capçalera i la primera columna), però em surt una cosa així Per eliminar la columna faria draft1$X<-NULL > print(datf1) X X1 X2 X3 X4 X5 1 V1 ESTAT ESTACIÓ QUALITAT GRUIX MINÍM GRUIX MÀXIM KM MARCATS 2 V2 OBERT Pols 15 cm 50 cm 20 Km Probaré de fer-ho tal com m'has indicat en l'enllaç de l'últim mail per aprendre tb en perl. Ahir a la nit ho veia una mica muntanya amb HTML::TableExtract... ho probo avui Gracies -----Missatge original----- De: Barcelona-pm en nom de Alex Muntada Enviat el: dj. 21/11/2013 6:18 Per a: Barcelona Perl Mongers Tema: Re: [bcn-pm] RS: Consulta sobre parsejar Hola Enric, ens podries ensenyar com ho fas amb R? Veient la documentació del HTML::TableExtract sembla prou fàcil d'utilitzar. Què et fa tirar enrere? No crec pas que et resulti més fàcil fer-ho amb PHP. Salut, Alex _______________________________________________ llista dels Barcelona-pm Barcelona-pm a pm.org http://mail.pm.org/mailman/listinfo/barcelona-pm BCN Perl Mongers: http://barcelona.pm.org -------------- part següent -------------- A non-text attachment was scrubbed... Name: no disponible Type: application/ms-tnef Size: 4490 bytes Desc: no disponible URL: From eagud.q a tv3.cat Thu Nov 21 00:47:47 2013 From: eagud.q a tv3.cat (Agud Pique, Enric) Date: Thu, 21 Nov 2013 09:47:47 +0100 Subject: [bcn-pm] RS: RS: Consulta sobre parsejar References: <201310231717.27256.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local><201311120936.22214.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local><20131120231358.GA4714@xps><101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local> <20131121073051.GA31076@pcraspall-i-torres.ac.upc.edu> Message-ID: <101279E56795E74AA9167144EDE340A6061A2633@LLOBREGAT.ad-ccrtv.local> Hola Alex, he cridat la web, desactivat les dades en local, crido la taula 1, i m'ha donat ja alguns valors...seguiré mirant, potser tindré dubtes #!/usr/local/bin/perl use strict; use warnings; use v5.10; use LWP::Simple; use HTML::TableExtract; my $page = "http://www.tuixent-lavansa.com/pagina/inicial"; my $html = get( $page ); #my $DATA = do { local $/; }; my $te = HTML::TableExtract->new(); #$te->parse($DATA); $te->parse($html); my @tables = $te->tables; print $tables[1]->cell(0,0), "\n"; print $tables[1]->cell(0,1), "\n"; print $tables[1]->cell(1,0), "\n"; print $tables[1]->cell(1,1), "\n"; print $tables[1]->cell(2,0), "\n"; print $tables[1]->cell(2,1), "\n"; print $tables[1]->cell(2,2), "\n"; print $tables[1]->cell(1,2), "\n"; gràcies -----Missatge original----- De: Barcelona-pm en nom de Alex Muntada Enviat el: dj. 21/11/2013 8:30 Per a: Barcelona Perl Mongers Tema: Re: [bcn-pm] RS: Consulta sobre parsejar > Veient la documentació del HTML::TableExtract sembla prou fàcil > d'utilitzar. Què et fa tirar enrere? Un exemple: https://gist.github.com/alexm/7577331 No t'hauria de resultar gaire difícil aplicar el mateix a la web que comentaves. Salut, Alex _______________________________________________ llista dels Barcelona-pm Barcelona-pm a pm.org http://mail.pm.org/mailman/listinfo/barcelona-pm BCN Perl Mongers: http://barcelona.pm.org From codehead a gmail.com Thu Nov 21 01:55:30 2013 From: codehead a gmail.com (Javier Arturo Rodriguez) Date: Thu, 21 Nov 2013 10:55:30 +0100 Subject: [bcn-pm] RS: RS: RS: Consulta sobre parsejar In-Reply-To: <101279E56795E74AA9167144EDE340A6061A2632@LLOBREGAT.ad-ccrtv.local> References: <201310231717.27256.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local><201311120936.22214.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local><20131120231358.GA4714@xps><101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A6061A2631@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A6061A2632@LLOBREGAT.ad-ccrtv.local> Message-ID: <528DD892.20200@gmail.com> *wow!* Nunca había visto R usado así... esto es digno de un Rosetta Code! En Perl, mi primera opción sería siempre pQuery: --8<--cut-here--8<-- #!/usr/bin/env perl use strict; use utf8::all; use Data::Dumper; use pQuery; my @arr; pQuery('http://www.tuixent-lavansa.com/pagina/inicial') ->find('table td b') ->each(sub{ push @arr,pQuery($_)->text unless $_->{colspan} }); my %arr = @arr; print Dumper(\%arr); --8<--cut-here--8<-- $VAR1 = { 'KM MARCATS' => '20 Km', "GRUIX M\x{fffd}XIM" => '50 cm', 'OBERT' => "ESTACI\x{fffd}", 'D\'HIVERN' => 'RESTAURANT L\'ARP', 'OBERT CAPS DE SETMANA' => 'ESTAT DE LA NEU', "ESTAT DE L'ESTACI\x{fffd}" => "ACC\x{fffd}S", "GRUIX MIN\x{fffd}M" => '15 cm', 'QUALITAT' => 'Pols', 'REFUGI DE L\'ARP' => 'RESTAURANT COLL DE PORT' }; El problema con pQuery es que el HTML mal formado lo lleva muy mal. Y siendo realistas esta es la norma en Internet. Este mismo documento tiene lo suyo: dos tablas con el mismo ID (anidadas, para liarla otro poco), s sin tags de cierre, etcétera. Sólo hecho de menos el . Otra alternativa es Mojo::UserAgent. Seguro que Diego podría hacer un one-liner de memoria y con los ojos cerrados. Por mi parte, lo mejor que puedo hacer es esto: --8<--cut-here--8<-- #!/usr/bin/env perl use strict; use utf8::all; use Data::Dumper; use Mojo::UserAgent; my $ua = Mojo::UserAgent->new; my @arr; $ua->get('http://www.tuixent-lavansa.com/pagina/inicial') ->res ->dom('td b') ->each(sub{ push @arr,shift->text }); my %arr = @arr; print Dumper(\%arr); --8<--cut-here--8<-- $VAR1 = { 'OBERT' => ' ESTACIÓ', 'ESTAT DE L\'ESTACIÓ ' => ' ACCÉS', ' GRUIX MINÍM' => '15 cm', 'D\'HIVERN' => 'RESTAURANT L\'ARP', 'OBERT CAPS DE SETMANA' => 'ESTAT DE LA NEU ', ' QUALITAT' => 'Pols', ' GRUIX MÀXIM' => '50 cm', ' KM MARCATS' => '20 Km', 'REFUGI DE L\'ARP' => 'RESTAURANT COLL DE PORT' }; Como se observa, MUA no se "come" el whitespace, pero según a quién se le pregunte esto no es un bug, sino un feature. (Por supuesto, en ambos ejemplos es posible jugar con los selectores para obtener con más precisión la información que se desea obtener. Esto se deja como ejercicio para el lector.) Salud... y Perl! -Javier Arturo Rodríguez From eagud.q a tv3.cat Thu Nov 21 03:07:51 2013 From: eagud.q a tv3.cat (Agud Pique, Enric) Date: Thu, 21 Nov 2013 12:07:51 +0100 Subject: [bcn-pm] RS: RS: RS: RS: Consulta sobre parsejar References: <201310231717.27256.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local><201311120936.22214.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local><20131120231358.GA4714@xps><101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A6061A2631@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A6061A2632@LLOBREGAT.ad-ccrtv.local> <528DD892.20200@gmail.com> Message-ID: <101279E56795E74AA9167144EDE340A6061A2637@LLOBREGAT.ad-ccrtv.local> Rosetta Code? jeje, que quieres decir, que es largo y raro? Gracias por tus ejemplos, y como guardarias los datos que aparecen al hacer print Dumper(\%arr);, en un fichero plano (dat,..csv) con un formato como el siguiente... Estacio Qualitat Gruix Minim Gruix Maxim KM MARCATS Tuixent-la-Vansa Pols 15 cm 50 cm 20 km Enric si mejoro el codigo en R tambien os lo paso... Ciao -----Missatge original----- De: Barcelona-pm en nom de Javier Arturo Rodriguez Enviat el: dj. 21/11/2013 10:55 Per a: Barcelona Perl Mongers Tema: Re: [bcn-pm] RS: RS: RS: Consulta sobre parsejar *wow!* Nunca había visto R usado así... esto es digno de un Rosetta Code! En Perl, mi primera opción sería siempre pQuery: --8<--cut-here--8<-- #!/usr/bin/env perl use strict; use utf8::all; use Data::Dumper; use pQuery; my @arr; pQuery('http://www.tuixent-lavansa.com/pagina/inicial') ->find('table td b') ->each(sub{ push @arr,pQuery($_)->text unless $_->{colspan} }); my %arr = @arr; print Dumper(\%arr); --8<--cut-here--8<-- $VAR1 = { 'KM MARCATS' => '20 Km', "GRUIX M\x{fffd}XIM" => '50 cm', 'OBERT' => "ESTACI\x{fffd}", 'D\'HIVERN' => 'RESTAURANT L\'ARP', 'OBERT CAPS DE SETMANA' => 'ESTAT DE LA NEU', "ESTAT DE L'ESTACI\x{fffd}" => "ACC\x{fffd}S", "GRUIX MIN\x{fffd}M" => '15 cm', 'QUALITAT' => 'Pols', 'REFUGI DE L\'ARP' => 'RESTAURANT COLL DE PORT' }; El problema con pQuery es que el HTML mal formado lo lleva muy mal. Y siendo realistas esta es la norma en Internet. Este mismo documento tiene lo suyo: dos tablas con el mismo ID (anidadas, para liarla otro poco), s sin tags de cierre, etcétera. Sólo hecho de menos el . Otra alternativa es Mojo::UserAgent. Seguro que Diego podría hacer un one-liner de memoria y con los ojos cerrados. Por mi parte, lo mejor que puedo hacer es esto: --8<--cut-here--8<-- #!/usr/bin/env perl use strict; use utf8::all; use Data::Dumper; use Mojo::UserAgent; my $ua = Mojo::UserAgent->new; my @arr; $ua->get('http://www.tuixent-lavansa.com/pagina/inicial') ->res ->dom('td b') ->each(sub{ push @arr,shift->text }); my %arr = @arr; print Dumper(\%arr); --8<--cut-here--8<-- $VAR1 = { 'OBERT' => ' ESTACIÓ', 'ESTAT DE L\'ESTACIÓ ' => ' ACCÉS', ' GRUIX MINÍM' => '15 cm', 'D\'HIVERN' => 'RESTAURANT L\'ARP', 'OBERT CAPS DE SETMANA' => 'ESTAT DE LA NEU ', ' QUALITAT' => 'Pols', ' GRUIX MÀXIM' => '50 cm', ' KM MARCATS' => '20 Km', 'REFUGI DE L\'ARP' => 'RESTAURANT COLL DE PORT' }; Como se observa, MUA no se "come" el whitespace, pero según a quién se le pregunte esto no es un bug, sino un feature. (Por supuesto, en ambos ejemplos es posible jugar con los selectores para obtener con más precisión la información que se desea obtener. Esto se deja como ejercicio para el lector.) Salud... y Perl! -Javier Arturo Rodríguez _______________________________________________ llista dels Barcelona-pm Barcelona-pm a pm.org http://mail.pm.org/mailman/listinfo/barcelona-pm BCN Perl Mongers: http://barcelona.pm.org From eagud.q a tv3.cat Thu Nov 21 04:14:24 2013 From: eagud.q a tv3.cat (Agud Pique, Enric) Date: Thu, 21 Nov 2013 13:14:24 +0100 Subject: [bcn-pm] RS: RS: RS: RS: Consulta sobre parsejar References: <201310231717.27256.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E7D@LLOBREGAT.ad-ccrtv.local><201311120936.22214.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local><20131120231358.GA4714@xps><101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A6061A2631@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A6061A2632@LLOBREGAT.ad-ccrtv.local> <528DD892.20200@gmail.com> <101279E56795E74AA9167144EDE340A6061A2637@LLOBREGAT.ad-ccrtv.local> Message-ID: <101279E56795E74AA9167144EDE340A6061A2640@LLOBREGAT.ad-ccrtv.local> He modificat el codi en R, així millor, ho guarda tot ben arregladet en un csv Però també ho lluitaré en perl Ciao ####TUIXENT#### library(XML) library(zoo) isp.url <- "http://www.tuixent-lavansa.com/pagina/inicial" pag <-readLines(isp.url) tmp <- htmlParse(pag, encoding = "utf8" ) isp.tabs <- readHTMLTable(tmp, stringsAsFactors = F) length(isp.tabs) ####Taula3 isp.tab <- isp.tabs[[3]] nr <- nrow(isp.tab) nc <- ncol(isp.tab) isp.tab[, 1:2] filas <- as.character(isp.tab[1:nr, 1]) filas dades <- isp.tab[1:nr, 1:nc] qualitat <- dades[2, 2] gruix.min <- dades[3, 2] gruix.max <- dades[4, 2] km <- dades[5, 2] estacio <- "Tuixent-la-Vansa" Tuixent <- data.frame( estacio,qualitat, gruix.min, gruix.max,km) write.table(Tuixent[, c(1,2,3,4,5)], "/home/enric/csv/tuixent.csv", sep = ",",col.names = NA) -----Missatge original----- De: Agud Pique, Enric Enviat el: dj. 21/11/2013 12:07 Per a: Barcelona Perl Mongers; Barcelona Perl Mongers Tema: RS: [bcn-pm] RS: RS: RS: Consulta sobre parsejar Rosetta Code? jeje, que quieres decir, que es largo y raro? Gracias por tus ejemplos, y como guardarias los datos que aparecen al hacer print Dumper(\%arr);, en un fichero plano (dat,..csv) con un formato como el siguiente... Estacio Qualitat Gruix Minim Gruix Maxim KM MARCATS Tuixent-la-Vansa Pols 15 cm 50 cm 20 km Enric si mejoro el codigo en R tambien os lo paso... Ciao -----Missatge original----- De: Barcelona-pm en nom de Javier Arturo Rodriguez Enviat el: dj. 21/11/2013 10:55 Per a: Barcelona Perl Mongers Tema: Re: [bcn-pm] RS: RS: RS: Consulta sobre parsejar *wow!* Nunca había visto R usado así... esto es digno de un Rosetta Code! En Perl, mi primera opción sería siempre pQuery: --8<--cut-here--8<-- #!/usr/bin/env perl use strict; use utf8::all; use Data::Dumper; use pQuery; my @arr; pQuery('http://www.tuixent-lavansa.com/pagina/inicial') ->find('table td b') ->each(sub{ push @arr,pQuery($_)->text unless $_->{colspan} }); my %arr = @arr; print Dumper(\%arr); --8<--cut-here--8<-- $VAR1 = { 'KM MARCATS' => '20 Km', "GRUIX M\x{fffd}XIM" => '50 cm', 'OBERT' => "ESTACI\x{fffd}", 'D\'HIVERN' => 'RESTAURANT L\'ARP', 'OBERT CAPS DE SETMANA' => 'ESTAT DE LA NEU', "ESTAT DE L'ESTACI\x{fffd}" => "ACC\x{fffd}S", "GRUIX MIN\x{fffd}M" => '15 cm', 'QUALITAT' => 'Pols', 'REFUGI DE L\'ARP' => 'RESTAURANT COLL DE PORT' }; El problema con pQuery es que el HTML mal formado lo lleva muy mal. Y siendo realistas esta es la norma en Internet. Este mismo documento tiene lo suyo: dos tablas con el mismo ID (anidadas, para liarla otro poco), s sin tags de cierre, etcétera. Sólo hecho de menos el . Otra alternativa es Mojo::UserAgent. Seguro que Diego podría hacer un one-liner de memoria y con los ojos cerrados. Por mi parte, lo mejor que puedo hacer es esto: --8<--cut-here--8<-- #!/usr/bin/env perl use strict; use utf8::all; use Data::Dumper; use Mojo::UserAgent; my $ua = Mojo::UserAgent->new; my @arr; $ua->get('http://www.tuixent-lavansa.com/pagina/inicial') ->res ->dom('td b') ->each(sub{ push @arr,shift->text }); my %arr = @arr; print Dumper(\%arr); --8<--cut-here--8<-- $VAR1 = { 'OBERT' => ' ESTACIÓ', 'ESTAT DE L\'ESTACIÓ ' => ' ACCÉS', ' GRUIX MINÍM' => '15 cm', 'D\'HIVERN' => 'RESTAURANT L\'ARP', 'OBERT CAPS DE SETMANA' => 'ESTAT DE LA NEU ', ' QUALITAT' => 'Pols', ' GRUIX MÀXIM' => '50 cm', ' KM MARCATS' => '20 Km', 'REFUGI DE L\'ARP' => 'RESTAURANT COLL DE PORT' }; Como se observa, MUA no se "come" el whitespace, pero según a quién se le pregunte esto no es un bug, sino un feature. (Por supuesto, en ambos ejemplos es posible jugar con los selectores para obtener con más precisión la información que se desea obtener. Esto se deja como ejercicio para el lector.) Salud... y Perl! -Javier Arturo Rodríguez _______________________________________________ llista dels Barcelona-pm Barcelona-pm a pm.org http://mail.pm.org/mailman/listinfo/barcelona-pm BCN Perl Mongers: http://barcelona.pm.org From alexm a caliu.cat Thu Nov 21 07:54:29 2013 From: alexm a caliu.cat (Alex Muntada) Date: Thu, 21 Nov 2013 16:54:29 +0100 Subject: [bcn-pm] RS: RS: RS: RS: Consulta sobre parsejar In-Reply-To: <101279E56795E74AA9167144EDE340A6061A2637@LLOBREGAT.ad-ccrtv.local> References: <201311120936.22214.jluis@escomposlinux.org> <101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local> <20131120231358.GA4714@xps> <101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A6061A2631@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A6061A2632@LLOBREGAT.ad-ccrtv.local> <528DD892.20200@gmail.com> <101279E56795E74AA9167144EDE340A6061A2637@LLOBREGAT.ad-ccrtv.local> Message-ID: <20131121155429.GA25661@tleilax> Agud Pique, Enric: > Rosetta Code? jeje, que quieres decir, que es largo y raro? Ho diu per http://rosettacode.org/ ;) > Gracias por tus ejemplos, y como guardarias los datos que > aparecen al hacer print Dumper(\%arr);, en un fichero plano > (dat,..csv) con un formato como el siguiente... Recorda que això ja havia sortit en una altra conversa fa algun temps i et vam recomanar Text::CSV. He canviat el codi que has enviat tu abans i li he afegit suport per exportar a CSV. Mira el segon fitxer de: https://gist.github.com/alexm/7577331 Fer alguna cosa similar amb la proposta del Javier no hauria de ser massa complicat, però si no ho veus clar pregunta. Però crec que HTML::TableExtract és força resistent a HTML trencat, per les proves que ho pogut fer. Per cert, Javier, no sabia i/o recordava que MUA podia usar els selectors de jQuery i tampoc coneixia/recordava pQuery. Segur que em seran útils en algun moment, moltes gràcies. Salut, Alex From eagud.q a tv3.cat Thu Nov 21 11:19:51 2013 From: eagud.q a tv3.cat (Agud Pique, Enric) Date: Thu, 21 Nov 2013 20:19:51 +0100 Subject: [bcn-pm] RS: RS: RS: RS: Consulta sobre parsejar In-Reply-To: <20131121155429.GA25661@tleilax> References: <201311120936.22214.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local><20131120231358.GA4714@xps><101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A6061A2631@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A6061A2632@LLOBREGAT.ad-ccrtv.local><528DD892.20200@gmail.com><101279E56795E74AA9167144EDE340A6061A2637@LLOBREGAT.ad-ccrtv.local> <20131121155429.GA25661@tleilax> Message-ID: <101279E56795E74AA9167144EDE340A605DB2EF1@LLOBREGAT.ad-ccrtv.local> Interessant el rosettacode.org Gràcies Àlex per afegir el codi per exportar a CSV, ara em queda clar. Us escric si em sorgeix algun dubte Salutacions Enric www.meteo4u.com -----Missatge original----- De: Barcelona-pm [mailto:barcelona-pm-bounces+eagud.q=tv3.cat a pm.org] En nom de Alex Muntada Enviat: dijous, 21 de novembre de 2013 16:54 Per a: barcelona-pm a pm.org Tema: Re: [bcn-pm] RS: RS: RS: RS: Consulta sobre parsejar Agud Pique, Enric: > Rosetta Code? jeje, que quieres decir, que es largo y raro? Ho diu per http://rosettacode.org/ ;) > Gracias por tus ejemplos, y como guardarias los datos que aparecen al > hacer print Dumper(\%arr);, en un fichero plano > (dat,..csv) con un formato como el siguiente... Recorda que això ja havia sortit en una altra conversa fa algun temps i et vam recomanar Text::CSV. He canviat el codi que has enviat tu abans i li he afegit suport per exportar a CSV. Mira el segon fitxer de: https://gist.github.com/alexm/7577331 Fer alguna cosa similar amb la proposta del Javier no hauria de ser massa complicat, però si no ho veus clar pregunta. Però crec que HTML::TableExtract és força resistent a HTML trencat, per les proves que ho pogut fer. Per cert, Javier, no sabia i/o recordava que MUA podia usar els selectors de jQuery i tampoc coneixia/recordava pQuery. Segur que em seran útils en algun moment, moltes gràcies. Salut, Alex _______________________________________________ llista dels Barcelona-pm Barcelona-pm a pm.org http://mail.pm.org/mailman/listinfo/barcelona-pm BCN Perl Mongers: http://barcelona.pm.org From eagud.q a tv3.cat Sun Nov 24 09:23:29 2013 From: eagud.q a tv3.cat (Agud Pique, Enric) Date: Sun, 24 Nov 2013 18:23:29 +0100 Subject: [bcn-pm] RS: RS: RS: RS: RS: Consulta sobre parsejar References: <201311120936.22214.jluis@escomposlinux.org><101279E56795E74AA9167144EDE340A605DB2E96@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local><20131120231358.GA4714@xps><101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A6061A2631@LLOBREGAT.ad-ccrtv.local><101279E56795E74AA9167144EDE340A6061A2632@LLOBREGAT.ad-ccrtv.local><528DD892.20200@gmail.com><101279E56795E74AA9167144EDE340A6061A2637@LLOBREGAT.ad-ccrtv.local> <20131121155429.GA25661@tleilax> Message-ID: <101279E56795E74AA9167144EDE340A6061A2654@LLOBREGAT.ad-ccrtv.local> Hola Alex i a la resta de perlmongers, He fet servir el codi per altres webs i m'ha anat bé, excepte quan vull parsejar dades que estan dins de "

SECTOR Encamp

Altitud 1800m -6º

SECTOR Canillo

Altitud 2050m -4º
-----Missatge original----- De: Barcelona-pm en nom de Alex Muntada Enviat el: dj. 21/11/2013 16:54 Per a: barcelona-pm a pm.org Tema: Re: [bcn-pm] RS: RS: RS: RS: Consulta sobre parsejar Agud Pique, Enric: > Rosetta Code? jeje, que quieres decir, que es largo y raro? Ho diu per http://rosettacode.org/ ;) > Gracias por tus ejemplos, y como guardarias los datos que > aparecen al hacer print Dumper(\%arr);, en un fichero plano > (dat,..csv) con un formato como el siguiente... Recorda que això ja havia sortit en una altra conversa fa algun temps i et vam recomanar Text::CSV. He canviat el codi que has enviat tu abans i li he afegit suport per exportar a CSV. Mira el segon fitxer de: https://gist.github.com/alexm/7577331 Fer alguna cosa similar amb la proposta del Javier no hauria de ser massa complicat, però si no ho veus clar pregunta. Però crec que HTML::TableExtract és força resistent a HTML trencat, per les proves que ho pogut fer. Per cert, Javier, no sabia i/o recordava que MUA podia usar els selectors de jQuery i tampoc coneixia/recordava pQuery. Segur que em seran útils en algun moment, moltes gràcies. Salut, Alex _______________________________________________ llista dels Barcelona-pm Barcelona-pm a pm.org http://mail.pm.org/mailman/listinfo/barcelona-pm BCN Perl Mongers: http://barcelona.pm.org From jluis a escomposlinux.org Sun Nov 24 23:58:57 2013 From: jluis a escomposlinux.org (Jose Luis Perez Diez) Date: Mon, 25 Nov 2013 08:58:57 +0100 Subject: [bcn-pm] =?utf-8?q?Recuperaci=C3=B3_de_dades?= Message-ID: <201311250858.58965.jluis@escomposlinux.org> Bones, Algu de vosltres ha tingut que fer servir el serveis de alguna empresa de recuperacio de dades? Mes que res per tindre mes dades per seleccionar una ja que m'han deixat dos discos, un de ells amb averia mecanica, i altre encara sense diagnostic. Gracias -- jl From codehead a gmail.com Mon Nov 25 00:49:26 2013 From: codehead a gmail.com (Javier Arturo Rodriguez) Date: Mon, 25 Nov 2013 09:49:26 +0100 Subject: [bcn-pm] =?utf-8?q?Recuperaci=C3=B3_de_dades?= In-Reply-To: <201311250858.58965.jluis@escomposlinux.org> References: <201311250858.58965.jluis@escomposlinux.org> Message-ID: <52930F16.7010809@gmail.com> Bones! On 2013-11-25 08:58 , Jose Luis Perez Diez wrote: > Bones, > > Algu de vosltres ha tingut que fer servir el serveis de alguna empresa de recuperacio de dades? > > Mes que res per tindre mes dades per seleccionar una ja que m'han deixat dos discos, un de ells amb averia mecanica, i altre encara sense diagnostic. En sudoers hemos tenido un micro-thread al respecto y hay alguna recomendación: https://groups.google.com/forum/#!topic/sudoers-barcelona/TT_rWsoqcMs > > > Gracias > -- > jl > > _______________________________________________ > llista dels Barcelona-pm > Barcelona-pm a pm.org > http://mail.pm.org/mailman/listinfo/barcelona-pm > BCN Perl Mongers: http://barcelona.pm.org Saludos, -Javier Arturo Rodríguez From jluis a escomposlinux.org Wed Nov 27 00:16:56 2013 From: jluis a escomposlinux.org (Jose Luis Perez Diez) Date: Wed, 27 Nov 2013 09:16:56 +0100 Subject: [bcn-pm] =?utf-8?q?Dema_reuni=C3=B3?= Message-ID: <201311270916.59116.jluis@escomposlinux.org> Ens queda 1 dia. La reunio de dema sera tecnica o la fem al bar? Use Acme::PM::Barcelona::Meeting; From alexm a caliu.cat Wed Nov 27 01:31:53 2013 From: alexm a caliu.cat (Alex Muntada) Date: Wed, 27 Nov 2013 10:31:53 +0100 Subject: [bcn-pm] =?utf-8?q?Dema_reuni=C3=B3?= In-Reply-To: <201311270916.59116.jluis@escomposlinux.org> References: <201311270916.59116.jluis@escomposlinux.org> Message-ID: Serà social i al Mes Open Bar. Ja ho he actualitzat a http://lanyrd.com/ctgtt -------------- part següent -------------- Un document HTML ha estat eliminat... URL: From txorlings a gmail.com Wed Nov 27 01:54:34 2013 From: txorlings a gmail.com (=?UTF-8?B?Sm9yZGkgIlR4b3IiIENhc2FzIFLDrW9z?=) Date: Wed, 27 Nov 2013 10:54:34 +0100 Subject: [bcn-pm] =?utf-8?q?Dema_reuni=C3=B3?= In-Reply-To: References: <201311270916.59116.jluis@escomposlinux.org> Message-ID: Porto un taulell de Go? 2013/11/27 Alex Muntada > Serà social i al Mes Open Bar. Ja ho he actualitzat a > http://lanyrd.com/ctgtt > > _______________________________________________ > llista dels Barcelona-pm > Barcelona-pm a pm.org > http://mail.pm.org/mailman/listinfo/barcelona-pm > BCN Perl Mongers: http://barcelona.pm.org > -------------- part següent -------------- Un document HTML ha estat eliminat... URL: From alexm a caliu.cat Wed Nov 27 03:15:56 2013 From: alexm a caliu.cat (Alex Muntada) Date: Wed, 27 Nov 2013 12:15:56 +0100 Subject: [bcn-pm] =?iso-8859-1?q?Dema_reuni=F3?= In-Reply-To: References: <201311270916.59116.jluis@escomposlinux.org> Message-ID: <20131127111556.GA4416@xps> Jordi "Txor" Casas Ríos: > Porto un taulell de Go? Sí, és clar. Apunta't al lanyrd com a ponent ;) Salut, Alex From txorlings a gmail.com Wed Nov 27 03:52:05 2013 From: txorlings a gmail.com (=?UTF-8?B?Sm9yZGkgIlR4b3IiIENhc2FzIFLDrW9z?=) Date: Wed, 27 Nov 2013 12:52:05 +0100 Subject: [bcn-pm] =?utf-8?q?Dema_reuni=C3=B3?= In-Reply-To: <20131127111556.GA4416@xps> References: <201311270916.59116.jluis@escomposlinux.org> <20131127111556.GA4416@xps> Message-ID: Mmmm noob @ lanyrd! M'apunto a speakers? On Wed, Nov 27, 2013 at 12:15 PM, Alex Muntada wrote: > Jordi "Txor" Casas Ríos: > > > Porto un taulell de Go? > > Sí, és clar. Apunta't al lanyrd com a ponent ;) > > Salut, > Alex > _______________________________________________ > llista dels Barcelona-pm > Barcelona-pm a pm.org > http://mail.pm.org/mailman/listinfo/barcelona-pm > BCN Perl Mongers: http://barcelona.pm.org > -------------- part següent -------------- Un document HTML ha estat eliminat... URL: From wodenmalkav a gmail.com Thu Nov 28 09:39:06 2013 From: wodenmalkav a gmail.com (Carlos Juan Diaz) Date: Thu, 28 Nov 2013 18:39:06 +0100 Subject: [bcn-pm] =?iso-8859-1?q?Dema_reuni=F3?= In-Reply-To: References: <201311270916.59116.jluis@escomposlinux.org> Message-ID: <1385660346.30523.4.camel@Dragonfly> Hola mongers, em sap greu però avui em perdré la reunió d'aquest mes. Salut! -- Carlos Juan From txorlings a gmail.com Thu Nov 28 15:04:30 2013 From: txorlings a gmail.com (=?UTF-8?B?Sm9yZGkgIlR4b3IiIENhc2FzIFLDrW9z?=) Date: Fri, 29 Nov 2013 00:04:30 +0100 Subject: [bcn-pm] =?utf-8?q?Dema_reuni=C3=B3?= In-Reply-To: <1385660346.30523.4.camel@Dragonfly> References: <201311270916.59116.jluis@escomposlinux.org> <1385660346.30523.4.camel@Dragonfly> Message-ID: Hola nois! Complemento la xerrada sobre Go: http://es.wikipedia.org/wiki/Go Un bon servidor per jugar: www.gokgs.com. Si hi feu una partida recordeu que al començament sou nivell 30 Kyu, per tant entreu a les partides que anunciïn 30 Kyu. Convido als qui heu vingut a la reunió d'avui (sobretot per raons d'espai, els demés perdoneu-me) a una trobada friki per a muntar una DarkNet: Objectius: - Servicios de comunicación. - Compartición de archivos. - Backup en cloud en nuestra DarkNet. Ordre del dia: 1 - Investigar qué software nos sirve y cómo se monta la infraestructura. (Propuesta inicial: Retroshare). 2 - Montar los dos primeros nodos de la DarkNet como ejemplo para que se unan los demás componentes. 3 - Probar los features anteriormente citados. Els interessats envieu-me un mail privat plz! Salutacions! -------------- part següent -------------- Un document HTML ha estat eliminat... URL: From codehead a gmail.com Thu Nov 28 15:14:06 2013 From: codehead a gmail.com (Javier Arturo Rodriguez) Date: Fri, 29 Nov 2013 00:14:06 +0100 Subject: [bcn-pm] =?utf-8?q?Dema_reuni=C3=B3?= In-Reply-To: References: <201311270916.59116.jluis@escomposlinux.org> <1385660346.30523.4.camel@Dragonfly> Message-ID: <5297CE3E.400@gmail.com> Hey Jordi, gracias por la lección de Go. Ahora, combinándola con mi adicción a XKCD... http://xkcd.com/1287/ Salut! -Javier Arturo Rodríguez -------------- next part -------------- An HTML attachment was scrubbed... URL: From alexm a caliu.cat Sat Nov 30 01:20:08 2013 From: alexm a caliu.cat (Alex Muntada) Date: Sat, 30 Nov 2013 10:20:08 +0100 Subject: [bcn-pm] RS: RS: RS: RS: RS: Consulta sobre parsejar In-Reply-To: <101279E56795E74AA9167144EDE340A6061A2654@LLOBREGAT.ad-ccrtv.local> References: <101279E56795E74AA9167144EDE340A605DB2EE3@LLOBREGAT.ad-ccrtv.local> <20131120231358.GA4714@xps> <101279E56795E74AA9167144EDE340A6061A262F@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A6061A2631@LLOBREGAT.ad-ccrtv.local> <101279E56795E74AA9167144EDE340A6061A2632@LLOBREGAT.ad-ccrtv.local> <528DD892.20200@gmail.com> <101279E56795E74AA9167144EDE340A6061A2637@LLOBREGAT.ad-ccrtv.local> <20131121155429.GA25661@tleilax> <101279E56795E74AA9167144EDE340A6061A2654@LLOBREGAT.ad-ccrtv.local> Message-ID: <20131130092008.GC4234@tleilax> Agud Pique, Enric: > he de canviar de paquet, es pot fer amb HTML::TableExtract? HTML::TableExtract només funciona amb taules. Per als div pots utilitzar les dues propostes que et va fer en Javier i obtenir els valors amb selectors CSS. Tot plegat em fa pensar que tota aquesta informació hauria de publicar-se en formats més amigables per als programadors i per als meteoròlegs (estic parlant d'opendata). Enric, saps si hi ha cap projecte per impulsar opendata en aquest sentit? A la llista tenim bons coneixedors del tema i crec que seria un repte interessant aconseguir-ho, no creus? Salut, Alex