Script zur Extrahation von Informationen aus Dateien

Josef 'Jupp' Schugt jupp at gmx.de
Di Sep 2 19:13:42 CEST 2008


On Tue, 02 Sep 2008 18:09:36 +0200, Guido Grass <guido.grass at uni-koeln.de>  
wrote:

> Probelem:
> In einem Verzeichnis liegen wild benannte xml-Dateien, aus denen ich
> einige wenige Informationen strukturiert auslesen möchte.
> Es handelt sich hierbei um folgende tags:
>  <eudract-number>2007-000000-11</eudract-number>
> ...
> <phase-one>Y</phase-one>
>   <phase-two>N</phase-two>
>   <phase-three>N</phase-three>
>   <phase-four>N</phase-four>
> ....
>
> <planned-numbers>
>   <in-member-state>24</in-member-state>
>   <in-european-community>24</in-european-community>
>   <in-whole-trial>24</in-whole-trial>
>   </planned-numbers>

Also mit Ruby und Rexml kein Problem. Schau dir einfach mal an, was ich  
unter

http://penpen.goodaddress.eu/?p=287

verbrochen habe, um das TV-Programm von Animax zu verarbeiten, das unter

http://www.animaxtv.de/cds/wochenoverview.xml.jsp

in XML-Form vorliegt. Ich habe dieses Skript anschließend noch mehrfach  
überarbeitet, um bei Bedarf zusätzliche Daten nachzuladen, aber das dürfte  
eher verwirren. Sollte es jemanden dennoch interessiert: Einfach "animax  
program" (ohne Anführungszeichen) im Suchfeld eingeben.

Josef 'Jupp' Schugt
-- 
Blog: http://penpen.goodaddress.eu/
PGP key (id 6CC6574F): http://wwwkeys.de.pgp.net/
Jabber - http://www.jabber.org/ - contact information on request