Script zur Extrahation von Informationen aus Dateien

christoph.kliemt at pgxml.net christoph.kliemt at pgxml.net
Di Sep 2 19:48:46 CEST 2008


Moin!

Guido Grass <guido.grass at uni-koeln.de> writes:

> Werte Kollegen,

äh..? ;-)

> zunächst darf ich mich entschuldigen, die Frage an diese Runde zu
> richten, wusste aber niemanden, der mir sonst einen heißen Tipp geben
> kann. Letztlich kann man es vielleicht auch unter kollegiale
> "Amtshilfe" verbuchen:

Ähm... welcher Film ist das jetzt hier? *grübel*

> Probelem: In einem Verzeichnis liegen wild benannte xml-Dateien, aus
> denen ich einige wenige Informationen strukturiert auslesen möchte.
> Es handelt sich hierbei um folgende tags:
>  <eudract-number>2007-000000-11</eudract-number> ...
> <phase-one>Y</phase-one>
>   <phase-two>N</phase-two>
>   <phase-three>N</phase-three>
>   <phase-four>N</phase-four> ....
>
> <planned-numbers>
>   <in-member-state>24</in-member-state>
>   <in-european-community>24</in-european-community>
>   <in-whole-trial>24</in-whole-trial>
>   </planned-numbers>
>
> Jede Datei enthält die Informationen einer Studie. Die Studie ist
> gekennzeichnet durch die eindeutige EudraCT-number.
>
> Ich hätte jetzt gerne eine Tabelle, die die oben genannten
> Informationen in eine Tabelle transformiert, wobei die Items die
> Spalten bezeichnen würden und pro Studie logischerweise eine Zeile.

Hmja... Fragen dazu:

- Kennst Du dich mit xsl/xpath aus?
- Das Ergebnis darf etwas länger auf sich warten lassen?

Falls Du eine der Fragen mit nein beantworten musst: biete $GELD, und
es wird sich vermutlich hier wer finden.
Die Aufgabe hört sich zu unsexy an; ich glaub nicht, dass das jemand
freiwillig macht. ;-)


[...]

> Gibt es jemanden, der sowas aus dem Ärmel schüttelt? Oder einen kennt,
> der einen kennt ...?

Sicherlich.. ;-)

gruss christoph

-- 
Wenn es dringend ist, schreit irgendwer. Bis dahin koennen wir Urlaub
machen.