Script zur Extrahation von Informationen aus Dateien
Andreas Breslau
andibre at gmx.de
Mi Sep 3 18:50:55 CEST 2008
Josef 'Jupp' Schugt wrote:
> On Wed, 03 Sep 2008 12:01:24 +0200, Michael Kesper <mkesper at fsfe.org>
> wrote:
>
>> awk? Ich würde eher python und lxml empfehlen.
>> http://codespeak.net/lxml/parsing.html
>
> So, jetzt fehlen nur noch Perl, Lua und LISP und dann haben wir die
> üblichen Verdächtigen durch :)
Perl, klar, war mein erster Gedanke ;-)
@Guido:
> <planned-numbers>
> <in-member-state>24</in-member-state>
> <in-european-community>24</in-european-community>
> <in-whole-trial>24</in-whole-trial>
> </planned-numbers>
muss diese Hirarchie erhalten bleiben? also
planned-numbers->in-member-state, oder ist in-member-state eindeutig?
(die frage gilt für alle hirarchischen strukturen innerhalb des xml)
sollen nur die informationen ausgelesen werden, die du in deiner ersten
mail genannt hast?
und wie hättest du die gerne ausgegeben? reicht dir tab getrennte txt?
(steht bei allen dateien in den tags unterhalb von planned-numbers 24 ??
dann kann man das sehr vereinfachen ;-) )
Gruß andreas