Script zur Extrahation von Informationen aus Dateien

Guido Grass guido.grass at uni-koeln.de
Fr Sep 5 08:09:21 CEST 2008


Josef 'Jupp' Schugt schrieb:
> On Thu, 04 Sep 2008 22:39:49 +0200, Dr. Uwe Döbereiner <udoebus at kud.com>
> wrote:
> 
>> Mir fehlt noch sehr viel mehr.
>>
>> NĂ€mlich wenigstens _ein_ konkreter Vorschlag, wie so in etwa die
>> Fragestellung mit den jeweils vorgeschlagenen Sprachen angegangen
>> werden könnte. So einer Art Stub mit dem entsprechenden Code in der
>> empfohlenen Sprache.
> 
> Ich hÀtte gerne beschrieben, wie man die fraglichen XML-Dateien mit
> einem Ruby-Skript verarbeitet, doch ich bin kein Freund des
> Im-Nebel-Herumstocherns und bislang hat Guido keine komplette XML-Datei
> zur VerfĂŒgung gestellt, die das zu verarbeitende Format darstellt.
> 
Ich gelobe Besserung. Aber nicht vor dem WE. Ich gehe im Moment
allzusehr in Alltagsarbeit unter. Das Problem ist, dass die Dateien, die
ich habe, an sehr vielen Stellen streng vertrauliche Informationen
enthalten. Es reicht also nicht, einfach nur den Namen oder der gleiche
zu löschen. Ich werde am Samstag eine Dummy-Datei generieren.

FĂŒr diejenigen, die sich fragen, was das fĂŒr Dateien sind die technische
Referenz:

http://eudract.emea.europa.eu/docs/technical/EudraCT_Clinical_Trial_Application_XML_Schema.xsd

Eine inhaltliche Beschreibung der Felder findet sich hier:

http://eudract.emea.europa.eu/docs/technical/EudraCT_Database_Description.xls

Eine komplett leere xml-Datei habe ich ebenfalls zu Illustration mal
angehÀngt. Ich hoffe, dass sich so der dichte zu einem leichten Nebel
verÀndert hat. Will mir ja nicht nachsagen lassen, dass ich ein
allzuschlimmer GeheimniskrÀmer bin.

Ich werde die Skripte ausprobieren und berichten. Es scheint ja, als
könne ich sogar bald rĂŒckmelden, mit welcher Sprache es schneller  geht
... ;)


Bis bald

Guido
-------------- nächster Teil --------------
Ein Dateianhang mit BinÀrdaten wurde abgetrennt...
Dateiname   : FullData.xml
Dateityp    : text/xml
DateigrĂ¶ĂŸe  : 1718 bytes
Beschreibung: nicht verfĂŒgbar
URL         : http://lists.uni-koeln.de/pipermail/linux-users-discussion/attachments/20080905/82fb857c/attachment.xml