[python-users] Toolsammlung NEU mit Inhalt: Parsen von Dokumenten für die Weiterverarbeitung - Interesse an UserGroup

Daniela Knoll daniela.knoll at gmx.de
So Feb 15 20:57:27 CET 2015


Hallo zusammen,

so, jetzt auch mit Mail Text...

Vielen Dank für die sehr hilfreichen Tipps und Anregungen von Euch!

Bisher hole ich mir Webseiten-Infos umständlich Lynx  -> Variable -> Parsen der Infos, die ich haben möchte -> mutt-Mail an mich. Das ist praktisch, wenn sich der Inhalt nur selten ändert und dann bekomme ich nur die Neuigkeiten zugeschickt.

Konkret möchte ich frei verfügbare Daten in allen möglichen Formaten sammeln und für die Weiterverarbeitung aufbereiten. Ziel sind mehr oder weniger standardisierte Formate für diverse Webanwendungen und Visualisierungen. Die können dann die anderen gerne machen ;-)

Ich möchte bevorzugt auf die vorhandenen Python- und R-Bibliotheken sowie AWK, SED, Bash, etc. zurückgreifen. Um im Training zu bleiben und sich auszutauschen, suche ich eine Art User Group fürs "Backend-Scripting" sozusagen. Vielleicht kennt ihr eine UG oder habt selber Lust an so was?

Gemütlichen Sonntag-Abend,
Daniela


Am 15. Februar 2015 12:00:41 MEZ, schrieb python-users-request at uni-koeln.de:
>Um E-Mails an die Liste python-users zu schicken, nutzen Sie bitte die
>Adresse
>
>	python-users at uni-koeln.de
>
>Um sich via Web von der Liste zu entfernen oder draufzusetzen:
>
>	https://lists.uni-koeln.de/mailman/listinfo/python-users
>
>oder, via E-Mail, schicken Sie eine E-Mail mit dem Wort 'help' in
>Subject/Betreff oder im Text an
>
>	python-users-request at uni-koeln.de
>
>Sie koennen den Listenverwalter dieser Liste unter der Adresse
>
>	python-users-owner at uni-koeln.de
>
>erreichen
>
>Wenn Sie antworten, bitte editieren Sie die Subject/Betreff auf einen
>sinnvollen Inhalt der spezifischer ist als "Re: Contents of
>python-users digest..."
>
>
>Meldungen des Tages:
>
>   1. Re:  Parser/Scraper-Gruppe Köln? (Michael Kesper)
>   2. Re:  Parser/Scraper-Gruppe Köln? (Simon Wörpel)
>
>
>----------------------------------------------------------------------
>
>Message: 1
>Date: Sat, 14 Feb 2015 23:21:19 +0100
>From: Michael Kesper <mkesper at schokokeks.org>
>To: python-users at uni-koeln.de
>Subject: Re: [python-users] Parser/Scraper-Gruppe Köln?
>Message-ID: <54DFCA5F.4090102 at schokokeks.org>
>Content-Type: text/plain; charset=windows-1252; format=flowed
>
>Hallo Uwe, hallo zusammen,
>
>Am 14.02.2015 um 16:12 schrieb Uwe Ziegenhagen:
>> Hi Daniela,
>>
>> anbei eine Präsentation, die ich mal für meine Studenten vorbereitet
>> hatte. Vielleicht hilft sie Dir ja,
>>
>> Uwe
>
>Anstelle von urllib* eventuell requests verwenden.
>So stelle ich mir das eigentlich in Python vor. :)
>
>https://pypi.python.org/pypi/requests
>
>Gruß
>Michael
>
>
>------------------------------
>
>Message: 2
>Date: Sat, 14 Feb 2015 23:47:25 +0100
>From: Simon Wörpel <simon.woerpel at medienrevolte.de>
>To: python-users at uni-koeln.de
>Subject: Re: [python-users] Parser/Scraper-Gruppe Köln?
>Message-ID: <20150214234725.71c44533.simon.woerpel at medienrevolte.de>
>Content-Type: text/plain; charset=UTF-8
>
>-----BEGIN PGP SIGNED MESSAGE-----
>Hash: SHA1
>
>Hallo, 
>
>da fällt mir noch spontan ein:
>
>http://scrapy.org/
>
>Scraping mit requests und lxml (zum auslesen der DOM-Struktur)
>http://docs.python-guide.org/en/latest/scenarios/scrape/ 
>
>Meine Erfahrungen damit gehen aber nicht über erste Tests hinaus.
>
>LG, Simon
>
>
>Am Sat, 14 Feb 2015 23:21:19 +0100
>schrieb Michael Kesper <mkesper at schokokeks.org>:
>
>> Hallo Uwe, hallo zusammen,
>> 
>> Am 14.02.2015 um 16:12 schrieb Uwe Ziegenhagen:
>> > Hi Daniela,
>> >
>> > anbei eine Präsentation, die ich mal für meine Studenten
>vorbereitet
>> > hatte. Vielleicht hilft sie Dir ja,
>> >
>> > Uwe
>> 
>> Anstelle von urllib* eventuell requests verwenden.
>> So stelle ich mir das eigentlich in Python vor. :)
>> 
>> https://pypi.python.org/pypi/requests
>> 
>> Gruß
>> Michael
>> ________________________________________
>> 
>> Diese Mail erhalten Sie ueber die Mailingliste python-users der
>> Universitaet zu Koeln Nachrichten an: python-users at uni-koeln.de
>> Abonnement und Benutzereinstellungen:
>> https://lists.uni-koeln.de/mailman/listinfo/python-users
>> Listenarchiv: http://pycologne.de/mlsearch.html
>> 
>> pyCologne Homepage: http://pycologne.de/
>
>-----BEGIN PGP SIGNATURE-----
>Version: GnuPG v1
>
>iQIcBAEBAgAGBQJU39B9AAoJEOY5IKQu/6XkkjgP/3SWtlqL6SYZzayHbw91bpnM
>DLzDd9rVBpa7sPHxxDUt2W7+Gt8yKAU5MWoR64n25FimPCjPLtz1UfcyjDwR5p60
>Tm3mfGKX2+0W5d8KaNgZJV5fe7EKsY0U7msyby3DUvlGrkxoZYA9SpXXEgD8eg/a
>pHPx/xNBaGx+E8Ki+NBeqy4AexrCp/KtZJZRqzFUi78FCJXAvGYtNzJi3eKDJVcK
>t1JX1ZaTqq5qbOHu1Q42EqlLHDfLwMIP9tulFPVIVQ3NUnU0JFRQ8BcC9V6ZKyxx
>+BjVNjhHq8yoitLBOPPAkDPHMbmiooePxNdPld+PA17QAo74Rs/wbtlpuaEq+/kK
>VDVnDBUQL9nUQL1seagOcEAy2JtSYW6E8smJVNrr6GPVr72UcehfN6imDhxSJ9IF
>C6iioAd9YOh6vbpkp7pRMBDAS+liX+9uPwdoY42Kp4w+87TToN2dWSNRvEQ5jWFv
>R63fwJ5HMwq3G7d+zkdIme9G+zDNUKqN+NR4DwvtTXF5SRxcYKKQEKKU4eO+NH+5
>Hw+9P7PufNXhCVvpRTGnGhS/AXEZ1Jc11KCveHQDJ42+2w/z/0zDEh0AEepdEozP
>IalDlkqCfi+wLH2u0frsJnLNYRWO1DaAzOyCh4889yqI6Z7KvGIuTHWB3fpXEYb1
>WIQjCUUp939KSEiW9jSK
>=H+os
>-----END PGP SIGNATURE-----
>
>------------------------------
>
>Subject: Fusszeile der Nachrichtensammlung
>
>________________________________________
>Diese Mail erhalten Sie ueber die Mailingliste python-users der
>Universitaet zu Koeln
>Nachrichten an: python-users at uni-koeln.de
>Abonnement und Benutzereinstellungen:
>https://lists.uni-koeln.de/mailman/listinfo/python-users
>Listenarchiv: https://lists.uni-koeln.de/pipermail/python-users/
>
>pyCologne Homepage: http://pycologne.de/
>
>
>------------------------------
>
>Ende python-users Nachrichtensammlung, Band 100, Eintrag 13
>***********************************************************




Mehr Informationen über die Mailingliste python-users