[Python-de] mit RegEx text extrahieren?
Walter Dörwald
walter at livinglogic.de
Fre Jul 4 20:15:48 EDT 2003
Guenther Sommermann wrote:
> Ok, wenn das nicht so einfach geht, poste ich mal "ganz" genaue infos:
>
> Im Grunde will ich mir ein Skript schreiben, das Titel und URL der
> aktuellen Heise-News auf eine Website (soll nur lokal laufen)
> schreibt. (Im moment hol ich mir erstmal nur die URL.)
>
> (Vorweg: Das ganze könnte man wahrscheinlich am besten mit einem
> XML-Parser machen (hab ich mir auch shcon angeschaut), aber da ich
> grade erst anfange Python zu lernen is mir das noch zu hoch.....)
Das ganze mit einem XML-Parser zu machen, wäre wohl die sauberste
Lösung.
Hier mein Vorschlag: http://styx.livinglogic.de/~walter/heise.py
Das ganze benötigt XIST, was Du unter
http://www.livinglogic.de/Python/xist/ finden kannst.
Das Skript parst das XML-Dokument in einen speziellen DOM, der
seine Konversionsmethoden zur Konvertierung nach HTML gleich
mitbringt.
Ich hoffe, das hilft Dir weiter.
Bis demnächst,
Walter Dörwald
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde geschreddert...
Dateiname : heise.py
Dateityp : text/x-python
Dateigröße : 1257 bytes
Beschreibung: nicht verfügbar
URL : http://starship.python.net/pipermail/python-de/attachments/20030704/ca35f1b3/heise-0001.py