Skocz do zawartości

Obróbka Danych Ze Stron


MC'

Rekomendowane odpowiedzi

Witam,

Przyszlo mi napisac program/skrypt pobierajacy, analizujacy i parsujacy dane z plików tekstowych (wybiera np konkretne wartosci ze znaczników xml, wyszukuje konkretne lancuchy itp) zawartych w naszym ulubionym Internecie a nastepnie na podstawie tych danych tworzacy zapytania do konkretnych serwerów :)

Dlatego chcialem zapytac czy ktos kiedys bawil sie w to i jaaki jezyk do takich celów polecacie. Zastanawiam sie obecnie nad Perl-em ?

 

Z góry dzieki za wskazówki

Pozdrawiam

MC

Odnośnik do komentarza
Udostępnij na innych stronach

Jak zwykle najlepsze będzie to w czym Ci wygodnie.

* Ja się bawiłem xml w pythonie i z tego co pamiętam to było bajkowo, ale już nie pamiętam którym modułem :Phttp://www.google.pl/search?q=python+xml

* Jest też takie fajne konsolowe narzędzie xsltproc, które może obrobić i transformować XML, dzięki odpowiednim stylom XSL Śmieszne takie, onet można sobie tym wygenerować.

Odnośnik do komentarza
Udostępnij na innych stronach

Tak sie przed chwila bawilem i to calkiem przyjemnie sie wyciaga dane z tagów. Przykladowo lita topików z forum z adresu lub z pliku

#!/usr/bin/env python
#-*- coding:utf-8 -*-

import os
import urllib
from xml.dom import minidom

url="http://forum.fedora.pl/index.php?/rss/forums/5-forum-fedorapl/"
local=os.getenv("HOME")+"/rss-z-forum.fedora.pl.xml"

def forum_topics(source):
DOMTree = minidom.parse(source)
cNodes = DOMTree.childNodes
for i in cNodes[0].getElementsByTagName("item"):
	print i.getElementsByTagName("title")[0].firstChild.data
	#~ print item.toxml()

def test_online():
src=urllib.urlopen(url)
forum_topics(src)

def test_local():
# save xml to file
src=urllib.urlopen(url)
with open(local,'w') as f:
	f.write(src.read())
# read xml from file
with open(local, 'r') as source:
	forum_topics(source)

if __name__ == "__main__":
test_online()
print " ---------------------------------------------- "
test_local()

Znalazlem tez swoje zabawy z modulem httplib2 ale cos mi tam nie chcialo dzialac, wiec nie wklejam :)

Odnośnik do komentarza
Udostępnij na innych stronach

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się
×
×
  • Dodaj nową pozycję...