MC' Napisano Wrzesień 28, 2010 Zgłoszenie Share Napisano Wrzesień 28, 2010 Witam, Przyszlo mi napisac program/skrypt pobierajacy, analizujacy i parsujacy dane z plików tekstowych (wybiera np konkretne wartosci ze znaczników xml, wyszukuje konkretne lancuchy itp) zawartych w naszym ulubionym Internecie a nastepnie na podstawie tych danych tworzacy zapytania do konkretnych serwerów Dlatego chcialem zapytac czy ktos kiedys bawil sie w to i jaaki jezyk do takich celów polecacie. Zastanawiam sie obecnie nad Perl-em ? Z góry dzieki za wskazówki Pozdrawiam MC Odnośnik do komentarza Udostępnij na innych stronach More sharing options...
borzole Napisano Wrzesień 28, 2010 Zgłoszenie Share Napisano Wrzesień 28, 2010 Jak zwykle najlepsze będzie to w czym Ci wygodnie. * Ja się bawiłem xml w pythonie i z tego co pamiętam to było bajkowo, ale już nie pamiętam którym modułem http://www.google.pl/search?q=python+xml * Jest też takie fajne konsolowe narzędzie xsltproc, które może obrobić i transformować XML, dzięki odpowiednim stylom XSL Śmieszne takie, onet można sobie tym wygenerować. Odnośnik do komentarza Udostępnij na innych stronach More sharing options...
MC' Napisano Wrzesień 28, 2010 Autor Zgłoszenie Share Napisano Wrzesień 28, 2010 Dzięki borzo jesteś wporzo No zostane z pythonem i modułem http do tego zobaczymy co się da zrobić z tego Odnośnik do komentarza Udostępnij na innych stronach More sharing options...
borzole Napisano Wrzesień 28, 2010 Zgłoszenie Share Napisano Wrzesień 28, 2010 Tak sie przed chwila bawilem i to calkiem przyjemnie sie wyciaga dane z tagów. Przykladowo lita topików z forum z adresu lub z pliku #!/usr/bin/env python #-*- coding:utf-8 -*- import os import urllib from xml.dom import minidom url="http://forum.fedora.pl/index.php?/rss/forums/5-forum-fedorapl/" local=os.getenv("HOME")+"/rss-z-forum.fedora.pl.xml" def forum_topics(source): DOMTree = minidom.parse(source) cNodes = DOMTree.childNodes for i in cNodes[0].getElementsByTagName("item"): print i.getElementsByTagName("title")[0].firstChild.data #~ print item.toxml() def test_online(): src=urllib.urlopen(url) forum_topics(src) def test_local(): # save xml to file src=urllib.urlopen(url) with open(local,'w') as f: f.write(src.read()) # read xml from file with open(local, 'r') as source: forum_topics(source) if __name__ == "__main__": test_online() print " ---------------------------------------------- " test_local() Znalazlem tez swoje zabawy z modulem httplib2 ale cos mi tam nie chcialo dzialac, wiec nie wklejam Odnośnik do komentarza Udostępnij na innych stronach More sharing options...
Rekomendowane odpowiedzi
Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto
Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.
Zarejestruj nowe konto
Załóż nowe konto. To bardzo proste!
Zarejestruj sięZaloguj się
Posiadasz już konto? Zaloguj się poniżej.
Zaloguj się