昨日のエントリーでgoogle app engineでlxmlを使ってxmlをパースした後、名前空間を取得するところまで書いたので
タグを検索する方法を書く。
import urllib from urlparse import urlparse from google.appengine.api import urlfetch from lxml import etree url = "" result = urlfetch.fetch(url) root = etree.fromstring(result.content) ns = root.xpath("namespace-uri(.)") namespace = {"ns":ns} isValidTags = root.findall(".//ns:IsValid",namespaces=namespace) if len(isValidTags) > 0: isValidTag = isValidTags[0] print isValidTag.text()これは、amazon Product Advertising APIのvalid確認を行う際に、IsValidタグを検出しているコード。
findallの返り値は、listなので、気をつけたいところ。
0 コメント:
コメントを投稿