2015/09/07

[Google App Engine][Python]lxmlである特定のtagを検索する

昨日のエントリーでgoogle app engineでlxmlを使ってxmlをパースした後、名前空間を取得するところまで書いたので
タグを検索する方法を書く。

import urllib
from urlparse import urlparse
from google.appengine.api import urlfetch
from lxml import etree

url = ""
result = urlfetch.fetch(url)
root = etree.fromstring(result.content)
ns = root.xpath("namespace-uri(.)")
namespace = {"ns":ns}
isValidTags = root.findall(".//ns:IsValid",namespaces=namespace)
if len(isValidTags) > 0:
  isValidTag = isValidTags[0]
  print isValidTag.text()
これは、amazon Product Advertising APIのvalid確認を行う際に、IsValidタグを検出しているコード。

findallの返り値は、listなので、気をつけたいところ。

0 コメント:

コメントを投稿