俺在淘宝代购了双鞋,从美国邮过来的,时间比较长。每天要去快递网站比较麻烦,一直有想用python模拟浏览器的想法,正好拿这个开刀。由于请求的网址中包括了快递单号,基本思路就出来了:只需要把带单号的地址发送请求过去,返回的页面中就有状态信息了;然后对返回的HTML页面进行解析,提取自己想要的信息就搞定了。 我用了urllib2来发HTTP请求(其它的httplib之类的都行)。解析网页这块找了好几个,比如HTMLParser.HTMLParser,sgmllib.SGMLParser。最后还是选择了BeautifulSoup。“靓汤”真的很“好喝”,哈哈。 使用Beautiful Soup,先下载最新的3.2.0(python 2.x专用),解压后进入BeautifulSoup-3.2.0目录执行如下命令即可以喝“靓汤”啦~ 上代码,解释看代码里面的注释:
Posts Tagged ‘beautifulsoup’
用Python+BeautifulSoup查快递状态
Posted: July 31, 2011 in Coding, PythonTags: beatiful soup, beautifulsoup, python, xlobo, 快递 查询
0