这篇文章主要介绍了python分析网页上所有超链接的方法,涉及Python使用urllib模块操作页面超链接的技巧,需要的朋友可以参考下
本文实例讲述了python分析网页上所有超链接的方法。分享给大家供大家参考。具体实现方法如下:
- import urllib, htmllib, formatter
- website = urllib.urlopen("http://yourweb.com")
- data = website.read()
- website.close()
- format = formatter.AbstractFormatter(formatter.NullWriter())
- ptext = htmllib.HTMLParser(format)
- ptext.feed(data)
- for link in ptext.anchorlist:
- print(link)
希望本文所述对大家的Python程序设计有所帮助。
新闻热点
疑难解答