抓取网页flash视频( 具体方法以人人网页面为例讲述Python实现从Web的一个中抓取文档的方法)
优采云 发布时间: 2022-04-09 14:06抓取网页flash视频(
具体方法以人人网页面为例讲述Python实现从Web的一个中抓取文档的方法)
Python 实现了一种从网络上抓取文档的方法
更新时间:2014年9月26日09:28:02投稿:shichen2014
本文文章主要介绍python从网页爬取文档的方法。以人人网的爬取为例,说明爬取网页文档的完整方法。有需要的朋友可以参考以下
p>
本文中的示例介绍了Python如何实现从Web上的URL爬取文档,分享给大家,供大家参考。具体方法分析如下:
示例代码如下:
import urllib
doc = urllib.urlopen("http://www.python.org").read()
print doc#直接打印出网页
def reporthook(*a):
print a
#将http://www.renren.com网页保存到renre.html中,
#每读取一个块调用一字reporthook函数
urllib.urlretrieve("http://www.renren.com",'renren.html',reporthook)
#将http://www.renren.com网页保存到renre.html中
urllib.urlretrieve("http://www.renren.com",'renren.html')
程序运行结果如下:
..........................网页内容
(0, 8192, -1)
(1, 8192, -1)
(2, 8192, -1)
其中 urllib.urlopen 返回一个类似文件的对象。
希望本文对您的 Python 编程有所帮助。