网页qq抓取什么原理(访问抓取网页常用命令的相关资料的资料 )

优采云 发布时间: 2022-01-30 23:18

  网页qq抓取什么原理(访问抓取网页常用命令的相关资料的资料

)

  本文文章主要介绍python访问和爬取网页常用命令的相关信息。有需要的朋友可以参考以下

  python获取爬取网页常用命令

  简单的网页抓取:

  import urllib.request

url="http://google.cn/"

response=urllib.request.urlopen(url) #返回文件对象

page=response.read()

  将网址直接保存为本地文件:

  import urllib.request

url="http://google.cn/"

response=urllib.request.urlopen(url) #返回文件对象

page=response.read()

  POST方法:

  import urllib.parse

import urllib.request

url="http://liuxin-blog.appspot.com/messageboard/add"

values={"content":"命令行发出网页请求测试"}

data=urllib.parse.urlencode(values)

#创建请求对象

req=urllib.request.Request(url,data)

#获得服务器返回的数据

response=urllib.request.urlopen(req)

#处理数据

page=response.read()

  GET方法:

  常用的方法有2个,geturl(),info()

  geturl()的设置是识别是否有服务器端的URL重定向,而info()收录一系列信息。

  中文问题的处理会使用encode()进行编码,使用dencode()进行解码:

  以上是python访问爬取网页常用命令示例的详细内容。更多详情请关注php中文网其他相关话题文章!

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线