网站调用新浪微博内容(如何使用微博API做初步性的介绍-本文数据获取)
优采云 发布时间: 2022-02-23 19:18网站调用新浪微博内容(如何使用微博API做初步性的介绍-本文数据获取)
做没有稻草的砖。
数据采集是数据分析的前提。很多网站会通过API接口向第三方开放网站的部分数据。新浪微博也不例外。您可以查看微博 API 列表。
商业数据API(如place/nearby_timeline/biz)是一个收费接口。如果要调用该类接口,需要支付一定的费用并完成相应的接入工作。您可以参考商业数据API访问指南。
本文将对如何使用微博API进行初步介绍,从而获得基本的概念和理解,方便后面深入了解。
文章目录step1:使用python调用微博API,首先下载python SDK,即sinweibopy
sinaweibopy 是一个支持微博 API 的特定于 python 的 OAuth 2 客户端。无依赖,100%纯Py,单一文件,代码简洁,运行可靠。也是新浪微博推荐的官方Python SDK。
可以直接通过 pip 安装:
1pip install sinaweibopy
2
3
什么是 SDK?SDK的英文全称是software development kit(软件开发工具包)。简而言之,它是一个代码库,其中收录用于开发应用程序的可重用代码。当您为应用程序编写代码时,您不需要像在实际屏幕上绘制文本那样重复代码。使用 SDK 可以帮助您做到这一点。总而言之,所有这些代码库和一些其他工具构成了我们所说的 SDK。
step2:了解新浪微博的授权机制,即OAuth 2
API 调用需要用户认证(用户授权)。目前OAuth2.0主要用于微博开放平台上的用户身份认证。
OAuth2.0协议的授权过程请参考如下流程图,其中Client指的是第三方应用(即我们自己在第三步创建的应用),Resource Owner指的是用户,授权服务器是我们的授权服务器,资源服务器是API服务器。
从流程图可以看出,为了调用API server内容,需要将access token告诉API server;访问令牌由新浪(授权服务器)在用户授权后返回给我们创建的应用程序;为了完成用户授权,我们的应用首先要给用户授权页面(授权请求)。
用户授权浏览器后,URL 如下所示:
我们需要将代码后面的字符串提交给新浪授权服务器来获取访问令牌。相当于告诉新浪服务器我们的应用已经被用户授权,现在可以访问用户的数据了,所以授权服务器给了我们一个访问令牌,我们就可以从API服务器获取微博数据了。
了解了上面的机制之后,我们就知道如何编写代码来调用API了。
step3:在微博开放平台上创建自己的应用
现在让我们创建自己的应用程序。创建应用程序的目的是获取应用程序密钥和应用程序机密。
我们使用微连接创建移动应用程序。您还可以创建其他类型的应用程序。创建应用程序后,将分配唯一的应用程序密钥和应用程序密码。您可以在“我的申请-申请信息-基本信息”中查询,将用于授权。注意:无需提交审核,您只需要应用程序密钥和应用程序密钥即可。
如果是异地网页应用或者手机客户端应用,出于安全考虑,需要填写平台网站的redirect_url(授权回调页面)才能使用OAuth2.0。地址填写为“我的申请>申请信息>高级信息”。这里,我们将授权回调页面和取消授权回调页面都设置为默认回调页面:
step4:python代码实现
首先,导入所需的模块:
1from weibo import APIClient
2import webbrowser #python内置的包,支持对浏览器进行操作
3
4
使用微博 SDK 创建我们的应用程序:
1APP_KEY = '123456'
2APP_SECRET = 'abc123xyz456'
3CALLBACK_URL = 'https://api.weibo.com/oauth2/default.html' #回调授权页面,用户完成授权后返回的页面
4client = APIClient(app_key=APP_KEY, app_secret=APP_SECRET, redirect_uri=CALLBACK_URL)
5
6
获取授权页面的url(%3A///oauth2/default.html&response_type=code&client_id=729983294)。用webbrowser打开这个url,会引起浏览器打开
1url=client.get_authorize_url() #得到授权页面的url
2webbrowser.open_new(url) #打开这个url
3
4
用户完成授权后,url 如下所示: . 我们需要code=后面的内容。
1code = input('输入url中code后面的内容后按回车键:')
2
3
使用代码获取访问令牌:
1r = client.request_access_token(code)
2access_token = r.access_token # 新浪(授权服务器)返回的token
3expires_in = r.expires_in
4
5
您可以打印 r 以查看其中的内容:
1print(r)
2# {'access_token': u'abcqwe123', 'expires': 1662109746, 'expires_in': 1662109746, 'uid': u'2164581421'}
3
4
设置获取到的access_token后,可以直接调用API:
1client.set_access_token(access_token, expires_in)
2
3
输出最新的公众微博:
1print(client.statuses.public_timeline.get())
2
3
具体返回内容可以查看微博API文档。
例如,我们可以输出用户的昵称、简历、位置和推文:
1statuses = client.statuses.public_timeline.get().statuses
2l = len(statuses)
3
4for i in range(0,l):
5 print(u'昵称:'+statuses[i]['user']['screen_name'])
6 print(u'简介:'+statuses[i]['user']['description'])
7 print(u'位置:'+statuses[i]['user']['location'])
8 print(u'微博:'+statuses[i]['text'])
9
10
step5:完整代码
1from weibo import APIClient
2import webbrowser #python内置的包,支持对浏览器进行操作
3
4APP_KEY = '123456'
5APP_SECRET = 'abc123xyz456'
6CALLBACK_URL = 'https://api.weibo.com/oauth2/default.html' #回调授权页面,用户完成授权后返回的页面
7client = APIClient(app_key=APP_KEY, app_secret=APP_SECRET, redirect_uri=CALLBACK_URL)
8
9url=client.get_authorize_url() #得到授权页面的url
10webbrowser.open_new(url) #打开这个url
11
12code = input('输入url中code后面的内容后按回车键:')
13
14r = client.request_access_token(code)
15access_token = r.access_token # 新浪(授权服务器)返回的token
16expires_in = r.expires_in
17
18client.set_access_token(access_token, expires_in)
19print(client.statuses.public_timeline.get())
20
21statuses = client.statuses.public_timeline.get().statuses
22l = len(statuses)
23
24for i in range(0,l):
25 print(u'昵称:'+statuses[i]['user']['screen_name'])
26 print(u'简介:'+statuses[i]['user']['description'])
27 print(u'位置:'+statuses[i]['user']['location'])
28 print(u'微博:'+statuses[i]['text'])
29
30
31
参考:
python调用微博API
如何通过python调用新浪微博的API