关键词采集( 批量采集关键词百度指数,需要cookie池!百度账号cookie为“BDUSS=xxx”)
优采云 发布时间: 2022-03-20 02:16批量采集关键词百度指数,需要cookie池!百度账号cookie为“BDUSS=xxx”)
Python关键词百度索引采集,抓包cookie和json数据处理
1.抓包处理
2.Cookie 使用添加
3.json数据处理转换
百度指数(Baidu Index)是基于百度海量网民行为数据的数据分析平台。它是当前互联网乃至整个数据时代最重要的统计分析平台之一。
#关键词百度指数采集
#20191119 by 微信:huguo00289
# -*- coding: UTF-8 -*-
import requests,json,time
def get_index(keyword,cook):
headers={
'Accept': 'application/json, text/plain, */*',
'Accept-Encoding': 'gzip, deflate',
'Accept-Language': 'zh-CN,zh;q=0.9',
'Connection': 'keep-alive',
'Cookie': cook,
'Host': 'index.baidu.com',
'Referer': 'http://index.baidu.com/v2/main/index.html',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36',
'X-Requested-With': 'XMLHttpRequest',
}
#keyword="seo"
url=f'http://index.baidu.com/api/SearchApi/index?word={keyword}&area=0&days=30'
response=requests.get(url,headers=headers).text
time.sleep(2)
#req=requests.get(url,headers=headers).json() #转换为json
req=json.loads(response) #转换为json
print(req)
print(req['data']['generalRatio'][0])
for k,v in req['data']['generalRatio'][0].items():
print(k,v)
data=req['data']['generalRatio'][0]
all_avg=data['all']['avg'] #百度指数
pc_avg=data['pc']['avg'] #百度pc端指数
wise_avg=data['wise']['avg'] #百度移动端指数
print(f'百度指数:{all_avg}')
print(f'百度指数:{pc_avg}')
print(f'百度指数:{wise_avg}')
if __name__ == '__main__':
keyword=input('请输入要查询百度指数的关键词:')
cook =input('请添加百度账号的cookies:')
get_index(keyword, cook)
批量采集关键词百度索引,需要cookie pool!
百度账号cookie为“BDUSS=xxx”
百度指数是百度大数据的一种统计方法。以数据的形式呈现关键词在百度的每日搜索量,让您更好地了解每个关键词的搜索量。
百度指数有什么用?
1:查询关键词人气
百度指数可以直观的看到每个关键词的热度。指数越高,这个词的商业价值就越高。
2:查询趋势
放大指数的时间,你会发现这个关键词的整体走势是上涨还是下跌?它将帮助您对未来的业务决策做出判断。
3:查询相关词
单击需求图以查看搜索 关键词 的人正在查看的内容。通过分析,您可以知道人们在搜索什么。
4:查看人群肖像
点击人群画像,可以看到搜索关键词的人的人群画像,分为地域、年龄分布、性别分布。