关键词采集(用shell写的批量采集百度下拉框关键词链接(图) )
优采云 发布时间: 2022-03-07 09:05关键词采集(用shell写的批量采集百度下拉框关键词链接(图)
)
批处理采集百度下拉框关键词以前用shell写的,现在用python写。环境是windows-sublime2的编辑器,大概是用urllib爆api然后用正则表达式匹配关键词的内容,最后用for函数实现批量操作。导出的话可以回头看我之前的一些python脚本来实现。这很简单。以下代码比较粗略,请阅读:
用shell编写的批处理采集百度下拉框关键词这里是脚本链接
Python批处理采集百度下拉框关键词源码:
#encoding=utf-8
import urllib
import re
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
for word in open('kws.txt'):
url='https://suggestion.baidu.com/su?wd=%s'%urllib.quote_plus(word)
html=urllib.urlopen(url)
content=html.read().decode('gbk','ignore')
html.close()
# print content
r=re.compile(r'"(.+?)"')
keywords=re.findall(r,content)
for kws in keywords:
print kws