关键词采集(用shell写的批量采集百度下拉框关键词链接(图) )

优采云 发布时间: 2022-03-07 09:05

  关键词采集(用shell写的批量采集百度下拉框关键词链接(图)

)

  批处理采集百度下拉框关键词以前用shell写的,现在用python写。环境是windows-sublime2的编辑器,大概是用urllib爆api然后用正则表达式匹配关键词的内容,最后用for函数实现批量操作。导出的话可以回头看我之前的一些python脚本来实现。这很简单。以下代码比较粗略,请阅读:

  用shell编写的批处理采集百度下拉框关键词这里是脚本链接

  Python批处理采集百度下拉框关键词源码:

  

#encoding=utf-8

import urllib

import re

import sys

reload(sys)

sys.setdefaultencoding("utf-8")

for word in open('kws.txt'):

url='https://suggestion.baidu.com/su?wd=%s'%urllib.quote_plus(word)

html=urllib.urlopen(url)

content=html.read().decode('gbk','ignore')

html.close()

# print content

r=re.compile(r'"(.+?)"')

keywords=re.findall(r,content)

for kws in keywords:

print kws

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线