干货教程:Python获取百度下拉关键词
优采云 发布时间: 2022-11-24 06:12干货教程:Python获取百度下拉关键词
对于word research,每个seoer都必须知道,除了比较热门的百度相关搜索词*敏*感*词*,但大部分都集中在drop上-down box 字数,毕竟百度下拉框关键词合集已经泛滥了。
百度下拉的正式名称是百度推荐词(Baidu Suggest Word),民间也称百度联想词或百度下拉菜单。是百度为方便网民搜索,提高输入效率而推出的一项服务。
例如,当我们在百度输入“营销”一词,百度会从推荐词条库中检索出以“营销”一词开头的词条,并按照搜索量从大到小排序。形成一个下拉菜单。百度下拉菜单最大数量为10个。
百度下拉框关键词的含义:
它可以用作长尾词和标题。毕竟,它可以在用户搜索时触发 关键词 搜索选项。
很多人直接用下拉词来引流,比如曝光品牌,引导到指定页面。可以采集
分析竞争对手的相关操作,也可以自己曝光自己的品牌。不同的人有不同的看法!
网上留下了很多下拉词的采集
工具和源码。到这里,这个人渣已经被收拾好了。在这里再分享一次。昨晚有个弟兄问我。事实上,这些事情来来去去。没什么特别的!
网页直接抓取,实现下拉词采集
代码如下:
def get_keywords(word):
url=f"https://www.baidu.com/sugrec?pre=1&ie=utf-8&json=1&prod=pc&wd={word}"
html=requests.get(url)
html=html.json()
#print(html)
#print(html['g'])
key_words=[]
for key_word in html['g']:
print(key_word['q'])
key_words.append(key_word['q'])
#print(key_words)
return key_words
使用官方接口
" />
代码如下:
def get_sug(word):
url = 'https://sp0.baidu.com/5a1Fazu8AA54nxGko9WTAnF6hhy/su?wd=%s&sugmode=2&json=1&p=3&sid=1427_21091_21673_22581&req=2&pbs=%%E5%%BF%%AB%%E6%%89%%8B&csor=2&pwd=%%E5%%BF%%AB%%E6%%89%%8B&cb=jQuery11020924966752020363_1498055470768&_=1498055470781' % word
r = requests.get(url, verify=False) # 请求API接口,取消了HTTPS验证
cont = r.content # 获取返回的内容
res = cont[41: -2].decode('gbk') # 只取返回结果中json格式一段,并且解码为unicode
res_json = json.loads(res) # json格式转换
return res_json['s'] # 返回关键词列表
另一个接口地址
def get_word(word):
url=f'http://suggestion.baidu.com/su?wd={word}&sugmode=3&json=1'
html=requests.get(url).text
html=html.replace("window.baidu.sug(",'')
html = html.replace(")", '')
html = html.replace(";", '')
#print(html)
html = json.loads(html)
key_words=html['s']
#print(key_words)
return key_words
本质上二和三性质相同,请大家参考使用!
扩大的视野
这里有一个小技巧,就是在关键词后面输入w,会出现一串拼音w开头的关键词,比如“黄山w”,会出现“黄山温泉”出现,“黄山玩几个天道”,“黄山五绝”等关键词(见上图)。因此,当我们遍历a~z的时候,关键词就会比较多。
" />
def get_more_word(word):
more_word=[]
for i in 'abcdefghijklmnopqrstuvwxyz':
more_word.extend(get_keywords('%s%s'%(word,i)))
print(more_word)
print(len(more_word))
print(len(list(set(more_word))))
return list(set(more_word)) #去重操作
def get_more_sug(word):
all_words = []
for i in 'abcdefghijklmnopqrstuvwxyz':
all_words += get_sug(word+i) # 遍历字母表 | 利用了上一个函数
print(len(list(set(all_words))))
return list(set(all_words)) # 去重操作
这里选择版本2的界面形式,避免被和谐
但是如果使用requests模块请求证书无效的网站,会直接报错。
可以将verify参数设置为False来解决这个问题
r = requests.get(url, verify=False)
但是设置 verify=False 会抛出一个 InsecureRequestWarning 警告
看起来很糟糕
解决方案:
from requests.packages.urllib3.exceptions import InsecureRequestWarning
技巧:SEO中的超级外链是什么意思?
“超级反向链接”这个词看起来很酷。其实很多做SEO的朋友都知道,“超级外链”是一种利用软件大量生成外链的工具。在外链为王的时代,广受站长推崇!
那么,超级外链这类软件在2017年还能用吗?
答案应该是可以用,主要看软件有多超级,但是对SEO的影响不会像以前那么有效了,因为百度的算法不断调整,这个操作不好,变成了作弊的范畴。
" />
那么,如何使用呢?
1.严格控制生成的外链数量
大家都知道,超级外链之所以超级,是因为可以瞬间产生大量的外链。按照之前的操作方法,肯定是能生成多少就生成多少。只要软件不卡顿,这两年肯定不行。,瞬间生成大量外链,目前无异于自寻死路。在网站建设初期,必须控制此类软件的发布数量。主要目的是吸引蜘蛛,而不是增加重量。所以,在分配目标网址的时候,尽量分配目录层级,比较Deep web,给这种软件!
2.推广外链外链
很多朋友可能会觉得有点绕口,外链external links,就是说用这个软件生成大量的外链,你需要在外链中收录,从而达到引流的目的外部链接,即使它们受到搜索引擎的惩罚,也会惩罚你的反向链接,而不是你的目标站点。
" />
3.选择合适的时间
很多新手站长在刚建站时,由于缺乏外链资源,急于求成。他们利用这类软件生成外链,以达到增加权重的目的。获得权限后,百度会在日常爬取频率比较高的时候,用它来发布深层目录的外链。
蝙蝠侠IT:微信公众号batmanit
SEO,网络营销,*敏*感*词*,新媒体运营,日常干货分享!