总结:采集亚马逊热搜关键词,竟如此简单!!!
优采云 发布时间: 2022-09-28 12:13在我们日常使用搜索引擎的时候,大多数搜索引擎都会为了让用户更快速的输入自己想要的相关问题,而基于已输入的字符智能匹配出许多相关的关键字推荐给用户。
当用户输入一个字符,碰到提示的候选词很多的时候,如何取舍,哪些展示在前面,哪些展示在后面?
这就是一个搜索热度的问题。
用户在使搜索框搜索相关问题时,会输入大量的关键字,每一次输入就是对关键字的一次投票。那么关键字被输入的次数越多,它对应的查询就比较热门,所以需要把查询的关键字记录下来,并且统计出每个关键字的频率,方便提示结果按照频率排序。
而在亚马逊中的搜索也是如此。如下图,在输入一个”A”后会自动联想出“amazon gift cards”、“airpods”、“aa batteries”等词。
那么如何批量的根据自己设置的关键词去采集亚马逊推荐的热搜词呢?
So Easy!
用Python只需4步即可实现!
1、打开浏览器访问亚马逊,在亚马逊主页按下“F12”,并切换到“Network”。
2、在搜索框中输入任意字符,并抓包分析数据。
这时候我们会看到控制台中出现了“suggestions?.....”的请求。点击并切换到Response选项卡中,可以清楚的看到亚马逊返回的数据。我们将数据拷贝(Ctrl+A在Ctrl+C)出来,美化一下仔细看看到底返回了些什么。访问:将数据拷贝进去,一探究竟。
在返回的数据是一个标准的json数据,在数据中”Value”这个键下对应的值就是亚马逊的热搜关键字!
如此一来我们只需要带上关键字模拟请求这个接口,即可拿到亚马逊返回的热搜关键字。是不是So Easy?!
3、复制Curl,生成代码。
还是用优采云方法给大家演示,首先在“suggestions?.....”的请求上鼠标右键选择Copy→Copy as cURL。
然后访问,将复制的cURL填进去即可自动生成Python代码。再将生成的代码复制出来,在PyCharm中复制进去。
4、修改代码,实现复用。
在测试当中,我将一些不必要的参数删除最终只需三个参数、几行代码即可实现。
import requests
keyword = str(input('请输入关键字:'))
headers = {
'Accept': 'application/json, text/javascript, */*; q=0.01',
'Referer': '',
'Origin': '',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36',}
params = (
('mid', 'ATVPDKIKX0DER'),
('alias', 'aps'),
('prefix',keyword),)
response = requests.get('', headers=headers, params=params)
suggestions = response.json()['suggestions']
for i in suggestions:
value = i['value']
print(value)
当然这几行代码只能实现单个关键词热搜词的采集,我们可以将关键字批量的写入然后挨个的请求即可实现批量采集的目的。
在这里技术小哥哥已经将这个功能封装为一个小工具,只需将关键字写入到表格当中即可批量采集!
文末大福利
大家只需转发此篇文章到自己的朋友圈后,添加下方小哥哥微信,截图给到他就可以给到大家免费使用!
更有Reviews采集、QA采集、僵尸采集、跟卖提醒等工具,欢迎随时开撩获得更多工具!
▼往期精彩文章▼
在看点这里
汇总:自动批量关键词挖掘
常用的关键词挖掘方法有哪些,关键词是SEO中的重要一环,不管是网站建设还是小红书等自媒体,都需要我们对我们的关键词进行挖掘,如何寻找我们的核心关键词、长尾关键词和相关热搜词,今天我们来聊聊关键词挖掘的技巧分享。
我们可以通过很多渠道挖掘我们的关键词,例如通过百度指数对我们的关键词搜索量进行排序,并通过关键词规划师分析相关词的月搜索量和pc移动端的差异分析,当然也可以通过百度搜索的下拉词和推荐关键词进行寻找挖掘。
通过手动的挖掘,我们可以获得准确的信息,但是不合适批量的关键词挖掘,我们可以通过关键词挖掘工具对我们的关键词进行挖掘。关键词挖掘通过模拟人工对我们的下拉词、相关词和用户都在搜索的关键词进行挖掘,并一键导出本地。
关键词挖掘工具在SEO中被广泛使用,以SEO网站内容来说,批量关键词挖掘和长尾词分散在我们网站文章中发布,能为网站提权的同时提高网站tdk相关性,通过提高收录和关键词排名,让我们获得更多的倾斜。
合理使用关键词插入,把控关键词合理密度,能让搜索引擎更容易抓取文章的核心,但是如果超过阀值,可能获得适得其反的效果,尤其是搜索引擎已经变得聪明,它可以轻松识别我们的内容质量和关键词堆砌技术。
关键词堆砌是我们的文章内容内频繁出现某一个关键词并且明显高于平均比例的一种做法。现在,TF-IDF(词频-逆文档频率)被用来对抗关键词蚕食。在深入研究TF-IDF之前,我们需要了解关键词。当我们网站的各个页面有可能针对相同的关键词进行排名时,就会发生关键词蚕食。在这种情况下,搜索引擎无法决定针对特定关键词或查询对哪个页面进行排名,并且有时会降低我们的两个页面的排名。
在此过程中,我们需要访问关键词在我们网站的特定网页上的频率,即TF,与同一关键词在我们网站的各个页面(IDF)中出现的次数进行比较。有了这个,我们可以分析特定页面的重点关键词的力量。
它基本上是为了衡量我们的特定关键词的稀有度而计算出来的,这样我们就可以避免关键词蚕食。TF-IDF结果总是在0到1之间。如果值接近0,则表示关键词出现在多个页面上,存在关键词蚕食的可能性。如果结果接近1,则表示为单个页面指定了关键词,这是一个好兆头。
如果将此公式应用于非常常见的单词,例如“the”或“and”,我们会观察到结果接近0。当应用于特定关键词时,它将接近1,如果不是,那么我们需要重新考虑我们的关键词策略。