采集Amazon的热门搜索关键字非常简单! ! !

优采云 发布时间: 2020-08-06 01:07

  在我们日常使用的搜索引擎中,大多数搜索引擎都会根据输入的字符智能地匹配许多相关的关键字,以向用户推荐这些关键字,从而使用户可以更快地输入相关问题.

  当用户输入一个字符并遇到很多建议的候选单词时,如何选择,哪些显示在前面,哪些显示在后面?

  这是搜索受欢迎程度的问题.

  当用户在搜索框中搜索相关问题时,他们将输入大量关键字,并且每次输入都是对该关键字的投票. 然后,输入关键字的次数越多,对应的查询将越受欢迎. 因此,有必要记录查询关键词并统计每个关键词的出现频率,以利于按频率对提示结果进行排序.

  对于Amazon中的搜索也是如此. 如下图所示,输入“ A”后,将自动关联诸如“ amazon gift card”,“ airpods”和“ aa battery”之类的单词.

  

  那么您如何根据您设置的关键字分批采集Amazon推荐的热门搜索词?

  太简单了!

  使用Python只需完成四个步骤!

  1. 打开浏览器访问亚马逊,在亚马逊主页上按“ F12”,然后切换到“网络”.

  

  2. 在搜索框中输入任意字符,然后捕获并分析数据.

  

  这时,我们将在控制台中看到一个“建议?.....”请求. 单击并切换到“响应”选项卡,您可以清楚地看到亚马逊返回的数据. 我们复制数据(Ctrl + C中的Ctrl + A)以美化数据,并仔细查看返回的内容. 访问: 复制数据并查找.

  

  返回的数据是标准的json数据,数据中“ Value”键下的对应值是Amazon的热搜索关键字!

  通过这种方式,我们只需要带关键字模拟请求界面即可获取Amazon返回的热门搜索关键字. 这么简单吗?!

  3. 复制Curl并生成代码.

  或使用优采云方法向所有人演示. 首先,右键单击“建议?.....”请求,然后选择“复制”→“复制为cURL”.

  

  然后访问并填写复制的cURL以自动生成Python代码. 然后复制生成的代码并将其复制到PyCharm中.

  4. 修改代码以实现重用.

  在测试过程中,我删除了一些不必要的参数,最后只能实现三个参数和几行代码.

  导入请求

  关键字= str(input('请输入关键字: '))

  标题= {

  'Accept': 'application / json,text / javascript,* / *; q = 0.01',

  'Referer': '#39;,

  “来源”: “#39;”,

  'User-Agent': 'Mozilla / 5.0(Windows NT 6.1; Win64; x64)AppleWebKit / 537.36(KHTML,like Gecko)Chrome / 73.0.3683.103 Safari / 537.36',}

  params =(

  ('mid','ATVPDKIKX0DER'),

  ('alias','aps'),

  ('前缀',关键字),)

  response = requests.get('#39 ;, headers = headers,params = params)

  suggestions = response.json()['suggestions']

  对于我的建议:

  value = i ['value']

  打印(值)

  当然,这几行代码只能实现单个关键字的热门搜索字词的采集. 我们可以分批编写关键字,然后逐个请求,以达到批量采集的目的.

  在这里,技术小弟弟已将此功能封装到一个小工具中,只需将关键字写到表中即可分批采集!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线