关键词采集文章(本片文章教会大家如何利用爬虫软件批量抓取谷歌地图上的商家信息)

优采云 发布时间: 2021-12-15 22:15

  关键词采集文章(本片文章教会大家如何利用爬虫软件批量抓取谷歌地图上的商家信息)

  简介: 从事外贸的朋友在用webmail开发客户的时候应该有同感。无论是通过电子邮件还是群发邮件,最常见的方式是使用关键词和一些排除语法来谷歌搜索相关客户。网站,然后查看相关负责人的邮箱。时间久了,我们会发现,不管怎么搜索,潜在客户搜索网站的时候,往往会发现我们已经浏览过了,这样的潜在目标客户网站感觉很少,尤其是冷门产品的朋友,即使是用第三方外贸软件用关键词搜索,搜索到的很多网站都是复杂的,无关紧要,这让我们有时会感到困惑,不知道如何从其他方面找到更多的潜在客户网站。那么有没有更简单的方法可以直接找到目标客户的网站?答案是肯定的。

  本视频文章将教你如何使用爬虫软件批量抓取谷歌地图上的商家信息。相信用过谷歌地图搜索过的朋友应该都知道,只要输入关键词就会出现在地图上。列出的大部分业务信息都与我们自己的行业有关。如果我们想办法批量获取目标客户的网站和相关信息,那么我们就不用担心缺少潜在客户了。(市面上有一些第三方软件也提供批量获取谷歌客户信息的功能。根据我目前体验的一款第三方软件,有两个问题。一个是搜索范围限制在50公里以内,以及另一个是这个软件。现在的价格是极其昂贵的,一年的成本是几万。对于从事SOHO或者刚加入新公司,想有业绩的人来说,如果公司不提供这样的资源,对自己来说就一文不值。小成本。)通过这部电影文章你会学到;

  理论上可以批量获取谷歌地图上的所有客户信息。使用捕获的数据结合EXCEL表的数据透视表来分析目标客户的规模。暂时没想到。. .

  下面是实战教程,需要用到的工具,傻瓜式爬虫软件-优采云采集器,官方下载网站/

  

  打开谷歌地图搜索,点击位置搜索我们的产品关键词。我将以我们行业的珠宝为例。目标区域设置为美国阿拉巴马州的阿拉巴马州。我现在要做的就是抓住阿拉巴马州所有在谷歌地图上有信息的珠宝企业。

  

  现在我的目标是阿拉巴马州。通过搜索“珠宝”,我们可以发现右边有很多从事这个行业的商家。我现在点击蒙哥马利的其中一个城市,右边是这个区域的商家,我们会根据智能抓取把这个搜索结果的链接放在优采云软件采集中,让优采云 自动读取抓到的信息,如下图;

  

  点击字段立即创建爬取,会有两种情况,一种是自动识别正确的商家信息,如下图所示。

  

  另一个是识别失败,只出现一组链接。

  

  这时候我们需要点击手动识别,订单如页面类型上的箭头所示,点击列表类型-手动点击列表,然后点击右侧商户信息,点击第一个即可两个或三个,它会自动识别 和第一种自动识别数据的情况相同。

  

  

  

  这样我们就可以抓取到客户的基本信息。细心的朋友会发现这里抓取的数据没有目标客户的网站,那我们需要怎么做呢?识别数据后,点击deep采集,会自动点击第一个进入的商户信息,可以看到详细的商户信息,点击添加栏添加您需要的信息。

  

  设置好之后,我们只要点击开始采集,它就会一一抓取提取的信息。

  

  以上只是针对单个区域的爬取教程。该州有数十个城市。我们现在要做的就是批量捕获这个状态下的所有信息。我只准确到州内所有城市。也可以精确到某个县甚至某个县下的某条街道。只需使用谷歌直接搜索这些区域。操作如下。

  关于优采云爬图遇到的问题。

  不少小伙伴回应,优采云抓取到的数据为0,与官方沟通后,可能是优采云本身的BUG,也可能是谷歌地图的限制。经过测试,一般有两种方法。

  请尽量降低电脑分辨率,然后优采云自动识别页面上的数据。如果识别成功,基本上可以是采集。(具体降低分辨率是多少,因电脑不同,请自行测试)。使用xpath可以轻松解决。我特别感谢“不愿透露网名的大佬”提供的免费xpath。外贸朋友们,如果有干货可以多分享一下。具体使用方法如下。

  将此“//div[contains(@jsaction,'mouseover:pane')]”代码复制到页面类型-页面列表-xpath中进行编辑,然后地图的商家信息会自动识别。然后提取您想要的信息。

  

  PS:我们在提取业务信息时,有时会发现提取不完整。这是因为页面加载太快。我们可以在提取采集之前设置采集的页面读取速度,见下图。

  PS:我们在提取业务信息时,有时会发现提取不完整。这是因为页面加载太快。我们可以在提取采集之前设置采集的页面读取速度,见下图。

  

  以阿拉巴马州所有城市为例;

  通过维基百科谷歌“阿拉巴马城市列表”,找到我们想要的城市列表信息。

  

  复制城市信息,清理并去除重复项,新建一个txt文件,将这些城市的列表放入其中,一次保存一行。

  

  复制谷歌地图上的链接。请生成下图所示图片的链接格式,即搜索框内的关键词+特定区域。比如下图中“jewelry Abbeville”的红色字体就是准确的Area。

  

  打开优采云采集软件,选择创建智能模式,批量生成,然后删除红框内的所有部分。我是珠宝制造商。我的链接“/maps/search/jewelry+Abbeville/@39.8059575,-162.569945,3z/data=!3m1!4b1”被删除,格式为“/maps/ search/jewelry+”,得到图2。如果您正在寻找其他关键词,例如寻找宠物商店“宠物商店,

  "+store+Abbeville/@29.9749792,-92.1079631,15z/data=!3m1!4b1"

  然后我们删除“pet store+”后面的所有链接,得到链接“/maps/search/pet+store+”

  

  

  然后点击添加参数-选择从文件中读取,选择刚才保存的地址txt文件,然后点击确定立即创建。结合上面开头的教程,可以按照你填写的地区的顺序自动爬取,理论上可以爬取全世界所有的商家信息。如果你使用虚拟服务器一天24小时爬...

  

  

  

  

  通过上述方法,我们提取捕获的数据并对其进行清理以去除重复项。网站可以使用软件找到​​相关邮箱,手机号可以结合之前的教程,使用“whatsapp”进行批量营销。

  PS:我们把抓到的数据清理干净后,如果还有其他需求,比如我想给一个大的公司发一个有针对性的开发信,我如何确认一个公司比较大?简单的理解就是,越是出现在爬行区域的公司,其规模就会越大。这时候我们就可以利用EXCEL表的数据透视表来找到我们想要的公司了。请注意,我们需要设置一个间隔值。例如,如果我爬取了一千家公司,我们首先选择其中的 300 家进行测试。

  

  如下图,我把大约350家公司做了一个数据透视表。

  

  我们可以看到某些公司出现的频率明显很高,所以公司的规模应该很大,我们也可以将生成的数据复制粘贴到一个新表中,降序排序,看看它的外观公司 最常见。

  

  这样,我们不仅可以知道公司重复了多少次,还可以知道它的大概规模和有针对性的发展。

  今天的分享到此结束。如果喜欢我的文章,请点赞,转载请注明出处。另外,如果这篇文章文章有一百多个赞,下周分享使用Google图片批量抓取潜在客户的网站。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线