技巧:[采集法]阿里巴巴国际站关键词深度挖掘秘籍
优采云 发布时间: 2022-10-06 04:16阿里巴巴国际站-关键词挖矿
关键词挖掘
阿里国际站——关键词深挖,本教程教你如何挖阿里巴巴的关键词。首先,你为什么要这样做。做外贸的人,尤其是B类产品,对阿里国际站应该不陌生。阿里巴巴国际站通过自有平台站点获取流量(主要来自搜索引擎),然后通过站内系统通过竞价方式将流量分配给参与竞价排名的企业。(这是P4P)
因为,阿里巴巴不仅要为入驻商户提供流量,这些流量还必须是准确和可转换的。否则,商家的转化率将持续下降。(毕竟大家都是结果论)为了让商家买账,阿里国际参与谷歌SEO排名的词多为精准、可转化、流量词。
换个思路,如果能找到阿里巴巴参与排名,或者阿里巴巴优化的关键词,那么我们可以更好的提高P4P投放的准确率。同时,您也可以利用这个思路,通过优化自己的独立网站,参与对应关键词的评选和排名。
为了在阿里国际站找到这些准确的关键词,你只需要参考我下面的方法。(之前在SEO课程中讲过Ahrefs的使用方法,这次就不用了,而且所有步骤都不需要付费工具的帮助)
本教程阅读大约需要 10 分钟,操作大约需要 15 分钟。大家觉得内容不错,可以转朋友圈
01
查找阿里国际站排名模式(原理)
阿里巴巴排名算法
之前课程中提到,阿里国际站的流量入口大部分来自二级目录。像下面这样的表格
www.alibaba.com/showroom/ * .html
下面的 (*) 符号是 关键词 的变体。例如,您可以看到以下页面的 URL:
www.alibaba.com/showroom/river-sand-mining-equipment.htmlwww.alibaba.com/showroom/suv-side-step.htmlwww.alibaba.com/showroom/human-hair-wig.html
提示:此页面类型称为搜索聚合页面,阿里巴巴已对该 URL 进行了静态处理。同时在页面底部添加了固定的文字说明。
如果通过 Ahrefs 工具中的 Best Subfolders(热门子文件夹报告)查看数据,你会发现这类目录的页面基本占阿里巴巴主站流量的 83%。
通过这个,可以基本确定挖掘准确转换词汇的方向。
挖掘与您的产品相关的所有这些类型的页面 URL
从列出的页面 URL 中提取 关键词
02
如何挖掘 URL?
怎么挖这个
为了找到这些网址(与我们自己的产品相关),我们需要使用两件事,即:
首先打开,在搜索框中输入:
site:www.alibaba.com/showroom/ "关键词A" 关键词B
关键词A,是必填词(强匹配),关键词B 是弱匹配。
提示:强匹配(完美匹配)是指结果中必须出现精确的单词;弱匹配(非完美匹配)是指对应的词不一定出现,只要在语义上相关即可。
例如,假设我制作的产品是太阳能 LED 灯。首先我的要求是LED这个词一定要出现,而且一定和太阳能有关。然后我的命令如下:
site:www.alibaba.com/showroom/ "led" solar
你可能会在下面得到类似我的东西:
结果是所有与产品相关的和陈列室类型的页面。这时候需要多做一些结果,方便后续采集。(默认为每页10个结果,可以调整为每页100个结果)
选择 Google 搜索框下方的设置选项,然后单击其中的搜索设置
并将Results Per Page(每页的结果数)调整到最大值(最大值为100,默认为10)
现在所有结果都在结果页面上,接下来我们需要做的是提取这些 URL。
这里我们将使用刚才提到的 Scraper 插件。点击链接,下载并安装(一键),Chrome浏览器左上角会出现一个类似书签的图标。
显示此图标时,安装完成。做外贸的连浏览器插件都安装不了,只能回家抱孩子。
回到刚才的搜索结果页面,在任意空白处右键,选择“Scrape Similar...”(采集same type)
这时会出现采集工具窗口,在XPath Selector(选择器)中输入如下代码:
//a[starts-with(@href,"https://www.alibaba.com/showroom/")]
然后在下面的Column(列)中,输入以下代码:
@href
确认代码复制正确后,可以点击Scrape(采集按钮),然后点击Copy to clipboard,如下图所示。
这时候把剪贴板的内容复制到一个txt文档中,大致可以得到我下面的结果。
现在您有了这些页面的 URL(每页大约 90~100 个链接)
同时,您可以对搜索结果的第二页和第三页执行相同的操作。(一般5-6页,500-600字够你喝一壶,别贪心)
下一步是提取 URL 中的 关键词。
03
如何从列出的页面 URL 中提取 关键词
如何从列表中提取关键字
不要让这一步太容易!只需利用 txt 文档(记事本)中的替换功能。
首先打开粘贴页面 URL 结果的 txt 文件,然后按 Ctrl+H(替换)。
首先将 URL 的相同部分替换为“空白”。例如,以下内容将被替换:
https://www.alibaba.com/showroom/
.html 被替换两次后,将 关键词 中的 (-) 符号替换为空格。
至此,你就有了阿里巴巴的关键词的完整列表。后续可以使用Excel工具对挖掘出来的关键词进行基本的分类整理,方便用户后期的SEO优化。
教程总结:
其实挖的方法有很多种,原理都是一样的。如果想省事,可以使用 Ahrefs 工具批量操作。
把这个方法介绍给大家的目的,是希望大家在SEO和运营的过程中,学会通过多种渠道解决问题,而不是知道了,不知道为什么。
善于探索,善于总结,善于运用。
如果你能从一个案例中得出推论,那就说明你真的学会了这个技能。
结尾
经验:量化交易系统中的日志实用技巧
在AQF中搭建量化交易系统是一项综合性的工作,过程中难免会出现一些问题,所以小编为大家分享一些量化交易系统登录的实战技巧,希望对大家有所帮助。
1. 细分策略
为了区分不同类型的日志内容,我们一般将这些日志存储在对应的日志文件中,比如error.log文件中的异常日志、debug.log中的调试日志、业务类等。日志也会存储在相应的文件中,例如,回测过程中产生的日志可以存储在 backtest.log 中。
由于日志会在系统运行过程中不断产生,如果存储在文件中,会导致文件过大,难以定位。因此,有必要指定文件分割策略。常用的策略有两种:一种是每天生成一个新文件;另一种是指定一个较大的文件大小值,一旦达到这个大小,就会生成一个新的文件。这两种策略各有优缺点。按天拆分可能仍会生成非常大的文件。例如,回测的日志在几个小时内就达到了数百G;那么按文件大小拆分可能会导致一个文件收录好几天的日志,或者一天的日志分成多个文件。如果设置的文件太小,日志目录中可能会很快生成很多小文件。因此,划分方法应根据实际情况确定。大多数语言的日志框架都支持日志的定向输出和文件分段。如何使用它们取决于 API 文档。
在分布式量化交易系统中,各个子系统独立运行,部分因子或基础数据的计算模块是可插拔的,因此生成的日志也会分布在不同的系统上。我们目前看到的是分布式日志采集系统的架构。这里我们列出四大子系统:数据处理子系统、策略管理子系统、事务决策子系统和事务执行子系统。每个子系统在运行过程中都会产生大量的日志。为了采集这些日志,我们需要在每台主机上安装采集日志代理,也就是代理程序,比如阿里云使用的logtail,或者apache的flume代理等。这些代理需要安装在所有主机上。优越的。代理负责实时采集子系统产生的日志,然后将这些日志发送到统一的采集通道,即Collecting Channel。这个通道一般是一个临时的数据存储,比如Kafka。然后,它被发送到后端存储系统。日常存储系统需要兼顾存储效率和分析效率。一般来说,数据的粒度越细,可能需要保存的时间段就越短,所以这些日志应该根据压缩存储需要进行分析。日常存储系统需要兼顾存储效率和分析效率。一般来说,数据的粒度越细,可能需要保存的时间段就越短,所以这些日志应该根据压缩存储需要进行分析。日常存储系统需要兼顾存储效率和分析效率。一般来说,数据的粒度越细,可能需要保存的时间段就越短,所以这些日志应该根据压缩存储需要进行分析。
》》点击了解量化交易策略
2. 分析和报告
日志的分析一般包括离线分析。这种分析一般会生成定时报告,一种是实时分析。这种分析比较常见。比如我们经常看到5分钟内的在线用户数、日活跃用户数等等。类似的统计,这个是基于时间窗口统计的。日志分析的另一个要求是实时告警。在AQF量化交易系统中,数据是最关键的环节,数据出现任何异常都可能需要及时报警。比如交易所的数据接收程序突然异常停止,交易决策发出的异常指令超过了一定的阈值等等。报*敏*感*词*式有很多种,最常用的是邮件和短信,现在有一些可以连接微信的发送微信的开源程序。有时需要将告警进行重要级别的分类,同时要保证告警的准确性,否则会发生变化。变成狼,失去了应有的意义。还应谨慎选择警报的接收方。有时我们可能会认为消息发送给的人越多越好,因为总会有人看到它。其实只要和人没有直接关系,这个消息一般都会被直接忽略,起不到预期的效果。还应谨慎选择警报的接收方。有时我们可能会认为消息发送给的人越多越好,因为总会有人看到它。其实只要和人没有直接关系,这个消息一般都会被直接忽略,起不到预期的效果。还应谨慎选择警报的接收方。有时我们可能会认为消息发送给的人越多越好,因为总会有人看到它。其实只要和人没有直接关系,这个消息一般都会被直接忽略,起不到预期的效果。
从上面的架构可以看出,日志处理也是一个非常昂贵的项目,尤其是随着系统越来越大,日志系统的开发和维护任务也会变得非常繁重。幸运的是,日志分析是所有系统的共同需求,并且有很多开源软件可以帮助我们完成这些任务。另外,如果我们将系统部署到云端,我们也可以看到这些云服务商会提供相应的日志分析服务,而不需要我们重新发明轮子。
日志在整个系统的运行中起着非常重要的作用,所以一定要注意日志的使用。