关键词自动采集生成内容系统-无需任何打理(两个问题在准备采集前的时候,有个蛋疼的问题)

优采云 发布时间: 2021-12-03 22:05

  关键词自动采集生成内容系统-无需任何打理(两个问题在准备采集前的时候,有个蛋疼的问题)

  两个问题

  在准备搜索采集之前的词的时候,有一个很痛苦的问题:

  无论是哪种词搜索渠道,固定搜索词(如阿拉巴巴招聘)和个性化搜索词(如阿里巴巴工程师的水平如何划分)总是混杂在一起的。对于同根下的扩展词,如何将这两种类型的词分开?

  固定搜索词通常可以根据固定词缀的出现次数来估计关键词的流量。毕竟同一个词缀出现的次数多,流量也会比较高。但是如何判断个性化搜索词的流量和竞争程度呢?

  为什么要找出这两种类型的词?因为这两种词的采集出处往往不同...

  如何区分固定搜索词和个性化搜索词

  因为固定搜索词收录常见的词缀,例如:

  php工程师工资,java程序员工资,学习php有没有前途,

  1

  php工程师工资,java程序员工资,学php有没有前途,...

  在这里,“salary”是一个通用词缀,它前面可以有关于职位的任何变量。

  手续办好了吗?

  因此,您可以使用程序分词来分别调出收录多个连续词缀的关键词。这可以通过python的jieba分词模块使用word2vec或K-means来完成。

  但是在实践中,由于解霸默认词典的限制,不同行业的分词效果并不理想。比如常见的词缀没有单独剪掉,导致后续聚类效果不理想。

  要达到理想的情况,需要不断优化jieba分词词典和聚类算法。

  不过这个人渣是假技术,只能假装威压。就算能做到,也需要很长时间。

  人肉做完了?

  人肉的想法很容易上手

  首先,找出整个行业的所有固定搜索行为。例如,这是招聘行业的固定搜索行为。即使不完整,也可以涵盖大部分:

  找出固定的搜索行为后,您就会知道该行业有哪些常见的词缀。剩下的就简单了,还是照常跑词,把跑出来的词都挑出来,包括常用词缀,剩下的都是个性化搜索词了。这都是艰苦的工作,战斗的体力。

  如何找到全行业固定的搜索词?这个渣之前写过,见:[SEO]关键词数据分析

  如何判断个性化搜索词的流量

  简单的事情就是运行索引。爱站和Ares Software都有这个功能。但是如果他们中的大多数没有索引怎么办?

  不知道怎么判断比较准确的搜索量,但是可以从关键词的来源渠道判断优先级。

  例如,从移动终端运行的词必须比从PC 终端运行的词具有更高的优先级。

  百度相关搜索词的优先级肯定比凤巢高(凤巢的话都是烂的,小站没机会)

  如果上传的内容类型是问答,那么百度知道相关搜索词必须比百度新闻相关搜索词具有更高的优先级

  …

  如何判断个性化搜索词的竞争程度

  这个人渣看百度搜索结果很没礼貌

  搜索结果数量越少,竞争程度越低,对于别人写得少的词,标题收录的概率就越大

  在前10名的搜索结果中,关键词浮红的数量越少,竞争越低

  site:(domain1 | domain2 | domain3),看看有没有几个大的网站都做过,尤其是58赶集和1688这样的流氓,因为这些超级大的网站做词,大中——中型网站 同理,超大中型网站抢的话,跟小网站没关系。

  我不是关注这个数字的,卧虎藏龙,有几个人年收入100W+

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线