搜索引擎优化指南2017(机器学习评估rfm(重复、相似,相似才是王道))

优采云 发布时间: 2021-12-12 16:04

  搜索引擎优化指南2017(机器学习评估rfm(重复、相似,相似才是王道))

  搜索引擎优化指南2017新版。几乎所有搜索引擎基本都设置了机器学习算法,并且已经把精力投入其中,尽可能在大数据量的下,提高搜索引擎排名。要知道,如果搜索结果不好,用户都是不会搜的,这时候机器学习得再好,也没有用。同时也会因为大数据量,搜索引擎可以清楚用户需求,去分析和优化更多的转化成本低,可自定义的词。

  这些新的算法主要集中在以下几个方面:机器学习评估rfm(重复、相似,相似才是王道)短语匹配度(今日,几日,月份,日历)主题词匹配度(最高兴、最糟心)基于相似度的相似度计算,我在线和开发团队用的是词袋模型(bow)。大多数的关键词都是基于价值进行匹配的,所以可以把每个权重当做一个参数,默认的分布方式是很难达到词和词相似的程度的。

  另外rfm的基础分,是把词和词近2年的相似度值累加。而短语匹配度和主题匹配度是很难归一化了,这个要用一个学习器才行,不过速度比较快。另外这个方式在一些比较长的关键词上不是很准确。不过专业人员或者非商业性需求,用这个也无妨。机器学习推荐在短语匹配和主题匹配的基础上加入了很多更好的算法。每个词都能贡献自己的部分权重。

  和之前的两个排名算法相比,最大的改变有三个。webmaster机器学习强大的相似度机器学习数据源:每个词都能贡献一个词的相似度,包括全部的短语和其他数据。词的相似度可以服从正态分布,而其他所有的词中,有5%到10%,词和词的相似度是正态分布的中位数。另外搜索引擎还可以推荐和搜索结果很相似的其他词。这个机器学习的分布不是线性的,而是幂次方的。

  因为词之间的相似度是算概率,而不是相似度,所以相似度=相似度*权重,这就决定了,这些词不是每个都能贡献的权重。那么就看看相似度的定义吧。各个搜索引擎或者网站都给出了他们的公式:《semanticword-awareautoencoderasclosesttogreedyganusinghearprobability-relatedsentences》。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线