干货内容:长尾关键词优化与百度中文分词-小小课堂SEO教程
优采云 发布时间: 2022-10-27 04:13干货内容:长尾关键词优化与百度中文分词-小小课堂SEO教程
正确理解百度中文分词对长尾关键词优化很有帮助。
今天,小小课堂SEO自学网带来“长尾关键词优化与百度中文分词”。我希望能有所帮助。
1.简述中文分词
中文分词:是指将一系列汉字分割成单个单词。
通俗地说,就是把一条长尾关键词分成几个词。
2.一个例子来说明中文分词
① 以《搜索引擎优化培训》为例
百度搜索后,点击“百度快照”。
然后就会出现下图所示的结果。虽然词很长,但百度搜索并没有进行分词。
② 以“SEO小课堂”为例
百度搜索后,点击“百度快照”。
然后就会出现下图所示的结果。即使这个词比上面的词短,百度搜索仍然会进行分词。
长尾词“SEO小课堂”分为“SEO”和“小课堂”。
3.正确理解中文分词
当然,这个快照只是为了帮助我们理解中文分词。百度搜索引擎真正的中文分词是否如快照,不得而知。
①长尾关键词不是中文分词
就像“搜索引擎优化训练”一样,这么长的词可能会被搜索引擎看成一个关键词,所以我们在优化这个长尾词的时候,可能需要注意尽可能完整地出现这个词,而不是出现“搜索引擎优化”和“培训”就可以了。(只有可能~)
② 长尾关键词被中文分词
就像“SEO小课堂”一样,理论上我们只需要出现“SEO”和“小课堂”就可以满足进入搜索引擎索引数据库的条件。可能没有必要拥有一个完整的“SEO小课堂”。匹配长尾 关键词。(这是唯一可能的~)
③ 尽量匹配长尾词
小小课堂SEO自学网认为,无论长尾关键词是否分中文,出现完整总是好的。
就像上面那句话一样,真正的中文分词并不一定如快照所示。
四、中文分词优化长尾实际应用关键词
小班SEO自学网这里引用了网站建筑公司的案例,比如长尾关键词《游戏网站制作》。
① 让我们看一下快照
1) 快照显示为:游戏 网站、网站 构造。
2) 快照显示为:游戏 网站。
3) 快照显示为:Game, 网站Build。
4) 快照显示为:游戏 网站 构造。
以上情况也是百度排名的顺序。最后一个是完全匹配,但它排名最低。
② 中文分词分析
长尾关键词“游戏网站建设”,以上情况都出现过,可能还有更多,我们就不继续看截图了,但是我们可以知道的是:
即使不是完全匹配,也可以很好地排名。如果说关键词的密度为0%,仍然排在密度为关键词的页面前面。
也就是说,可以理解为“游戏”、“网站构造”、“游戏网站”、“游戏网站构造”,甚至是“游戏网站construction”出现在文章Construction”可能是搜索引擎判断页面是否与长尾关键词相关的依据。
③ 基于中文分词的负优化方法讲解
这种负面做法将受到即将于9月底推出的“飓风算法2.0”的惩罚,用户友好性太低。这只是一个解释的例子,不要尝试。
比如优化这个“game网站production”长尾词,首先,采集part of “game文章”,任何游戏都行,让搜索引擎知道这个文章 讲游戏,然后采集 一段文章 讲“网站建设”,把这两篇很不相关的文章 文章结合在一起,就是一个新的 文章文章,然后在写一些 原创 评论后,“游戏 网站 构造”完全匹配这个 关键词。
1)游戏文章,最好是知名的游戏,比如吃鸡,搜索引擎必须判断为游戏,可能连文字游戏都没有出现,也会判断为游戏。
2)网站construction是纯知识网站construction,所以搜索引擎必须判断为网站construction。
3)最后,有一个完整的匹配,所以也许搜索引擎会认为这是一个关于“游戏网站构建”的文章。
当然优化方法没有对错之分,这个例子只是为了让大家更容易理解这种优化方法。
以上是小小课堂SEO自学网带来的《长尾关键词优化与百度中文分词》。感谢收看。
喜欢记住,喜欢,奖励。小课堂SEO自学网,每天一个SEO原创视频图文教程,别忘了关注。
如需更多 seo 教程,请搜索小型教室。原创文章欢迎转载,保留版权:
干货教程:如何用最简单的Python爬虫采集整个网站
在之前的文章 Python实现“维基百科六度分离理论”基础爬虫中,我们实现了一个网站随机从一个链接到另一个链接,但是如果我们需要系统对整个网站 分类,或者要搜索 网站 上的每一页,我们该怎么办?我们需要采集整个网站,但那是一个非常占用内存的过程,尤其是在处理大的网站时,更合适的工具是使用数据库来存储采集Resources for,之前也说过。这是如何做到的。
网站地图站点地图
网站map,也叫sitemap,是一个页面,上面放置了网站上所有需要被搜索引擎抓取的页面(注意:不是所有页面,一般都是文章链接。大多数人在 网站 上找不到所需信息时,可能会求助于 网站 地图。搜索引擎蜘蛛喜欢 网站 地图。
对于 SEO,网站maps 的好处:
1. 为搜索引擎蜘蛛提供可以浏览整个网站的链接,简单反映网站的整体框架,供搜索引擎查看;
2. 为搜索引擎蜘蛛提供指向动态页面或其他方式难以到达的页面的链接;
3. 作为可针对搜索流量进行优化的潜在着陆页;
4. 如果访问者试图访问一个在 网站 的域中不存在的 URL,访问者将被引导到“找不到文件”错误页面,并且可以使用 网站map作为该页面“内容”的“准”。
数据采集
采集网站数据不难,但是爬虫需要有足够的深度。我们创建了一个爬虫,它递归地遍历每个 网站 并且只采集那些 网站 页面上的数据。通常耗时的 网站采集 方法从顶层页面(通常是 网站 主页)开始,然后搜索页面上的所有链接,形成一个列表,然后去到采集到这些链接的页面,继续采集到每个页面的链接形成一个新列表,重复执行。
显然,这是一个复杂性迅速增长的过程。每页添加 10 个链接,在 网站 上添加 5 个页面深度。如果采集 整个网站,则采集 页的总数为105,即100,000 页。