伪原创相似度查询(常见影响页面相似度的因素有哪些?(图))
优采云 发布时间: 2022-01-20 04:04伪原创相似度查询(常见影响页面相似度的因素有哪些?(图))
页面相似性概念
什么是页面相似度?即两个网页的相似度,包括页面文字内容、栏目布局结构、代码等。
页面相似度高的危害
当两个页面的相似度超过80%(有人认为是70%)时,很有可能被搜索引擎判断为抄袭页面或者抄袭页面,这样就不会是收录 ,甚至降级或删除。.
影响页面相似度的常见因素
1、网站的样板文件什么是样板文本?样板文本是出现在每一页上的内容。很多网站放置了横向导航,信息分类,然后在底部又加了一个导航;很多网站在底部放了很多*敏*感*词*、公司荣誉等内容;网站出现了通用链接和友情链接的全站输出,增加了示例文本,以及网站的分类,固定布局栏均为示例文本。
2、采集content or 伪原创很多SEO做网站优化,更新的内容是采集 or 伪原创,那么这些内容就是重复内容在网上 。以产品中心渠道为例,很多产品网站以图片为主,搜索引擎不会识别图片内容,那么我们可以适当添加内容,比如产品规格、参数、性能、使用方法、注意事项等,总体思路是:增加原创的内容,稀释相似内容占整个网站的比例,是降低网站相似度的好办法。
3、重复的页面标题和一些网站主页标题、目录标题,甚至内页标题都是一样的。这种相似性会导致点击量下降和流量减少。出现重复标题一般是程序调用的问题。制定调用规则并进行修改。
减少页面相似度的方法
1、添加原创内容
原创 绝对是独一无二的。添加网站原创内容可以有效降低网页的相似度。各大主流搜索引擎也喜欢这个网站。
2、放图片或flash
你可以把相似的页面内容放到这些里面,即使是相似的,你也不用操心。
3、使用 iframe
只需将类似内容嵌套到页面中即可。
4、 将相同的部分放入JS
因为JS不被搜索引擎认为是有用的代码,你可以把类似的页面放在JS里,而对于百度来说,JS是不可见的。
5、网站避免内页之间的相似之处
把网站的所有内页做成排版布局,或者调用统一的模板,这样网站的内页相似度很高,我们可以适当调整内页的位置版块,以及不同的内页标题和关键词,这样有助于搜索引擎抓取更多的页面。
页面相似度检测工具:
国内页面相似度查询检测工具
国外页面相似度查询检测工具——page-checker.php
用下面两页测试两个工具的区别
Similar Page Checker 查询结果相似度为 43%。
查询结果 39.93% 相似度。
从测试结果来看,差异不大,对测试两个网页的相似度有参考价值~!至于它们的核心算法,感兴趣的朋友不妨研究一下。
文:youboy潘炯文(编)