百度查找引擎对做弊网页的界说(组图)

优采云 发布时间: 2021-05-09 00:07

  百度查找引擎对做弊网页的界说(组图)

  •采集著名小说网站的盗版小说页面。

  参考示例:

  示例

  内容质量

  澄清

  案例3. 1. 2-1

  中等

  网易直接转载了来自我国新闻网的新闻。

  案例3. 1. 2-2

  中等

  网民在图书馆上传的“国庆假期组织”新闻

  案例3. 1. 2-3

  中等

  采集起点小说网站的盗版小说网站

  案例3. 1. 2-4

  中等

  *敏*感*词*上的一般帖子

  3、内容质量较差:

  百度搜索引擎认为,主要内容的内容是较少的信息,或者没有有用的信息,或者该信息无效且已过期。这归因于内容质量差。对用户没有实质性的帮助,应减少其显示时间。同时,如果网站中此类页面的比例太大,也会影响百度搜索引擎对该网站的评级,尤其是UGC 网站,电子商务网站和黄页网站。 ,处理无效网页。例如:

  •已从货架上删除的产品页面或已过期的团购页面;

  •使用寿命已过的招聘和交易页面;

  •资源已过期,例如视频已删除,下载后无法使用软件等。

  4、完全没有内容质量:

  根本没有内容质量的网页是那些制造成本低,偷工减料的网页;从其他地方采集的内容无需修改和整理就可以在线放置;病毒,例如*敏*感*词*木马;收录作弊或意图;不能满足用户需求甚至收录欺诈性内容的透彻网页。例如:

  •内容简短且空白,内容很少,但不能支持页面的主要意图;

  •问答页面上有问题,没有答案,或者答案根本无法解决问题;

  •在站点中搜索了结果页面,但未提供任何相关信息。

  除了上述网页外,欺骗用户和搜索引擎的网页在没有内容质量的内容中占很大比例。百度搜索引擎作弊网页的定义是:那些不旨在满足用户需求的网页,用于通过不合理手段骗取用户和搜索引擎以获取利润的网页。目前,Internet上的这部分网页数量仍然很少,但作弊网页的价值为负,对用户的危害很大。对于这样的网页,搜索引擎必定会感到震惊。

  衡量网页质量的维度-不同质量网页的阅读体验会给用户带来很大的阅读体验差距。高质量的网页应为用户带来积极的阅读体验。用户希望看到干净且易于阅读的网页。乱序的布局和过多的广告将影响用户对网页主要内容的访问。在百度搜索引擎网页质量体系中,网页主要内容的用户获取成本与阅读体验成反比,即获取成本越高,阅读体验越低。面对内容质量接近的网页,阅读体验更好的网页可以轻松获得更高的排名。对于阅读体验较差的网页,百度搜索引擎会根据情况降低其显示甚至拒绝输入的可能性。

  许多因素会影响用户的阅读体验。现在,百度搜索引擎主要从内容布局和广告影响力来考虑网页:

  内容布局:用户在进入网页时看到的是内容布局。布局确定了用户对网页的**印象,还确定了用户的内容获取成本。

  广告影响力:百度搜索引擎了解网站的生计发展需要财政支持,并支持在网络上放置合理的广告。该网页的主要目的应该是满足用户的需求。 **情况是“主要内容和广告共同满足用户的需求,内容是主要内容,广告是补充”,而广告不应成为网页的主体。

  让我们以一个例子来了解百度的搜索引擎如何对网页的浏览体验进行分类。基于此,网站管理员可以比较并检查其网站的浏览体验:

  1、良好的阅读体验:

  页面布局合理,用户获取主要内容的成本较低。通常,它具有以下特征:

  •布局合理,布局美观,易于阅读和阅读;

  •用户所需的内容占据了网页的最重要位置;

  •通过页面标签或页面布局可以清楚地区分哪些广告;

  •广告不会抢占主要内容,也不会阻止用户获得主要内容;

  参考示例:

  示例

  阅读经验

  澄清

  案例3. 2. 1-1

  好

  招聘,房地产等。网站主页上也有很多广告,但它们都与招聘有关。阅读经验还可以。

  案例3. 2. 1-2

  好

  文章页面,页面布局合理,没有广告,布局良好,结构合理

  案例3. 2. 1-3

  好

  游戏首页,布局精美,布局合理,无广告,阅读体验出色

  2、阅读体验不佳:

  页面布局和广告放置会影响用户对主要内容的访问,增加用户获取信息的成本,并使用户感到不舒服。在以下情况下包括但不包括**:

  •正文内容没有包裹或分裂,这使用户难以阅读;

  •很难区分风景的字体和颜色;

  •页面布局不合理,在页面的第一个屏幕上看不到有价值的主要内容;

  •广告掩盖了主要内容;也许在一般分辨率下,第一个屏幕上充满了广告,并且主要内容不可见;

  •弹出广告过多;

  •太多影响观看的浮动广告

  •单击链接时,出现意外的弹出窗口;

  •广告和内容混杂,不易区分;

  衡量网页质量的维度-可访问性。用户期望从搜索引擎中快速获取所需信息。百度搜索引擎为用户提供了可以一次直接获取所有信息的Web结果。百度搜索引擎认为,无法直接获取主要内容的网页对用户不友好,并会根据情况调整其显示概率。

  百度搜索引擎将从三个方面来判断网页的可访问性:正常打开,权限限制和有用性。对于可以正常访问的网页,可以参与正常排名;关于具有权限限制的网页,其他尺寸用于检查网页的可访问性。进行调查;对于无效网页,其显示机制将降低,甚至从数据库中删除。

  1、可以正常访问的网页

  没有权限限制,您可以直接访问所有主要内容网页。

  2、具有权限限制的网页

  此类网页有两种类型:打开权限和资源获取权限

  1)打开许可:指打开网页所需的登录许可。未经许可,将无法看到详细内容。普通用户无法获得它或获得它的成本很高。百度搜索引擎将降低其显示概率。不包括以登录为主要功能的网页。

  2)资源访问权限:指对网页主要内容的访问,例如文档,软件,视频等,这需要权限或设备插件来获取完整内容。此时将出现三种情况:

  •网站提供高质量,真实的内容,因为内容的构建成本很高,尽管全文或下载需要许可或安装插件,但这在用户的期望之内,而百度搜索引擎可以不要以为许可行为对用户有害。如果形成损坏,请与正常的可访问页面一样对待。

  •关于某些非高级和非正版资源,它们来自用户重印,甚至来自机器采集。它们具有低成本和不同的内容。用户对资源的访问也受到权限的限制-用户需要注册和登录或付费才能查看,百度搜索引擎将根据详细情况决定是否调整其显示。

  •还有一些视频和下载资源页面。也许他们自己的资源的质量还不错,但是它们需要安装非常不受欢迎的插件才能正常访问它们。例如,当需要“ xx重磅*敏*感*词*玩家”时,百度搜索引擎将怀疑他们是恶意的意大利倾向。

  参考示例:

  示例

  可访问性

  澄清

  案例3. 2-1

  好

  有关CNKI的论文可以付费下载,但有版权,您将拥有良好的阅读体验

  案例3. 2-2

  好

  优酷的新电影,需要付费才能观看,并且您将获得良好的阅读体验。

  案例3. 2-3

  中等

  内容已复制,但您需要登录才能查看更多

  案例3. 2-4

  差

  参加聚会本身的申请表已重印,并且在Internet上无处不在,但是此页面仍然需要付费才能下载。

  3、无效的网页

  它通常是指链接无效且主要资源无效的网页。百度搜索引擎认为,网页的这一部分无法提供有价值的信息。如果网站中此类网页过多,也会影响百度搜索引擎的进入和评级。建议网站管理员相应地设置此类网页,及时登录百度网站管理员频道,并使用失效链接提交工具向百度搜索引擎报告。

  无效网页收录但不收录在以下位置:

  •40 4、 40 3、 503和其他网页;

  •程序代码错误网页;

  •打开后,提示内容已删除,或者由于内容不再存在而跳至首页;

  •论坛帖子中的内容已删除,视频页面已删除(大多出现在UGC网站上)

  Internet网络资源的现状

  CNNIC在2014年初发布的《关于我国互联网发展的计算报告》中指出,截至2013年12月,我国的网页数据为1500亿,比2012年同期增长了2 2. 2% 。2013年,单个网站的平均网页数量和单个网页的平均字节数不断增加,这表明我国互联网上的内容更加丰富:网站的平均网页数量]达到4. 690,000,比去年同期增长2. 3%。

  为了确保搜索质量并提高用户满意度,百度搜索引擎将每周对网页质量进行一次样本评估。但是,根据过去一年的评估数据,我们发现高质量网页的数量非常少并且几乎没有增加;普通网页的比例在下降,相应地,劣质网页的比例也显着增加。截至2014年5月,计算数据显示,在百度网络搜索找到的海量网页中,高质量网页仅占7. 4%,劣质网页高达21%,其他普通网页则占7 1. 6%。

  

  经过一系列筛选,识别,分析和授权百度Web搜索之后,我们尽力为用户提供更多高质量的网页,每天影响成千上万的质量较差网站的用户,网页。尽可能减少由质量差的网页给用户带来的麻烦。从2014年5月下图所示的网页显示分析数据来看,在用户面前显示的网页质量现在是高质量网页的40%,质量较差网页的11%,尽管这种变化现在非常明显。但是,百度网络搜索仍然希望与广大网站管理员合作,以将质量较差的比例降低到更低的水平。

  Internet上的所有网页

  在百度上找到显示的网页

  高质量网页

  7. 4%

  41%

  常规网页

  7 1. 6%

  49%

  网页质量不佳

  21%

  11%

  上述劣质网页包括两个部分:劣质网页和废品网页。劣质网页的问题分散如下图所示:

  从上图可以看出,低质量网页中最严重的问题是由于过多的广告,占据网页的主要位置以及意外的弹出窗口,简短的内容和网页而导致的阅读体验不佳。需要获得资源和过时信息的许可也是低质量网页的重要组成部分。

  除低质量的网页外,质量较差的网页没有质量浪费的网页的问题如下图所示散布:

  

  从上图可以看出,低质量网页中最严重的问题是由于过多的广告,占据网页的主要位置以及意外的弹出窗口,简短的内容和网页而导致的阅读体验不佳。需要获得资源和过时信息的许可也是低质量网页的重要组成部分。

  除低质量的网页外,质量较差的网页没有质量浪费的网页的问题如下图所示散布:

  

  无效链接对于用户网站和搜索引擎以及无效网页的百分比**没有意义。其次,欺骗对用户和搜索引擎造成重大损害的网页,以及资源,无效问题和不相关的搜索结果页面无效的网页,也是搜索引擎不会向用户显示的网页。

  百度搜索引擎对网站站长的建议

  上面介绍了百度搜索引擎对网页质量的确定规范。与这些规范相对应,网站管理员在实践中应遵循以下准则:

  •规划网页时,首先要考虑的是用户,而不是搜索引擎

  •**首先放置用户体验

  •根据用户需求创建内容

  •多考虑如何使您的网站具有共同价值

  •长期关注,过多的广告弊大于利。

  •及时删除低质量的内容

  •请勿试图以任何方式欺骗用户和搜索引擎

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线