php网页抓取标题(更新时间:2018-11-2708:34已阅读:次|作者:骏马网络)

优采云 发布时间: 2021-11-16 13:06

  php网页抓取标题(更新时间:2018-11-2708:34已阅读:次|作者:骏马网络)

  重要信息-百度搜索页面标题规范-快速改变自己 更新时间:2018-11-27 08:34 阅读:时代 | 作者:君马网络 来源:潍坊都网站

  对于搜索用户来说,标题是一个网页最直观的认知渠道和展示方式,也是吸引用户点击搜索结果进入登陆页面的关键因素。

  为保证搜索用户有效访问所需资源,保证搜索结果的公平性,百度搜索现发布《百度搜索页面标题规范》,希望在满足用户需求的同时为站长带来更多流量。一个双赢的局面。

  1、title的定义

  对网页内容的准确简明描述。

  具体例子:

  

  图 1-1 符合规范的标题示例

  体现在网页的源码中:

  

  图1-2 符合规范的标题源代码示例

  2、标题的作用

  对于搜索用户来说,标题可以帮助用户快速洞察网页的内容,以及网页与搜索需求的相关性。它通常是用于确定用户点击哪个结果的主要信息。

  因此,使用高质量的网页标题对于网站来说非常重要。

  3、 百度搜索页面标题规范

  3.1 标题原则

  • 网站应保证站点下的每个页面都有指定的标题(如上图“图1-2兼容标题源代码示例”所示),同一站点的不同网页应使用不同的标题;

  • 页面标题应准确概括页面内容,避免含糊不清、不相关的描述;

  • 页面标题要简洁,避免使用冗长的标题,避免关键词堆砌;

  • 页面标题符号使用正确,建议参考百度推荐的标题符号用法(详见《3.3.2 标题符号》本文部分)

  3.2 不允许的标题类型

  当标题有以下不良问题时,将相应限制搜索结果显示。

  3.2.1 标题内容为假

  指标题与网页内容不符,欺骗用户点击的情况。

  类型一:假官网

  指非官方的网站,但标题注明为官网。

  在线截图:

  

  图3-1 非官方网站但标题是官网的否定案例

  类型二:无法满足用户需求

  例如:标题表示小说txt可以下载或在线阅读,但页面不提供下载服务或诱导用户下载APP;或者标题说明百度云下载支持在线查看,但是页面不能下载也不能在线查看。

  反例:

  

  图3-2 标题表示可以下载小说,但页面诱导APP下载的反例

  类型 3:标题部分虚假

  例如,网页的标题显示了江苏某所大学的排名,但页面上只有大学列表,没有排名相关的内容。

  3.2.2 重复和堆积的标题

  指网站通过网页标题的过度重复或堆叠,获取不当流量的情况。

  类型一:标题关键词大量重复

  类型二:标题收录很多语义相似的关键词标签

  反例:

  

  图3-3 title stacking的Negative情况关键词

  3.3 高质量页面标题的建议

  一个高质量的网页标题不仅能清晰表达网页的主要用途,还能有效引导搜索用户,吸引目标用户点击。对于符合高质量规格的标题,百度会给予更多的呈现偏好。

  3.3.1 标题的构成

  百度页面标题可以概括为“核心词+修饰符”的格式,建议修饰符不超过3个。

  具体说明如下:

  

  3.3.2 标题符号

  

  4、百度标题改写机制

  为保证搜索用户的体验,百度搜索将对部分易误导用户的页面标题进行改写,包括但不限于以下情况:

  对于标题堆叠等过度优化的网站首页,百度搜索会直接将过度优化的标题改写为网站名称或公司名称;

  对于部分表意不明确的页面,百度搜索会从页面中提取关键信息并添加到标题中,以确保用户及时获取有效信息。

  标题填充的重写示例:

  

  图 4-1 标题堆叠问题的重写示例

  本文转载:

  文章 引用:如需转载请注明出处。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线