php网页抓取标题(更新时间:2018-11-2708:34已阅读:次|作者:骏马网络)
优采云 发布时间: 2021-11-16 13:06php网页抓取标题(更新时间:2018-11-2708:34已阅读:次|作者:骏马网络)
重要信息-百度搜索页面标题规范-快速改变自己 更新时间:2018-11-27 08:34 阅读:时代 | 作者:君马网络 来源:潍坊都网站
对于搜索用户来说,标题是一个网页最直观的认知渠道和展示方式,也是吸引用户点击搜索结果进入登陆页面的关键因素。
为保证搜索用户有效访问所需资源,保证搜索结果的公平性,百度搜索现发布《百度搜索页面标题规范》,希望在满足用户需求的同时为站长带来更多流量。一个双赢的局面。
1、title的定义
对网页内容的准确简明描述。
具体例子:
图 1-1 符合规范的标题示例
体现在网页的源码中:
图1-2 符合规范的标题源代码示例
2、标题的作用
对于搜索用户来说,标题可以帮助用户快速洞察网页的内容,以及网页与搜索需求的相关性。它通常是用于确定用户点击哪个结果的主要信息。
因此,使用高质量的网页标题对于网站来说非常重要。
3、 百度搜索页面标题规范
3.1 标题原则
• 网站应保证站点下的每个页面都有指定的标题(如上图“图1-2兼容标题源代码示例”所示),同一站点的不同网页应使用不同的标题;
• 页面标题应准确概括页面内容,避免含糊不清、不相关的描述;
• 页面标题要简洁,避免使用冗长的标题,避免关键词堆砌;
• 页面标题符号使用正确,建议参考百度推荐的标题符号用法(详见《3.3.2 标题符号》本文部分)
3.2 不允许的标题类型
当标题有以下不良问题时,将相应限制搜索结果显示。
3.2.1 标题内容为假
指标题与网页内容不符,欺骗用户点击的情况。
类型一:假官网
指非官方的网站,但标题注明为官网。
在线截图:
图3-1 非官方网站但标题是官网的否定案例
类型二:无法满足用户需求
例如:标题表示小说txt可以下载或在线阅读,但页面不提供下载服务或诱导用户下载APP;或者标题说明百度云下载支持在线查看,但是页面不能下载也不能在线查看。
反例:
图3-2 标题表示可以下载小说,但页面诱导APP下载的反例
类型 3:标题部分虚假
例如,网页的标题显示了江苏某所大学的排名,但页面上只有大学列表,没有排名相关的内容。
3.2.2 重复和堆积的标题
指网站通过网页标题的过度重复或堆叠,获取不当流量的情况。
类型一:标题关键词大量重复
类型二:标题收录很多语义相似的关键词标签
反例:
图3-3 title stacking的Negative情况关键词
3.3 高质量页面标题的建议
一个高质量的网页标题不仅能清晰表达网页的主要用途,还能有效引导搜索用户,吸引目标用户点击。对于符合高质量规格的标题,百度会给予更多的呈现偏好。
3.3.1 标题的构成
百度页面标题可以概括为“核心词+修饰符”的格式,建议修饰符不超过3个。
具体说明如下:
3.3.2 标题符号
4、百度标题改写机制
为保证搜索用户的体验,百度搜索将对部分易误导用户的页面标题进行改写,包括但不限于以下情况:
对于标题堆叠等过度优化的网站首页,百度搜索会直接将过度优化的标题改写为网站名称或公司名称;
对于部分表意不明确的页面,百度搜索会从页面中提取关键信息并添加到标题中,以确保用户及时获取有效信息。
标题填充的重写示例:
图 4-1 标题堆叠问题的重写示例
本文转载:
文章 引用:如需转载请注明出处。