百度搜索指定网站内容(互联网新闻开放协议!(一)_网页_)

优采云 发布时间: 2021-11-21 15:11

  百度搜索指定网站内容(互联网新闻开放协议!(一)_网页_)

  开放协议概述

  使用这个开放的协议会给你的网站带来更多的流量!

  《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准,网站可以将发布的新闻内容制作成遵循该开放协议的XML格式网页(独立于原新闻稿的形式)供搜索引擎索引,并主动及时将网站发布的新闻信息通知百度搜索引擎。

  采用“互联网新闻开放协议”,相当于网站的新闻被搜索引擎订阅。通过百度这个全球最大的中文搜索引擎,网民将能够在更大范围内更频繁地访问。访问您的网站新闻,进而为您的网站带来潜在流量。

  开放协议非常简单!在我们的帮助下,您可以轻松使用它。开放协议内容

  下图是按照“互联网新闻开放协议”制作的一个XML格式的网页。该网页以标准格式列出了网站发布的新闻的相关信息。

  XML 页面示例:

  

  XML标签说明:带星号的为必填项,不带星号的为可选项。

  *-标记整个XML文件内容的开始和结束。

  *——站点地址。

  *——负责人邮箱。必要时,我们将通过此地址与您联系。

  *——更新周期,以分钟为单位。搜索引擎会按照这个循环访问页面,让页面上的新闻及时出现在百度新闻中。

  *——标记每条新闻消息的开头和结尾。标签是一条新闻信息,不包括新闻主题。

  *--头条新闻。

  *——新闻url地址,与单条新闻一一对应;如果分页新闻有多个网址,则相当于多条新闻。

  ——新闻内容介绍。

  *——完整的新闻文本(仅收录正文,不包括HTML语言等其他字符)。这个项目的目的是让新闻在搜索结果中出现的频率越来越高。

  *——新闻正文中的相关图片,使用绝对地址。如果新闻文章没有相关图片,可以为空;如果有多张图片,请重复使用此标签。该项目的目的是在搜索结果中显示新闻的相关图片。

  ——对于可能成为头条新闻的新闻,标题图形使用绝对地址。

  ——一个或多个反映新闻主题内容的关键词,关键词之间用空格隔开。此项目仅供参考,搜索结果不完全取决于此标签中的内容。

  —— 新闻分类,可以按照网站自己的分类系统,最好是一级分类。

  ——新闻撰稿人,可以是组织,也可以是个人。

  ——新闻来源,即原创媒体或其他机构。

  *

  ——新闻发布时间与新闻HTML页面上的发布时间一致。请准确到分钟;如果您的 网站 发布时间没有记录小时和分钟,只需提供年月日。

  推荐时间格式:年、月、日、时、分、秒

  例如:2005-11-09 10:37|2005/11/09 10:37:00|2005.11.09 10:37:00|

  2005 年 11 月 9 日 10:37:00|格林威治标准时间 2005 年 11 月 9 日星期五 10:37:00

  开放协议使用

  在使用之前,您需要了解以下几点: 您的网站是否已经成为百度新闻源,或者没有被百度新闻收录搜索到,您都可以使用该开放协议。您使用开放协议提供的内容均应符合以下“新闻来源收录标准”。《互联网新闻开放协议》只是对原新闻源收录的辅助和有益补充,并非完全替代。

  消息来源收录标准:

  百度希望多元化新闻来源,鼓励原创新闻内容。如果是正规合法的媒体网站,有大量有价值的新闻内容可以及时更新,并且服务器稳定高速,符合百度收录 新闻来源。

  百度新闻搜索收录内容包括时事、娱乐、体育、财经、科教文化、社会生活、市场信息、数码产品、房地产、汽车评价等各类新闻报道和媒体评论,以及各个行业的趋势。行情、机构工作动态等,是由专业人士撰写或编辑的中文信息,不包括发布的个人信息、论坛、博客、广告、幽默笑话、情感故事、*敏*感*词*、照片、剧照、名人档案、食谱、下载、多媒体以及其他语言的其他类型的互联网信息。

  您应对所提供的所有内容承担全部法律责任,保证您所提供内容的真实性、合法性,不得侵犯任何第三方的权益。

  让我们现在开始!

  步骤 1:创建 XML 文件

  在创建XML文件之前,请务必阅读百度新闻搜索的新闻来源收录标准,并特别注意:

  1、百度新闻搜索收录的新闻来源网站必须遵守并严格遵守国家《互联网新闻信息服务管理条例》,在新闻发布过程中尊重创作者和来源。新闻稿及转载网站版权所有。

  2、百度新闻搜索不适合网站类型的收录,包括:论坛、博客、公司网站等。

  3、百度新闻搜索不收录个人信息、广告、竞价、教程、幽默笑话、情感故事、*敏*感*词*、照片、剧照、名人档案、食谱、下载、多媒体等类型和其他语言关于互联网信息。

  4、百度新闻搜索希望收录高质量的中文新闻,而不是收录英文等非中文新闻。

  5、请按照上面公布的开放协议的内容创建一个XML文件。

  其他说明:

  支持的编码格式为GB2312、GB18030、UTF-8、BIG5,推荐使用GB18030或UTF-8格式。您可以将网站某个时间段内发布的所有新闻放在一个XML文件中,也可以按频道或栏目放在多个XML文件中。请让每个 XML 文件根据更新周期处于持续自动更新状态。更新周期可根据您的需要随时调整。每个 XML 文件最多可存储 100 条新发布的新闻,无需保存之前的新闻。请按时间顺序对已发布的新闻进行排序,即最新的新闻排在最前面,否则可能会错过新闻。XML 标签的内容不能收录文本以外的任何代码。下表中的特殊字符必须转换为 XML 定义的转义字符。除此以外,会发生错误,搜索引擎将无法获取页面上的新闻。字符转义后的字符HTML字符编码和(和)&&&单引号"'双引号"""大于号>>>小于号下面地址提供了多种工具帮你验证XML的结构文件:

  #工具

  经过验证的XML文件可以使您提供的信息更加规范,确保您发布的新闻信息不会被搜索引擎遗漏。

  第 3 步:提交 XML URL

  提交前请先将XML文件上传到您的网站服务器,并在下方对应框中输入XML文件的URL地址等信息。搜索引擎会直接访问URL地址,当URL地址改变时需要重新提交。

  如果您的网站符合新闻来源收录标准,百度新闻搜索将对您提交的数据进行一周的测试观察。如果XML文件基本按照《互联网新闻开放协议》的要求制作但有问题,我们会根据XML页面提供的邮箱地址与您联系。

  注意:

  1、 我们将审核您提交的 XML 文件。百度新闻搜索不保证收录您提交的所有内容都会得到保证。

  2、 站点名称和地址是必需的。您最多可以在一天内在同一站点上提交 5 个不同的 XML 文件地址。

  3、提交地址后,请查看弹窗信息,确认是否提交成功。

  第四步:查询XML文件的状态

  您可以在下面的框中输入您提交的XML文件的地址,查看文件的处理进度和反馈信息。

  注意:输入的地址必须完整,即与您提交的地址完全一致。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线