百度搜索指定网站内容(互联网新闻开放协议!(一)_网页_)
优采云 发布时间: 2022-04-12 08:22百度搜索指定网站内容(互联网新闻开放协议!(一)_网页_)
开放协议概述
使用此开放协议将为您的 网站 带来更多流量!
《互联网新闻开放协议》是百度新闻搜索为搜索引擎新闻源制定的收录标准。网站可以将发布的新闻内容制作成遵循这种开放协议(独立于原创新闻发布形式)的XML格式网页供搜索引擎索引,并将网站发布的新闻信息通知百度搜索引擎主动和及时的方式。
采用“互联网新闻开放协议”,相当于网站的新闻被搜索引擎订阅。通过全球最大的中文搜索引擎百度,网民的订阅范围将更广、频率更高。访问您的 网站 新闻并将潜在流量吸引到您的 网站。
开放协议非常简单!您可以在我们的帮助下轻松使用它。开放协议内容
下图是一个按照“互联网新闻开放协议”制作的XML格式的网页。该网页以标准格式列出了网站发布的新闻的相关信息。
XML网页示例:
XML标签说明:带星号的为必填项,不带星号的为可选项。
* - 标记整个 XML 文件内容的开始和结束。
* - 网站地址。
*——负责人邮箱。我们在必要时使用此地址与您联系。
*——更新周期,以分钟为单位。搜索引擎会按照这个周期来访问页面,让页面上的新闻更及时地出现在百度新闻中。
* - 标记每条新闻消息的开头和结尾。该标签收录一条新闻信息,不包括新闻主题。
*--新闻标题。
*——新闻url地址,与单个新闻一一对应;如果分页新闻中有多个URL,则相当于多个新闻。
- 新闻内容简介。
*——完整的新闻正文(仅收录正文,不收录HTML语言等其他字符)。这个项目的目的是让新闻在搜索结果中出现越来越准确。
*——新闻正文中的相关图片,使用绝对地址。如果新闻没有相关图片,则可以为空;如果有多张图片,请重复使用标签。这个项目的目的是让这个新闻的相关图片出现在搜索结果中。
- 绝对地址用于为可能成为头条新闻的新闻制作的头条新闻。
——一个或多个反映新闻主题内容的关键词,关键词之间用空格隔开。此项目仅供参考,搜索结果并不完全取决于此标签的内容。
——新闻分类可以按照网站自己的分类系统,最好是一级分类。
- 新闻作者,可以是机构或个人。
- 新闻来源,即原创媒体或其他机构。
*
——新闻发布时间,与新闻HTML页面的发布时间一致。请精确到分钟;如果您的 网站 发布时间没有记录小时和分钟,只需提供年、月和日。
推荐时间格式:年月日时分秒
例如:2005-11-09 10:37|2005/11/09 10:37:00|2005.11.09 10:37:00|
格林威治标准时间 2005 年 11 月 9 日 10:37:00 | 格林威治标准时间 2005 年 11 月 9 日星期五 10:37:00
使用开放协议
使用前需要了解以下几点:无论你的网站已经成为百度动态消息还是未被百度新闻收录搜索,都可以使用这个开放协议。您使用开放协议提供的内容都应符合以下新闻提要收录标准。Internet 新闻开放协议只是对原创新闻源 收录 的辅助和有用的补充,而不是完全替代。
动态消息收录标准:
百度希望新闻来源多元化,鼓励原创新闻内容。如果是正规合法的媒体网站,有大量有价值的新闻内容,可以及时更新,而且网站服务器稳定高速,符合要求配合百度收录新闻源的基本原理。
百度新闻搜索收录的内容包括时事、娱乐、体育、财经、科教、文化、社会生活等各种新闻报道和媒体评论,数码产品、房地产的市场信息和评价、汽车等行情、组织工作动态等,是由专业人士撰写或编辑的中文信息,不包括已发布的个人信息、论坛、博客、广告、幽默笑话、情感故事、*敏*感*词*、照片、剧照、明星档案、食谱、下载、多媒体和其他类型的其他语言的互联网信息。
您应对您提供的所有内容承担一切法律责任,保证您提供的内容的真实性和合法性,不得侵犯任何第三方的权益。
让我们开始吧!
步骤 1:创建 XML 文件
在创建 XML 文件之前,请务必阅读百度新闻搜索 News Feed 收录 标准,并特别注意:
1、百度新闻搜索收录的新闻来源网站必须遵守并严格遵守国家《互联网新闻信息服务管理条例》,尊重创作者和来源新闻发布和转载过程网站 版权所有@网站。
2、百度新闻搜索不适合收录网站类型包括:论坛、博客、公司网站等。
3、百度新闻搜索不收录个人信息、广告、竞价、教程、幽默笑话、情感故事、*敏*感*词*、照片、剧照、明星档案、食谱、下载、多媒体等类型,其他语言,互联网信息。
4、百度新闻搜索期待收录高质量的中文新闻,而不是收录英文和其他非中文新闻。
5、请根据上面公布的开放协议内容创建一个XML文件。
其他说明:
支持的编码格式为 GB2312、GB18030、UTF-8、BIG5,推荐使用 GB18030 或 UTF-8。您可以将网站在某个时间段内发布的所有新闻放在一个XML文件中,也可以按频道或部分将其放入多个XML文件中。请保持每个XML文件按照更新周期不断自动更新的状态。更新周期可根据您的需要随时调整。每个 XML 文件最多可存储 100 条最新新闻,无需保存以前的新闻。请按时间顺序对已发布的新闻进行排序,即最新的新闻排在最前面,否则可能会错过新闻。XML 标记内容不能收录除文字文本之外的任何其他代码。下表中的特殊字符必须转换为 XML 定义的转义字符。否则会发生错误,搜索引擎将无法获取页面上的新闻。字符后字符转义 HTML 字符编码和 (and) &&& 单引号 ''' 双引号 """ 大于号 >>> 小于号 步骤 2:验证 XML 文件
以下地址提供了各种工具来帮助您验证 XML 文件的结构:
#工具
经过验证的 XML 文件可以使您提供的信息更加标准,并确保您发布的新闻信息不会被搜索引擎遗漏。
第 3 步:提交 XML URL
请在提交前将XML文件上传到您的网站服务器,并在下方对应的框中输入XML文件的URL地址等信息。搜索引擎会直接访问 URL 地址,当 URL 地址发生变化时需要重新提交。
如果您的网站符合新闻来源标准收录,百度新闻搜索将对您提交的数据进行为期一周的测试和观察。如果XML文件基本上是按照互联网新闻开放协议的要求制作的,并且出现问题,我们会根据XML页面上提供的邮箱地址与您联系。
注意:
1、我们会审核您提交的XML文件,百度新闻搜索不保证能够收录您提交的所有内容。
2、站点名称和地址为必填项,同一站点一天内最多可以提交5个不同的XML文件地址。
3、地址提交后,请注意查看弹窗信息,确认是否提交成功。
第四步:查询XML文件的状态
您可以在下面的框中输入您提交的XML文件的地址,以查看该文件的处理进度和反馈信息。
注意:输入的地址必须完整,即与您提交的地址完全相同。