网站内容更新系统(谷歌PubSubHubbub实时同步协议开发主管:将为谷歌掀开新的篇章)
优采云 发布时间: 2021-11-18 23:07网站内容更新系统(谷歌PubSubHubbub实时同步协议开发主管:将为谷歌掀开新的篇章)
据外媒今天报道,谷歌正在开发一种系统,可以让任何规模的发布者自动向谷歌提交内容,以便他们的内容在发布后几秒钟内就可以被谷歌索引。
新章节
美国搜索引擎技术网站SearchEngineLand主编丹尼·沙利文(Danny Sullivan)认为,这将为谷歌开启新的篇章。
谷歌 PubSubHubbub(以下简称“PuSH”)实时同步协议开发负责人 Brett Slatkin 去年秋天表示,他希望谷歌有朝一日能使用 PuSH 协议来索引网页内容,而不是依赖那些年被用过。爬虫技术。谷歌高级产品经理迪伦·凯西 (Dylan Casey) 周二在加利福尼亚州圣克拉拉举行的搜索营销博览会上表示,该公司将很快为 网站 所有者提供一种标准方式,使其能够获得与 PuSH 类似的效果。
操作模式
PuSH 是一个基于 ATOM 格式的同步系统。使用本系统时,网站必须先公告一个Hub。每当有内容更新时,网站 都会通过此 Hub 发送通知。用户注册后,相当于告诉Hub:“网站的内容有更新时,请立即发送给我。” 这样注册用户就不需要一直访问原来的网站查看是否有内容更新,只需要等待Hub的通知即可。网站发布新内容时,会自动通知Hub,Hub将内容发送给所有注册用户。整个过程只需要几秒钟。
如果 Google 使用 PuSH 部署一套索引程序,它可以要求所有 网站 部署这项技术并声明各自的 Hub,就像在传统 RSS 服务中提供 RSSfeed 一样。之后,Google 就可以通过这些 Hub 来了解是否有任何内容更新网站。
不过,业内人士认为,PuSH 协议不太可能取代现有的爬虫程序。其实通过爬虫技术获取网站的PuSHfeed是很有必要的,但是这种实时协议可以极大的推动Google现有的索引技术。
Sullivan 认为,Google 必须部署垃圾邮件控制机制,而不是 收录 不受审查的所有实时信息。他说,这种情况出现在搜索引擎发展的早期阶段,造成了很大的问题。
好处
从计算的角度来看,PuSH 将为谷歌带来更高的效率。但斯拉特金认为,更重要的是这一举措对小网站的影响。目前谷歌爬虫对很多小网站的抓取频率只有一周一次。通过PuSH系统,这些网站可以实时向谷歌提交新内容。
一个更丰富、更快、更高效的互联网将使每个人受益,而谷歌并不是唯一受益的搜索引擎。PuSH 是一个开放协议,可以被 Yahoo 和 Bing 访问。斯拉特金说:“我的上司一直告诉我要对这个协议采取公开的促销方式,即使是对竞争对手也是如此。” (鼎红)