blogger如何搜索引擎优化(MarkDrummond,一家独立搜索引擎公司Wowd的首席执行官(组图))
优采云 发布时间: 2021-09-06 12:02blogger如何搜索引擎优化(MarkDrummond,一家独立搜索引擎公司Wowd的首席执行官(组图))
Google 的搜索爬虫一直都能读取 JavaScript 代码,但多年来我们一直不清楚 Google 的爬虫是真正理解它在爬取什么,还是只是在一个易于理解的数据结构中。对各种链接执行严格的搜索。本周五,谷歌发言人向*敏*感*词*证实,谷歌所做的远不止是对 js 代码的简单分析。发言人说:“谷歌可以分析和理解某些 JavaScript。”
Google 的声明让我们意识到,其爬虫的工作可能不仅会获取页面的相关链接,还会与 Bing world 等搜索引擎无法发现的人类发现网络等各种程序进行交互。这意味着谷歌重新定义了搜索引擎。谷歌的搜索结果中只有很少的js代码,而且谷歌也保留了很多这段js代码的解释功能。比如在谷歌的Site Search(谷歌的Site Search)上搜索到的一个文档,显示无法用js代码索引内容。一本关于索引的介绍性教科书写道:它(谷歌爬虫)“无法处理富媒体内容或动态网页”。通过仔细查看服务器日志中的记录,我们可以发现谷歌现在正在索引没有直接收录在js代码中的链接。 Google 的爬虫只有在确定可以运行部分代码的情况下才能理解整个代码的含义。
独立搜索引擎公司 Wowd 的 CEO Mark Drummond(我们今年之前在杂志上采访过他)在一封电子邮件中告诉我们,理解 js 代码“是一个非常深刻、困难和经典的计算科学问题。 ”他解释说,Google 的努力在于能够发现网页中 js 代码是否停止运行。他说“停止运行的问题是不可判定的。”他说,目前还没有已知的算法可以告诉我们 js 代码是否停止运行。程序在程序中的任何一点都处于无限循环中,并已在数学上证明。德拉蒙德自己的公司手动检索其索引并指示是否可以简化这个复杂的问题,同时确定网络程序是否具有向另一个程序发起了数据请求。也许这正是 Google 现在正在做的事情。
另一位接近 Google 的搜索引擎人士也同意 Drummond 关于理解 js 代码复杂性的观点。他认为用一个程序来分析另一个程序是非常困难的。执行js代码几乎是现阶段的极限了。
谷歌6月份发布的改进的搜索算法(即Caffeine)似乎可以理解部分js代码。如果这是真的,那么谷歌的工程师已经教会了它的爬虫如何执行部分 js 代码。这真是一个突破!