百度和 Google 的搜索技术是一个量级吗?

优采云 发布时间: 2022-06-19 20:39

  百度和 Google 的搜索技术是一个量级吗?

  

  

  .

  春雨,好读书,不求甚解

  百度和Google的搜索技术是一个量级吗?

  一.

  在搜索江湖的早期历史中,李彦宏的技术创新领先于谷歌

  1.我的理解,题主问题的语境是当下,就算是“曾经领先”并不能说明什么。

  2.到底是不是曾经领先呢?

  在搜索引擎的早期发展史中,李彦宏+威廉张,无疑是技术的领先者。在1998年的布里斯班世界互联网大会上,李彦宏是主讲台上的技术布道者,而谷歌的两位创始人仍是坐在台下聆听的学生而已。

  这一说法是有一些争议的,曾经有网友置疑过,我摘录如下:(完整链接:东拉西扯:超链分析和PageRank的专利问题)

  以前我曾在很多地方看到,李彦宏说上世纪90年代中期,他在澳大利亚讲超链分析,有两个斯坦福的学生坐在台下,后来这两个学生做出了Google。不过我一直没太搞清楚这事儿的先后次序,到底是李彦宏的启蒙在前,还是Page和Brin的实践在前。终于梁冬的书中找到了答案,这个会议的时间是1998年4月,地点是澳大利亚的布里斯班。如果没有搞错,这应该就是第七届国际WWW大会。不过这时候,Google的前身BackRub已经在斯坦福大学的网络上运行了两年多。

  我在这次大会的网站上,找到了一些更有趣的信息。Larry Page和Sergey Brin著名的论文,《一种*敏*感*词*超文本Web搜索引擎的分析》就是在这次大会上提交的,作为对PageRank技术最早的公开阐述,这个论文后来被大量引用。

  不过,在这个网站上,我没能找到有关Robin Li的任何信息,包含Page和Brin的网页,倒是可以找到一些。

  还有我找到的资料:

  小结:从专利提交时间上来说超链接分析技术专利比PageRank要早,@君临说的似乎在理。但是,离开了时间谈强弱是没有意义的!打个比方,我会上知乎码字,孔圣人不会,我比圣人牛逼?非也。要比技术的话,要么比同一时间的,要么比同一发展阶段的,而这两个,百度并不占优。

  另:@君临这段话有点问题:

  同一年,谷歌推出自己的搜索引擎,以精准广告为商业模式,成功解决了持续成长的问题,在搜索江湖的较量中熬到了最后。谷歌今日引以为荣的网页评级机制pagerank技术,直到2001年才被授予美国专利,比李彦宏的1996年申请的超链分析专利技术晚了5年。

  Google 2000年才开始出售广告的,而不是Google成立的同一年。维基:Google

  PageRank专利提交时间比超链接分析技术晚了不到一年,批准时间晚了一年多,君临拿李彦红超链接分析技术专利的提交时间跟Google PageRank批准时间比是不科学的。

  二.

  百度从一开始就和谷歌走上了不同的发展方向

  这段话我基本同意,但是这也并不能说明百度的技术比Google强,Google并非不能而是不愿提供mp3搜索之类的东西,要知道这个是侵权的啊。——金钱还是底线?Google选择了后者,多么有节操啊!而且,为了跟百度竞争,Google甚至自己购买了一些音乐的版权,并把它们放在网上供网友下载,正版高质量音乐啊!

  三.

  2009年后,百度推出框计算,2013年推出轻应用,在一站式生活搜索方面,是超过了谷歌的。

  谷歌2006就开始做OneBox(链接 的页面),而百度的框计算是2009年推出的(链接:框计算)。时间上Google比百度早了三年,技术上,不是专业人员,无法具体分析。

  -----------UPDATE------------

  君临大大更新了,再驳之:

  追求网页精度的就是技术,追求更好答案内容匹配的就不是技术?

  想起了当年联想乐应用的传言,用客服MM们根据用户提交的录音手工转换成文字内容然后反馈到手机客户端,这个比Siri的技术更强?(未经证实,只是举例)

  谷歌在李开复时代就打不过百度,被墙的也只是一些敏感词内容,难道你天天就只搜索敏感词啊,市场上百分之99%的搜索需求都跟政治无关的好不好。

  看来君临大大很少用Google啊!!!!当年搜个“胡萝卜”都会被墙啊!!!!只因为那个“胡”跟圣上冲突了啊!!!!一墙就是10分钟不能用啊!!!!

  手机时代的划分。

  一代手机:模拟技术

  二代手机:数字技术

  三代手机:智能技术

  君临大大按这个逻辑得出百度跟Google是一个量级的结论,于是我得出了另一个结论:我深圳大山寨厂跟苹果是一个量级的,你看,不都是智能手机么?

  百度所发展的框计算技术,在我看来,恰恰是更适合搜索引擎行业的“智能”发展趋势的。

  我倒觉得Google Now才是最适合搜索引擎行业的“智能”发展趋势,你百度还要个框,人家Google直接帮你把事儿安排好了。

  update:

  君临大大再次更新,再驳:

  很多人认为百度的搜索答案都只是人工干预的结果,没有技术含量,我感到很遗憾。

  或许早年是如此,但是现在应该已经有很大的改进了。

  我举个例子。

  前面的谢霆锋的身高的问题,为什么百度能够给我答案,谷歌给不了呢?

  百度该不会无聊到这么细节的问题都专门去优化一下答案吧,当然不是了,这些答案都是依托于百科里用户自行编写的答案,百度不过是把他们的知识有机的整合起来,通过程序的设计,巧妙的呈现到你的面前。

  用君临的例子,同的样问题,张柏芝儿子的爸爸,有结果,把“爸爸”换成“爷爷”就没结果了:

  换成“谢霆锋的爸爸”又有结果了,整合乎?人工乎?

  

  ---------------------------上面是反对,下面是看法,中间是分割线--------------------------

  到底谁技术更强呢,我们来模拟一下日常使用场景:

  1.娱乐类的,最喜欢李安了,想了解一下:

  Google右边给出了简介,他的作品,其它用户的搜索推荐。简单的了解,扫一眼简介,想了解他的作品,点击他的电影后是这样的:

  又漂亮,又利于获取信息,有木有?正文链接,除了第二个都是相关新闻外,Google给出前三的答案分别为:维基、豆瓣、Mtime,百度的是:百度百科、知乎、*敏*感*词*,你觉得哪个消息源更可靠?

  小结:

  一般人在搜索李安时想得到什么样的答案?作为一位名导演,通常人们感兴趣的是:1.他本人的一些情况,2.他的作品,3.再延伸到他作品大概是什么样的。

  看看Google的,简介,看右边,作品,在右边下面的位置,详细情况:维基、豆瓣、Mtime。在国内,电影类的豆瓣和Mtime应该是相关度最高,资料最全面,质量最好的的网站吧?维基百科就不用多说了,准确、公正,比百度百科只强不差。想了解作品的用户呢?直接点作品,然后在页面上面出现了他所有的作品,你可以在一个页面内浏览它,又全面又方便。

  百度呢?光看搜索结果页,并不能了解他有哪些作品。再看具体结果:百度百科、相关新闻、知乎、*敏*感*词*、电影网、维基、百度视频、百度图片、豆瓣、追梦人李安(央视)、CNTV、百度知道,十二个结果,有五个是百度自家的,而且这样的排序,我想不出来背后的逻辑。

  下面有知友说『如果有百度百科作为这类承载为何不可』,事实上,很多Google的搜索的结果会指向百度的产品(百科、知道、贴吧),比方说同样作为娱乐人物的周杰伦,Google结果第二个就是*敏*感*词*(除去新闻那一个),而Mtime和豆瓣放到第二页去了,说明对于想了解周杰伦的用户而言,贴吧的权重更高,这也更符合事实,不是么?

  所以,我的结论是在这方面Google做得更好。

  2.有道题不会算,搜一下:

  两个都能达到目的,不过,Google的要漂亮一些,不是吗?

  小结:

  功能都没问题。百度的计算器默认未展开,想再次计算不太方便,界面采用类似IOS6的拟物化设计,跟整体风格不太搭配。Google的计算器默认展开,扁平化设计,风格跟网页统一。

  个人更喜欢Google。

  3.再来看汇率:

  都能达到目的,不过Google给出了汇率波动的折线图。(最好的搜索方法是在两个币种之间敲空格,根本不用打那么一堆的,例:“1美元 *敏*感*词*”)

  小结:

  两者差不多,Google给出了汇率波动折线图,稍胜。

  3.路线搜索:

  百度似乎胜一筹,但是我们再看看具体内容,百度前三结果:携程(广告推广)、去哪儿(百度旗下)、百度地图,Google前三:去哪儿、携程、优采云票网(优采云时间表),在网页最下面显示了Google地图。

  再换一个短一点行程的:

  

  百度,第一个是去哪儿,第二个是百度地图。Google,第一个是地图,第二个是优采云票网(优采云时刻表)。

  规划行程最好的还是地图吧?,再来比较一下:

  

  Google默认展开最佳路线,路线相当详细,收费路段用红字标明,而且界面比百度漂亮,有没有?

  而且,最最最厉害的是,如果你在用Google Now,当你在google上搜索过行程后,无需任何设置,到了时间,Google Now会自动提示你,第一次使用的时候,我那个惊喜啊。。。。

  小结:

  百度是能满足需求的,框内应用质量也非常高,只是我觉得百度有推自家产品之嫌。

  再来看Google,我举了两个例子,一个长途,一个短途,从广州到上海,很少人开车去吧?最常见的交通方式应该是飞机和优采云,所以Google优先放的是这两个。地图放最下面,说明它的权重不够(哪怕是自家产品),还可以满足部分想驾车的用户。短途,东莞到深圳,驾车的就多了吧?所以Google把地图放在第一位了。我觉得这说明Google理解了搜索背后的那个用户。而且如果你开通了Google Now的话,那百度跟Google的差距就大了。

  个人觉得两个都不错,相对而言,百度可能更适合国人的味口,毕竟,对于旅行来说,去哪儿和携程是个不错的选择。但是我觉得谷歌更理解搜索背后的思维。所以技术上来说还是Google更胜一筹,如果加上Google Now的话,Google可以直接甩掉百度了。(国内没开通Google Now,不过可以通过某些方法达到,需要的请自行Google^_^)

  4.刚需,看片:

  

  

  百度是生怕你找不到,Google是生怕你找到了,百度让人“心神不宁”,Google让人火冒三丈。当然对于*敏*感*词*而言,这些都没问题,但是,如果是你*敏*感*词*的子女在用呢?Google默认开启了安全搜索,在你搜索某些内容时会过滤。

  小结:

  看片要种还是找度娘吧。

  5.图片搜索:

  印象中这个功能是Google先推出的

  这个功能,其实两都都不算太强。

  

  

  百度提供了“文件格式(常见的图片格式都有了)、尺寸、分辨率、是否收费”四个筛选器。Google提供了大小(分辨率)、颜色、类型(脸部特写相片、剪贴画、素描画、*敏*感*词*)、时间这四个筛选器。(2014年1月4日多了版权这个筛选器)Google更丰富,百度更符合国人习惯。

  以图找图:

  

  印象中这个功能是Google先推出的。Google提供了拖动找图的功能,百度没有。再看结果:

  百度识别为周杰伦,Google识别为魔杰座。(另:一次复制链接找图,百度无结果,Google准确识别,本想截图的,忘记链接了未能再现。)

  小结:

  百度更符合国人习惯,经常找素材的设计师应该会喜欢。Google提供了颜色分类,人个觉得更有技术含量一点。以图找图,Google更方便,结果也比百度稍准(这里可能会有不同看法,显示周杰伦好还是周杰伦的魔杰座好,个人偏向后者)。

  还有一些其它的,我就不一一比较了,再分享一些Google实用技巧,这些掌握了才算是真正的会用Google啊:(转自知乎,链接:一周看点 1. 学会 Google 用法,走遍天下都不怕)

  如何用好 Google 搜索引擎?

  崔凯,搬砖工。求工作!

  搜索引擎命令大全!

  1、双引号

  把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。bd和Google 都支持这个指令。例如搜索: “seo方法图片”

  2、减号

  减号代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。Google 和bd都支持这个指令。

  例如:搜索 -引擎

  返回的则是包含“搜索”这个词,却不包含“引擎”这个词的结果

  3、星号

  星号*是常用的通配符,也可以用在搜索中。百度不支持*号搜索指令。

  比如在Google 中搜索:搜索*擎

  其中的*号代表任何文字。返回的结果就不仅包含“搜索引擎”,还包含了“搜索收擎”,“搜索巨擎”等内容。

  4、inurl

  inurl: 指令用于搜索查询词出现在url 中的页面。bd和Google 都支持inurl 指令。inurl 指令支持中文和英文。

  比如搜索:inurl:搜索引擎优化

  返回的结果都是网址url 中包含“搜索引擎优化”的页面。由于关键词出现在url 中对排名有一定影响,使用inurl:搜索可以更准确地找到竞争对手。

  5、inanchor

  inanchor:指令返回的结果是导入链接锚文字中包含搜索词的页面。百度不支持inanchor。

  比如在Google 搜索 :inanchor:点击这里

  返回的结果页面本身并不一定包含“点击这里”这四个字,而是指向这些页面的链接锚文字中出现了“点击这里”这四个字。

  可以用来找到某个关键词的竞争对收,而且这些竞争对手往往是做过SEO 的。研究竞争对手页面有哪些外部链接,就可以找到很多链接资源。

  6、intitle

  intitle: 指令返回的是页面title 中包含关键词的页面。Google 和bd都支持intitle 指令。

  使用intitle 指令找到的文件是更准确的竞争页面。如果关键词只出现在页面可见文字中,而没有出现在title 中,大部分情况是并没有针对关键词进行优化,所以也不是有力的竞争对手。

  7、allintitle

  allintitle:搜索返回的是页面标题中包含多组关键词的文件。

  例如 :allintitle:SEO 搜索引擎优化

  就相当于:intitle:SEO intitle:搜索引擎优化

  返回的是标题中中既包含“SEO”,也包含“搜索引擎优化”的页面

  8、allinurl

  与allintitle: 类似。

  allinurl:SEO 搜索引擎优化

  就相当于 :inurl:SEO inurl:搜索引擎优化

  9、filetype

  用于搜索特定文件格式。Google 和bd都支持filetype 指令。

  比如搜索filetype:pdf SEO

  返回的就是包含SEO 这个关键词的所有pdf 文件。

  10、site

  site:是SEO 最熟悉的高级搜索指令,用来搜索某个域名下的所有文件。

  11、linkdomain

  linkdomain:指令只适用于雅虎,返回的是某个域名的反向链接。雅虎的反向链接数据还比较准

  确,是SEO 人员研究竞争对手外部链接情况的重要工具之一。

  比如搜索

  linkdomain: -site:

  得到的就是点石网站的外部链接,因为-site: 已经排除了点石本身的页面,也就是内部

  链接,剩下的就都是外部链接了。

  12、related

  related:指令只适用于Google,返回的结果是与某个网站有关联的页面。比如搜索

  related:

  我们就可以得到Google 所认为的与点石网站有关联的其他页面。 这种关联到底指的是什么,Google 并没有明确说明,一般认为指的是有共同外部链接的网站。

  上面介绍的这几个高级搜索指令,单独使用可以找到不少资源,或者可以更精确地定位竞争对

  手。把这些指令混合起来使用则更强大。

  inurl:gov 减肥

  返回的就是url 中包含gov,页面中有“减肥”这个词的页面。很多SEO 人员认为GVM和学校网

  站有比较高的权重,找到相关的GVM和学校网站,就找到了最好的链接资源。

  下面这个指令返回的是来自.中国教育和科研计算机网CERNET,也就是学校域名上的包含“交换链接”这个词的页面:

  inurl:.中国教育和科研计算机网CERNET 交换链接

  从中SEO 人员可以找到愿意交换链接的学校网站。

  或者使用一个更精确的搜索:

  inurl:.中国教育和科研计算机网CERNET intitle:交换链接

  返回的则是来自中国教育和科研计算机网CERNET 域名,标题中包含“交换链接”这四个字的页面,返回的结果大部分应

  该是愿意交换链接的学校网站。

  再比如下面这个指令:

  inurl:中国教育和科研计算机网CERNET*register

  返回的结果是在.中国教育和科研计算机网CERNET 域名上,url 中包含“forum”以及“register”这两个单词的页面,也就是

  学校论坛的注册页面。找到这些论坛,也就找到了能在高权重域名上留下签名的很多机会。

  下面这个指令返回的是页面与减肥有关,url 中包含links 这个单词的页面:

  减肥 inurl:links

  很多站长把交换链接页面命名为links.html 等,所以这个指令返回的就是与减肥主题相关的交换

  链接页面。

  下面这个指令返回的是url 中包含 以及links 的页面,也就是GVM域名上的交换链接页面:

  allinurl:+links

  最后一个例子,在雅虎搜索这个指令:

  linkdomain: -linkdomain:

  返回的是链接到点石网站,却没有链接到我的博客的网站。使用这个指令可以找到很多连向你

  的竞争对手或其他同行业网站,却没连向你的网站的页面,这些网站是最好的链接资源。

  高级搜索指令组合使用变化多端,功能强大。一个合格的SEO必须熟练掌握这几个常用指令的

  意义及组合方法,才能更有效率地找到更多竞争对手和链接资源。

  找外链的时候你可以用这几种命令组合,例如site:.com inurl:blog “post a comment” -”comments closed” -”you must be logged in” “输入你的关键词“,

  site:.com 是 指, 只显示.com的网站。 如果你想要 org的链接,就换成 site:.org,inurl:blog 是指博客。

  “post a comment” -”comments closed” -”you must be logged in” 是指, “能够写评论的” 减去“ 关闭评论的” 再减去“ 必须要登录才能写评论的”。

  总结:

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线