杭州哪个搜索引擎优化公司好(传统搜索引擎给出系统Magi的公众版“”(图))
优采云 发布时间: 2021-10-27 20:08杭州哪个搜索引擎优化公司好(传统搜索引擎给出系统Magi的公众版“”(图))
作者丨蒂娜
“Peak Labs”近日发布了其人工智能系统Magi的公开版“”。通过这个搜索引擎,用户可以输入关键词,获取Magi从互联网文本中独立学习的结构化知识和网络搜索结果。每个结构化结果都将附有一个来源链接及其可信度分数。
这与我们使用的传统搜索引擎不同,它返回一系列链接。要解释问题,您还需要单击网页以查找有用的信息。
该引擎发布后,吸引了大量网友围观,并关闭了其服务器。Magi的作者在微博上回应:“突然有很多人关注我们。非常感谢。其实搜索引擎真的不是我们的主业,我们自己也没有做任何推广,更不用说准备了处理这可怕的流量。……麦琪对于单次搜索的计算量比普通的网络搜索要重得多。还请多多见谅!”
结果中,答案直接在搜索框下方,链接在页面右侧,与主流搜索引擎的用户界面相反。比如搜索“编程语言”,首先出来的是各种主流编程语言的集合:C#、Python、Java、JavaScript……同时解释了“编程语言”这个词带有“描述”和“属性”。红色、*敏*感*词*和绿色代表 Magi 给出的可信评分级别。
答案右侧提供了一些链接,您可以通过用鼠标轻拂它们来查看答案的具体来源:
Magi 的重点是用户搜索行为的本质。与传统搜索引擎相比,Magi 做了一个小小的改进:“帮你思考”。传统搜索引擎在输入你想知道的东西或信息时,会根据结果的权重(Page Rank)给你显示的链接信息,需要你自己总结判断可信度。Magi又做了一步,不仅在网络上收录海量文本,还试图理解和学习这些文本中收录的知识和数据。
季一超表示,Magi 类似于 IBM Watson 的民用版或 Wolfram Alpha 的非学术版。Wolfram Alpha 是一个能理解你的问题的搜索引擎,它的目标是“计算一切”。根据发明者 Stephen Wolfram 的说法,它是一个计算知识引擎,而不是像百度或谷歌这样的搜索引擎。简单的说,它实际上是一个图形计算器、参考书库和搜索引擎的综合体,非常先进。
除了直接给出计算结果,Wolfram Alpha 还可以处理基于自然语言的事实问题,例如:
魔术师背后
Magi来自中国团队Peak Labs,创始人纪一超在开发者圈也很有名。2011年,在北京大学附中学习期间,自己完成了猛犸浏览器iOS的开发。2012年,纪一超成立了自己的公司,继续推动浏览器和输入法项目。目前,Peak Labs 专注于 Magi 项目,专注于其背后的技术和相关商业产品的开发。
“我们真正商业化的是基于迁移学习的 Magi-open 信息提取背后的技术。” Magi采用的迁移学习NLU算法的优点是只需要使用通用数据来训练AI引擎,使得AI引擎非常适合专业的垂直领域。Magi首先利用互联网知识和自有数据进行预训练,专业垂直领域的任务只需要少量人工数据标注即可达到*敏*感*词*数据的训练效果。
纪一超对知乎进行了详细全面的技术解读
一、利用率和通用性
Magi 不再依赖预设的规则和字段,“毫无问题”地学习和理解互联网上的文字信息,同时尽可能多地找出所有信息(穷尽)而不是只挑一个(最有前途) )。通过一系列的预训练任务,Magi 淡化了与特定实体或领域相关的概念,而是学习“人们可能会关注内容中的哪些信息?”。为 Magi 设计了特殊的特征表达式、网络模型、训练任务和系统平台(下面会讨论),并投入大量精力逐步构建专有的训练/预训练数据。Magi 通过终身学习不断汇总和纠正错误,为人类用户和其他人工智能提供分析、可搜索、
二、 覆盖范围和及时性
与自己的网络搜索引擎合作,评估来源的质量。信息源和字段没有白名单。将明晰、可信、天主教三大贤士综合起来,权衡知识工程的规模和准确性。来源的质量是根据性问题的定量标准来评估的。并且注重时效性,体现在上面提到的对已有知识的时间线跟踪上,使批量更新不再周期性触发,整个系统不断在线学习、聚合、更新、纠错。
三、 可塑性和国际化
没有pre-NER和依赖解析等链接,减少父文本信息的丢失。为 Magi 的提取模型设计了一个专用的 Attention 网络结构和几个配套的预训练任务。技术栈完全独立于语言,可以实现低资源和跨语言转移。
它做对了什么?
Magi官网和纪一超本人也坦言,目前还存在一些不足,比如消歧、工程化、规模化、精准化等。对于搜索速度慢的问题,季一超在微博上表示,这是因为单次搜索的计算量比普通网页搜索要重很多。Magi目前搜索结果还不够好,但这并不妨碍它成为未来搜索引擎的方向,为用户提供学习后值得信赖和理解的知识。尤其是在这个人工智能时代,搜索引擎的结果应该更贴近用户的需求。
当前主流搜索引擎依靠机器爬虫,基于超链接分析的网页搜索,采用搜索爬虫和排序算法相结合,以关键词为核心的自动检索,实现海量信息的自动获取和重要性排序. 作为获取信息的入口,直接关系到我们获取信息的质量,也造就了早期的互联网企业。
但现在搜索引擎的过度商业运作,却引起了用户的反感。Magi的优势在于去除了商业元素,过滤掉了广告,使搜索到的信息更加纯净和有价值,节省了用户的时间。
季一超在微博上说:“现在的麦琪,充满了工程师朴实的初心。他既不想用广告恶心你,也不想关心你的隐私。”
Magi引擎的“火”表明搜索引擎正在向更好的方向发展。