Magi发布其人工智能系统Magi的公众版“”
优采云 发布时间: 2021-04-05 19:14Magi发布其人工智能系统Magi的公众版“”
作者丨蒂娜
“ Peak Labs”最近发布了其人工智能系统Magi的公共版本“”。通过此搜索引擎,用户可以输入关键词以获取Magi从Internet文本中独立学习的结构化知识和Web搜索结果。每个结构化结果都将附带一个源链接及其可信度得分。
这与我们使用的传统搜索引擎不同。传统的搜索引擎会返回一系列链接。要解释该问题,您还需要单击网页以找到有用的信息。
此引擎发布后,大量网民围观,其服务器已暂停。 Magi的作者在微博上回复说:“突然有很多人关注我们。非常感谢。事实上,搜索引擎并不是我们的主要业务。我们自己没有做过任何促销,更不用说准备了。 ……Magi一次搜索的计算量比正常的网络搜索要重得多。请宽恕并再次抱歉!”
结果中,答案直接位于搜索框下方,链接位于页面右侧,与主流搜索引擎的用户界面相反。例如,如果您在其中搜索“编程语言”,那么第一件事便是各种主流编程语言的集合:C#,Python,Java,JavaScript ...与此同时,“编程语言”一词是用“描述”和“属性”解释。红色,*敏*感*词*和绿色代表Magi给出的可信等级。
答案的右侧提供了一些链接,您可以通过用鼠标轻拂它们来查看从中获悉答案的特定来源:
Magi的重点是用户搜索行为的性质。与传统搜索引擎相比,Magi进行了小幅改进:“帮助您思考”。当输入某些您想知道的信息时,传统的搜索引擎会根据结果的权重(页面排名)为您提供显示的链接信息,您需要自己总结和判断信誉。麦琪不仅在互联网上阅读了大量文本,而且还试图理解和学习这些文本中收录的知识和数据,这又迈出了一步。
季义超说,Magi类似于IBM Watson的民用版本或Wolfram Alpha的非学术版本。 Wolfram Alpha是一个了解您的问题的搜索引擎,其目标是“计算一切”。根据发明人Stephen Wolfram的说法,它是一个计算知识引擎,而不是像百度或Google这样的搜索引擎。简而言之,它实际上是图形计算器,参考书库和搜索引擎的复合体,非常先进。
Wolfram Alpha除了直接给出计算结果外,还可以处理基于自然语言的事实问题,例如:
魔术家的后面
Magi来自中国团队Peak Labs,创始人Ji Yichao在开发人员圈子中也很出名。 2011年,在北京大学高中学习期间,他独自完成了Mammoth Browser iOS的开发。 2012年,季一超创立了自己的公司,并继续推广浏览器和输入法项目。目前,Peak Labs主要关注Magi项目,关注其背后的技术和相关商业产品的开发。
“我们真正进行的商业化是基于转移学习的Magi开放信息提取背后的技术。” Magi所采用的转移学习NLU算法的优势在于它只需要使用通用数据来训练AI引擎。人工智能引擎非常适合专业垂直领域。 Magi首先使用Internet知识及其自身的数据进行预训练,而在专业垂直领域中的任务只需要少量的手动数据注释即可达到*敏*感*词*数据的训练效果。
季义超对知乎进行了详细而全面的技术诠释
一、利用率和*敏*感*词*性
Magi不再依赖于预设的规则和域,“毫无问题”地学习和理解Internet上的文本信息,同时尽可能地(详尽)地查找所有信息,而不是挑选唯一的最佳信息(最有前途的)。通过一系列的预培训任务,Magi淡化了与特定实体或领域相关的概念,而是学习“人们可能会注意内容中的哪些信息?”。为Magi设计了特殊功能表达式,网络模型,训练任务和系统平台(如下所述),并投入了大量精力逐步建立专有的特殊训练/预训练数据。 Magi继续通过终生学习来汇总和纠正错误,从而为人类用户和其他人工智能提供可分析,可搜索和可追溯的知识系统。
二、覆盖范围和及时性
与自己的网络搜索引擎合作以评估来源的质量。没有信息源和字段的白名单。清晰性,可信性和天主教性的三个魔术师被整合在一起,以权衡知识项目的规模。源的质量是根据化学和准确性问题的定量标准进行评估的。它还要注意及时性,这反映在上述现有知识的时间轴跟踪中,因此不再定期触发批处理更新,并且整个系统继续在线学习,汇总,更新和纠正错误。
三、可塑性和国际化
没有链接,如pre-NER和依赖关系分析可减少父文本信息的丢失。为Magi的提取模型设计了专用的Attention网络结构和一些支持的预训练任务。该技术堆栈完全独立于语言,从而实现了资源少和跨语言的传输。
它正确地做了什么?
Magi的官方网站和Ji Yichao自己也承认,仍然存在一些缺点,例如歧义,工程,规模和准确性。关于慢速搜索的问题,纪一超在微博上说,这是因为单次搜索的计算量比普通的网络搜索要重得多。 Magi搜索结果不够好,但这并不能阻止它成为未来搜索引擎的方向,在用户学习后为他们提供值得信赖和理解的知识。尤其是在这个AI时代,搜索引擎的结果应该更接近用户的需求。
当前的主流搜索引擎依靠机器爬网,基于超链接分析的网络搜索,结合使用搜索爬虫和排序算法以及以关键词为核心的自动检索,来实现对大量信息的自动获取和重要性排序。作为获取信息的入口,它直接关系到我们获取信息的质量,也造就了早期的互联网公司。
但是现在搜索引擎的过度商业化已经引起了用户的厌恶。 Magi的优势在于,它可以删除商业元素,过滤掉广告,使搜索到的信息更纯净,更有价值,并节省用户的时间。
吉一超在他的微博上说:“现任的贤士充满了工程师的简单初衷。他既不想让您讨厌广告,也不会对您的隐私感兴趣。”
Magi引擎的“大火”表明搜索引擎正在向更好的方向发展。