搜索引擎优化知识完(谷歌研发一个智能模型——知识图谱(knowledgegraph)智能化)
优采云 发布时间: 2021-08-29 14:11搜索引擎优化知识完(谷歌研发一个智能模型——知识图谱(knowledgegraph)智能化)
2012年5月17日,谷歌官方博客发布了谷歌知识图谱智能搜索功能。知识图谱秉承语义网的宗旨,是谷歌用来优化搜索结果并使之语义化的知识库系统。谷歌表示,人们使用搜索功能可以方便快捷地查找知识,开阔眼界。然而,目前的搜索系统还远远不够智能,仍然需要大量的用户交互才能获得想要的搜索结果。谷歌推出的知识图谱智能搜索功能,旨在系统地组织搜索结果中的知识,让每个用户查询的关键词映射到知识库的概念。
由于词的丰富含义,谷歌致力于开发智能模型-知识图谱,以了解现实世界中的每一个实体以及它们之间的关系。简而言之,知识图谱就是建立一个由谷歌索引的所有事物、人物和地点之间的关系网络,例如地标、名人、城市、团队、建筑物、电影和艺术品。早期的知识图谱智能搜索是基于著名的公共数据源,如Freebase、维基百科和中央情报局发布的《世界概况》。它的范围包括超过 5 亿个对象实体和关于这些对象的 350 亿条信息。实体的关系网络。最近,Google 使用机器学习和数据挖掘方法从索引网页中自动发现新实体和实体关系,从而扩展和改进知识图谱。
通知知识分类提高搜索准确率;使用知识分类优化搜索结果的展示。
表1公共知识图谱库
名称内容数量网址
DBpedia 维基百科 1900 万个实体,1 亿个关系
Wiki-links Wikipedia 4000 万条明确的关系
Freebase 的多个网络来源 6800 万个实体,10 亿个关系
美国官方政府网站64亿关系
WolframAlpha 计算知识 10 万亿实体
关键技术:一是知识图谱中实体和实体关系的建立;其次,从非结构化或半结构化文档中提取结构化信息,即提取实体;以及最后如何将提取的实体很好地组织和存储有关关系的信息,以便可以快速访问或操作。为实现这一目标,Google 使用 MapReduce 为所有实体编制索引,并使用自然语言处理工具对其进行处理。
同类产品:微软在必应的基础上提供了Satori,致力于从非结构化的网络文档中提取数据构建结构化知识库,并在此基础上提供结构化数据搜索功能。此外,百度的实体搜索、搜狗的知乎、Facebook的社交图谱也在这方面进行了尝试。
本文最后的挑战非常有价值:
(1)如何实现知识库的自动扩展,包括新实体的自动发现、实体关系的自动提取、实体语义的消歧等;
(2)如何利用知识库实现真正的智能搜索,核心研究问题是如何结合知识库进行浅层推理,理解用户查询场景,分析用户查询语义,智能组织搜索结果显示。
(3)如何实现知识库的跨语言支持
(4)如何将用户个性化偏好与知识图谱有机结合,实现个性化知识图谱检索。
这里的知识图谱与目前图书情报学所关注的知识图谱有一定差距,但图书情报学和计算机科学在这方面是一个交叉领域。两个知识领域如何有机地融合在一起,一定会有一些意想不到的,但是很神奇的结果出现了。