搜索引擎优化案例(“智能电网”的知识分布雷达图,你了解吗?)
优采云 发布时间: 2022-03-27 16:21搜索引擎优化案例(“智能电网”的知识分布雷达图,你了解吗?)
在搜索框中输入你要查询的问题,搜索引擎会通过人机交互和自然语言理解对你输入的内容进行语义分析,理解你的问题,提取问题的主题,对搜索结果进行去重和推他们准确的结果。
搜索引擎在深度语义理解的基础上,通过深度语义算法从数据库中计算出话题相关信息,去除冗余,提取简洁信息,大数据精准营销案例,向客户推送精准答案;这一结果体现了将传统搜索引擎为你“找”到为你“解答”的智能搜索升级。
语义精准搜索引擎系统主要满足知识搜索、电网报表、统计分析、语义技术和语义本体五个功能模块。具体功能介绍如下:
一、知识搜索
搜索引擎除了具有深度语义理解的功能外,还具有知识管理和书籍文档搜索的功能。在搜索框中输入您要查询的关键词。内容搜索相关书籍和文献,对搜索结果进行去重并推送准确结果。例如,搜索“智能网格”将直接显示与关键词“智能网格”相关的文档和书籍。目前系统内有收录上千篇文献和书籍,完全可以满足搜索需求。例如,搜索“智能电网”后,显示结果:
图2:文献和书籍知识搜索
同时可以展示文献和书籍进行相关聚类分析。在下图中的红框中,您可以点击搜索相关术语或相关作者的文献和书籍,如图3所示:
图 3:相关聚类
并可以查看关于“智能电网”的知识分布雷达图,如图4
图 4:知识分布雷达图
通过对检索结果的分析,对相关文献进行分类分析,建立如图所示的关系。主节点是分类号,标准分类系统,每个节点的底部是相关的关键词。它的关键词建立了范畴之间的关系,有效地组织了知识的结构。
二:网格新闻搜索
在搜索框中输入 关键词 或您要查询的问题。通过人机交互和自然语言理解,搜索引擎会对你输入的内容进行语义分析,读取你的关键词或问题,提取主体,对搜索结果进行去重,推送精准结果。
如:刘真*的家乡在哪里
搜索引擎通过机器对自然语言的理解,直接分析出你查询的主题是“刘真*”,然后搜索挖掘出准确的答案推送给你。搜索结果如图5所示
图5:搜索“刘真*的家乡在哪里”
搜索结果在线主题聚类是一种基于相似度算法的自动聚类技术。它自动对大量未分类的文档进行分类,将内容相似的文档归为一类,并自动为该类生成标题和主题词并统计。文章号码。例如,对搜索到的“智能网格”相关文本进行聚类和分类。并呈现与问题主题相关的附加主题结果。例如,“智能电网”的聚类结果如图6所示。
图 6:聚类结果
“智能电网”的语义结果如图7所示。
图 7:语义结果
点击“分析”按钮后,“智能网格”的语义统计分析结果动态展示,如图8所示。语义搜索引擎通过语义获取问题主体时间变化的可视化图分析和 关键词 提取。该功能是根据时间轴对文本进行语义分析,给出一个时间动态的主题展示结果。图8中,右侧是分析对象的描述,左侧是结果的动态展示。下图展示了搜索引擎2007-2015年基于语义分析对“智能电网”相关信息的搜索和挖掘,并呈现了知识推送的动态可视化。
图 8:语义统计分析动态展示
搜索引擎基于对问题的语义理解,采用聚类技术对与主题相关的文章进行聚类,统计文章的个数。每个文章通过实体抽取、关键词抽取等方式,标出本文章的文章出处、版块、发布时间、作者和关键词。
搜索引擎采用实体抽取系统,智能识别文本中出现的人名、地名、机构名、媒体名、作者名和文章主题关键词,是对文本的深入理解和预测。语言法。而且,提取的词不需要预先存在于词典数据库中。此外,此函数还计算与实体关联的 文章 的数量。图 9 显示了红框中相关人员集群中与搜索问题相关的人数和 文章。
图 9:相关人员聚类
相关概念词发现和相关任务的计算结果来源于对 10 年报纸数据的学习。机器学习算法在对10年的报纸数据进行非迭代学习的过程中,形成词之间的关联,从而构建出类似于本体库的词关系网络(word network),通过给定的词来计算词。接近度和相邻的词和人。
三、 统计分析
搜索引擎不仅具有知识管理和搜索功能,还可以在后台进行统计分析,并直接显示分析结果,如图,搜索“智能网格”后,在“*web”中显示报告信息源图”用颜色深浅表示文章相关源城市出现频繁,深蓝色表示相关文章源城市出现频繁。以图10为例,与“智能电网”相关的文章在黑龙江、内蒙古、贵州、云南、广西、广东、海南、台湾等城市出现频率较低,说明这些城市尚未发展智能电网,可为电网人员做决策参考。
图 10:国家电网新闻信息源图
“智能电网”相关文章的统计分析如图11所示。左饼图代表作者对“智能电网”相关文章的统计分析,右饼图代表“智能电网” " 相关 文章 截面的统计分析。
图:11:文章相关统计
同时展示了2008-2015年“智能网格”的话题变化曲线,展示了大数据精准营销案例,如图:12
图 12:话题变化曲线
四、语义技术
语义技术部分展示了背景语义处理技术,包括概念发现、关联关系建立、基于机器学习的关系计算。最流行的使用完美本体库进行语义计算。
(1)概念发现:通过一个给定的词,去发现一个与之相似的新概念,这里表达的是和它有关系,但没有对具体关系做深入判断,所以它变成了一个概念发现。
图 13:关键词 概念
(2)概念关系推理:发现概念后,为了进一步推断它们之间的关系,这里采用迭代的方法。当迭代发现相关概念的概念时,就建立了词与词之间的关系网络,如as 图片是两次计算后的效果图,是建立词关系网络的中间过程。
图 14:概念相关性推理
(3)关联关系计算:通过不断的迭代学习,最终形成如图所示的关系网络。在学习过程中不管学习过程如何,相关概念不断聚集,从而建立了比较紧密的关系,而这种关系通常是等价关系,即代理或参数等。
图 15:关键词 关系计算
(4)本体关系计算:同步以上三个步骤的处理,有助于本体库的完善。在少数专家的参与下,本体库不断扩充。图为由电源本体库计算的本体关系图。
图 16:搜索 关键词 本体关系
五、语义本体函数
语义精准搜索引擎利用实体抽取功能对数据库中的实体进行搜索和挖掘,指定实体之间的关系类别,通过交叉信息熵计算各个实体的关联关系,从而建立有组织的实体关系展示图。如下图所示,搜索引擎提取电力行业的实体概念,通过指定核心概念、使用项、替代项、子项、子项六种关系,利用一定的算法建立实体之间的关系。项、族项和参数项。从而建立了整个实体的关系关联展示图。
图 17:语义本体功能图
以上案例是大数据智能搜索与挖掘相关技术的使用,希望对大家有所帮助。其技术采用北京理工大学大数据搜索与挖掘实验室主任张华平研发的NLPIR大数据语义智能分析技术平台实现。有兴趣的可以去了解一下!