西北干旱地区的农业垂直搜索引擎相关研究内容及结论
优采云 发布时间: 2021-05-15 18:29西北干旱地区的农业垂直搜索引擎相关研究内容及结论
[摘要]:随着Internet的快速发展,农业知识资源也在迅速增加,但是农业用户从海量和复杂的数据中获取农业信息资源的效率并不高。通用搜索引擎在搜索信息时无法满足农业用户的准确性要求。现有的农业搜索引擎存在诸如缺乏可靠的农业服务平台,低区域性和低效率的问题。针对这些问题,本研究利用西部干旱地区的农业物联网信息平台作为值得信赖的农业服务平台,对西北干旱地区的农业垂直搜索引擎进行了相关研究。主要研究内容和结论如下:(1)基于文献的农业本体构建方法。为了提高领域本体构建的自动化程度,减少对领域专家的依赖,采用Web数据提取技术获取农业本体。文献中,通过文献的分词和清理,领域概念的自动提取以及使用关联分析和改进的层次聚类来发现领域概念之间的关系,并构建农业领域本体,通过实验验证,该方法提高了领域的自动化程度本体构建,同时确保领域概念是相互概念的。关系聚类效果和领域本体构建效果。(2)基于本体的干旱地区农业垂直搜索引擎研究。为了提高干旱地区农业信息检索的准确性,设计并实施一个基于拓扑的干旱地区农业垂直搜索引擎。首先,执行基于本体的信息采集和过滤器,并根据网络中链接过滤,信息获取,页面分析和主题相关性确定的四个部分,使用主题蜘蛛和本体相结合的方法采集和过滤干旱地区的农业信息,并根据倒排索引策略对相关网页进行索引。其次,进行基于本体的信息检索,利用查询扩展技术结合农业领域本体,对用户进行上下搜索,上下搜索三种查询模式,根据相关程度对结果进行排名并推荐相关词根据本体的上,下位置向用户展示。实验表明,基于本体的垂直农业搜索引擎可以提高农业信息检索的准确性,优化检索结果。 (3)在干旱地区构建基于本体的农业垂直搜索引擎系统平台。为了方便农业领域本体和基于本体的干旱地区农业垂直搜索引擎的使用和管理,基于C / S + B / S模型,该平台使用Web信息提取技术获取与旱地农业有关的文章,并完成中文分词清理,关联分析和聚类分析等,构建农业领域本体,以及结合开源搜索引擎框架Nutch和农业领域本体,实现了基于本体的旱地农业垂直搜索引擎,最终完成了用户检索界面和平台的构建,测试表明该系统平台具有良好的合理性和鲁棒性。