搜索引擎优化毕业论文(若能实现一个医疗领域的垂直搜索引擎)

优采云 发布时间: 2022-02-13 15:14

  搜索引擎优化毕业论文(若能实现一个医疗领域的垂直搜索引擎)

  【摘要】 随着近年来互联网的快速发展,人们获取信息的方式越来越多,各种信息充斥着人们的生活,给人们带来了极大的便利。面对海量的信息,也有一种不解之感。搜索引擎的出现大大缓解了这种情况。然而,随着互联网上网页数量的指数级增长,通用搜索引擎越来越难以提高搜索效率,而垂直搜索引擎则依赖于其高度的信息集中度和效率。强大的专业领域知识已成为当今研究的热点。于是,各个领域的垂直搜索引擎平台纷纷出现,但在与人们生命健康息息相关的医疗健康领域,仍然没有好的搜索平台。信息渠道单一,受地理环境、经济发展等因素的限制,优势医疗资源开发不平衡。如果能够实现医疗领域的垂直搜索引擎,人们足不出户就能获取医疗信息,这将有助于缓解我国目前医疗意识薄弱、基础设施薄弱的问题。本文基于Nutch开源搜索框架,对垂直搜索引擎中的话题爬虫模块和信息检索模块进行分析设计,最终实现了医疗领域的垂直搜索引擎。在这个垂直搜索引擎的建设中,主题爬虫模块的构建一直是当前研究的热点。本文对主题爬虫抓取策略中的Fish-Search算法进行分析测试,根据网页链接和网页内容对网页进行综合关联。在评估的基础上,在限制“隧道现象”的基础上,采用弹性阈值机制对医学领域相关网页进行爬取和下载。对医学领域的网页进行爬取后,通过网页解析工具和网页分块技术对网页进行解析,将解析后的网页文本内容分割成中文单词,构建倒排索引结构的倒排表。针对信息检索中网页的排序问题,本文通过分析研究Lucene搜索结果的评分机制,优化Page Rank算法在权重传递过程中的平均分布,并加入时间反馈因子降低旧网页的自然性。将优化后的Page Rank算法与Lucene中的向量空间模型相结合,在抑制“主题漂移”现象的基础上提高网页的主题相关性和权威性,最终返回排序后的结果网页。为用户,实现医疗领域垂直搜索引擎的全流程。通过垂直搜索引擎系统的设计和实现,并添加时间反馈因素以减少旧网页的自然性质。将优化后的Page Rank算法与Lucene中的向量空间模型相结合,在抑制“主题漂移”现象的基础上提高网页的主题相关性和权威性,最终返回排序后的结果网页。为用户,实现医疗领域垂直搜索引擎的全流程。通过垂直搜索引擎系统的设计和实现,并添加时间反馈因素以减少旧网页的自然性质。将优化后的Page Rank算法与Lucene中的向量空间模型相结合,在抑制“主题漂移”现象的基础上提高网页的主题相关性和权威性,最终返回排序后的结果网页。为用户,实现医疗领域垂直搜索引擎的全流程。通过垂直搜索引擎系统的设计和实现,实现医疗领域垂直搜索引擎全流程。通过垂直搜索引擎系统的设计和实现,实现医疗领域垂直搜索引擎全流程。通过垂直搜索引擎系统的设计和实现,

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线