搜索引擎优化毕业论文(,如何改进搜索引擎技术,提高查全率和查准率是当前智能信息处理领域的科研人员)
优采云 发布时间: 2021-11-15 23:23搜索引擎优化毕业论文(,如何改进搜索引擎技术,提高查全率和查准率是当前智能信息处理领域的科研人员)
【摘要】 随着网络和计算机技术的飞速发展,文本、图像、音频、视频等多种形式的信息在网络上发布。网络信息量呈指数级增长,人类进入信息爆炸时代。与如此庞大的网络信息量相比,人脑的存储容量是非常有限的。人们虽然可以通过专业训练降低信息遗忘率,但效果并不明显。人脑存储容量的有限性与网络信息的无限性之间的冲突导致了“信息过载”现象。庞大的、无序的、多样的结构和不断扩大的信息海洋让人们不知所措,很难快速准确地找到所需的信息。目前的搜索引擎(SE,search engine)虽然提供了信息检索服务,但也有其自身的不足,如信息孤岛、话题偏向等问题。这些问题的存在,使得查询结果集庞大,很多结果与用户的查询意图相差甚远。因此,如何改进搜索引擎技术,提高查全率和查准率,是智能信息处理领域研究人员努力追求的目标。本文的主要工作体现在以下三个方面:一是分析了当前三类搜索引擎的结构特点和系统缺陷,并在此基础上,提出一种智能搜索引擎框架,结合独立搜索引擎和元搜索引擎的优势,有效降低传统搜索引擎的主题偏见和信息交互规模;二是采取多种方式提高系统的智能化程度。首先,从用户兴趣的静态分布和动态演化,厘清用户真正的兴趣是什么,提出基于层次聚类方法的用户兴趣模型构建和调整算法;其次,分析不同标签对网页中特征项的权重。它还从中文语法的角度扩展了自动摘要技术。最后,根据天网用户日志的统计结果,提出了一种独立搜索引擎集合的动态调度策略;第三,对三种类型进行比较和分析。主流网页排名算法针对PageRank算法权重分配策略的不合理性提出了A-PageRank算法。该算法是一种改进的 PageRank 算法。其最大特点是使用锚文本集合作为网页主题的替代,根据网页之间的主题相似度按比例分配源网页的PageRank值。同时在Heritrix和Lucene平台上对算法的有效性进行了实验和分析。主流网页排名算法针对PageRank算法权重分配策略的不合理性提出了A-PageRank算法。该算法是一种改进的 PageRank 算法。其最大特点是使用锚文本集合作为网页主题的替代,根据网页之间的主题相似度按比例分配源网页的PageRank值。同时在Heritrix和Lucene平台上对算法的有效性进行了实验和分析。主流网页排名算法针对PageRank算法权重分配策略的不合理性提出了A-PageRank算法。该算法是一种改进的 PageRank 算法。其最大特点是使用锚文本集合作为网页主题的替代,根据网页之间的主题相似度按比例分配源网页的PageRank值。同时在Heritrix和Lucene平台上对算法的有效性进行了实验和分析。源网页的PageRank值根据网页之间的主题相似度按比例分配。同时在Heritrix和Lucene平台上对算法的有效性进行了实验和分析。源网页的PageRank值根据网页之间的主题相似度按比例分配。同时在Heritrix和Lucene平台上对算法的有效性进行了实验和分析。