搜索引擎主题模型优化(,将经典PageRank算法与用户行为反馈模型(组图))

优采云 发布时间: 2022-02-25 01:00

  搜索引擎主题模型优化(,将经典PageRank算法与用户行为反馈模型(组图))

  摘要: 目前,搜索引擎已经成为用户获取网络资源的主要工具。理想的用户搜索引擎应该能够根据不同用户的查询词,提供与用户兴趣相关的搜索信息。这时,搜索引擎需要考虑用户行为信息。考虑到用户的利益,进行有针对性的信息检索是一个重要课题。本文提出了一种改进的页面级算法N-PageRank。该算法通过挖掘搜索日志,利用日志信息,分析用户行为特征,将经典的PageRank算法模型与用户行为反馈模型相结合,建立改进的排名模型。提高排序结果的准确性,确保搜索引擎返回的结果正是用户想要看到的网页。实验表明,该算法有效降低了网页排序中客观因素的影响,充分考虑了用户对网页质量的评价,得到的排序结果更能满足用户的需求。本文所做的主要工作如下:(1)本文采用N-PageRank算法,根据用户对网页的访问频率来分析页面点击率和用户行为,并使用一个合理的数据模型计算用户行为占网页排名的比例,考虑到这一点,最终计算综合权重,给出与用户行为相关的排名结果。用户行为反馈模型是本文的重点,主要基于五个方面:①带有链接的网页之间的文本相似度;②用户行为影响因素;③ 用户浏览页面的时间向量;④ 传统的PageRank值;@>、存储、分析和输出等,验证和比较PageRank算法与改进算法N-PageRank的区别。我们使用MatLab urlread函数搭建一个网络爬虫,对网易163的新闻频道进行24小时的爬取,获取网页数。分析实验数据与大型搜索引擎日志数据的相似度,证明实验数据也比较全面,能反映广大用户的兴趣趋势。通过实验,得出以下结论:(1)查询排名结果与用户兴趣密切相关。兴趣和行为高度相关。②用户在一个会话中的点击数据有限,通常只有1或2个结果页面会被点击。③ 改进公式计算出来的排名结果更接近用户实际需求,明显优于搜索引擎返回的结果。(4)改进算法优化排序后的结果更接近用户的搜索意图,网页的热度直接影响网页在返回结果中的排名。③ 改进公式计算出来的排名结果更接近用户实际需求,明显优于搜索引擎返回的结果。(4)改进算法优化排序后的结果更接近用户的搜索意图,网页的热度直接影响网页在返回结果中的排名。③ 改进公式计算出来的排名结果更接近用户实际需求,明显优于搜索引擎返回的结果。(4)改进算法优化排序后的结果更接近用户的搜索意图,网页的热度直接影响网页在返回结果中的排名。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线