搜网站内容( 本发明热门内容搜索方法和系统的实现要素有哪些?)
优采云 发布时间: 2021-09-14 00:10搜网站内容(
本发明热门内容搜索方法和系统的实现要素有哪些?)
本发明涉及数据检索技术领域,尤其涉及一种热门内容搜索方法及系统。
背景技术:
在数据检索服务中,先采集内容信息,然后根据采集收到的内容信息数据建立索引。外部应用在使用这些内容信息数据时,通过索引进行全文搜索,默认按照信息发布时间、评论数、点赞数等维度对信息进行排序,从而获取高度关注的内容信息。
发明人在实施过程中发现,传统技术至少存在以下问题:使用传统的内容检索方式,随着时间的推移,评论、点赞等数量会不断增加,由此产生的内容热度值将是不断增加;然而,内容流行度值往往具有时间敏感性,并且会随着时间的推移而波动。传统的热门内容搜索方法无法体现这种时效性,无法获取准确的内容热度值,从而获取热门内容信息的准确率较低。
技术实现要素:
基于此,有必要针对传统热门内容搜索方法获取热门内容信息准确率不高的问题,提供一种热门内容搜索方法及系统。
为了实现上述目的,一方面,本发明实施例提供了一种热门内容搜索方法,包括以下步骤:
获取搜索关键词;根据搜索关键词,在预设的索引库中搜索得到各个文本数据;
根据预设的时间波动热度算法,得到文本数据各维度参数对应的热度增加值;将热度增加值与预设衰减值的乘积作为维度参数的热度值,将各个维度参数的热度值相加求和,得到文本数据的内容热度值;
根据内容流行度值,对文本数据进行排序,得到排序后的文本数据;
排序后的文本数据将作为关键词搜索到的热门内容显示或发送到相应的外部应用程序。
另一方面,本发明实施例还提供了一种热门内容搜索系统,包括:
全文搜索单元,用于获取搜索关键词,根据搜索关键词,在预设的索引库中搜索获取各文本数据;
内容热度值获取单元,用于根据预设的时间波动热度算法获取文本数据各维度参数对应的热度增加值;将流行度增加值与预设衰减值的乘积作为维度参数的热度值,将各维度参数的流行度值相加求和,得到文本数据的内容流行度值;
排序单元用于根据内容流行度值对文本数据进行排序,得到排序后的文本数据;
反馈单元用于将排序后的文本数据作为关键词搜索到的热门内容显示或发送到相应的外部应用程序。
本发明具有以下优点和有益效果:
<p>本发明的热门内容搜索方法及系统,根据预设的时间波动流行度算法,获取各文本数据的流行度值;其中,例如通过时间流行度衰减值乘以流行度增加值得到流行度值的步骤,可以大大减少内容流行度定义随时间的偏差,得到的内容流行度值更加准确。然后根据内容流行度值,对每个文本数据进行排序,得到能够准确反映内容流行度的排序结果;上述步骤使得本发明能够反映时间段的流行度和内容流行度值的及时性;同时,根据时间段内的热度增加值进行计算,将各个维度参数的热度值之和作为内容热度值,可以有效提高获取热度内容信息性的准确率。