用户协作式智能搜索模型采用短期跟踪方法的设计思想

优采云发布时间: 2021-06-07 02:14

　　计算机工程与应用 2005.11 引言搜索引擎已经成为人们在互联网上查询信息的主要工具。查询信息提供了极大的方便。然而，随着网络信息的爆炸式增长，搜索引擎反馈的搜索结果也在不断增加，人们几乎需要查阅所有的结果项。这无疑是一个有几十个屏幕和每个屏幕几十个项目的结果集。繁重的工作。为了有效解决这个问题，提高用户选择结果的效率和查询结果的准确性，搜索引擎引入了“信息反馈技术”。人类认知模型告诉我们，用户判断一条信息的相关性比清楚地表达他们的需求更容易。有时用户无法清楚地表达他们需要什么信息，但他们可以识别一条信息是否有助于满足他们的需求。搜索引擎中的信息反馈技术正是基于这种认知。所谓“信息反馈技术”，就是采用重复检索的方法，先用临时提问进行检索，然后根据上次检查的结果，对结果进行深度处理或深度检索，使检索结果更加贴近以满足用户的需求。信息反馈机制可以基于对用户检索行为的长期跟踪和分析，也可以只检测用户的短期检索行为。采用长期跟踪方式的信息反馈机制需要建立一定的用户身份认证机制，将用户的搜索行为与其身份联系起来，而短期检测方式则不需要，因此具有很强的灵活性和适应性.

　　本文提出的用户协同智能搜索模型采用了短期跟踪信息反馈机制。用户协同智能搜索模型2.1 模型的设计思想用户协同智能搜索模型的设计思想是：在用户选择查询结果的过程中，搜索引擎记录用户的选择结果并提取这些选定结果的共性，搜索引擎利用这些共性信息，自动过滤当前的结果集，提取那些符合这种共性的结果，返回给用户，起到缩小结果范围的作用。该模型的具体工作流程如下：（1）用户通过关键字“Abc”搜索得到一组搜索结果（2）用户选择（1）（4））两个搜索结果。将（ 1）和(4）的查询交互反馈信息(即结果的简短介绍部分)分为key field集合，取这两个集合的交集形成搜索关键词，二次搜索在集合的基础上进行，得到搜索结果“集合”，集合的一个子集，集合（3）按照(1）, (2）, the search当搜索关键词不断增加时，集合达到收敛，用户可以研究一种快速的用户协同智能搜索模型（北京航空航天大学软件开发环境国家重点实验室，北京 100083）E-maiI：随着网络信息资源的不断扩大和搜索引擎技术的不断发展chnology，搜索引擎反馈的搜索结果越来越多，让用户不知所措。

　　为了有效提高搜索效率和搜索结果的准确率，本文提出了一种基于用户协作的搜索结果优化模型。这种优化模型将搜索引擎对搜索结果的处理与用户对搜索结果的选择有机地结合起来。搜索引擎可以根据用户的反馈信息不断调整搜索结果，使搜索结果逐渐满足用户的检索需求。关键词用户协同智能检索检索方式文章号1002-8331-(2005）11-0155-03文献识别码中文图书馆分类号TP311研究用户协同智能检索模型张辉吴辉（系计算机） Science, National Laboratory Software Development Environment, Beijing University Astronautics, Beijing100083） Abstract: 越来越多的网络信息快速开发搜索引擎，海量信息可以搜索引擎。优化-作为搜索方法，搜索引擎可以不断调整搜索结果，满足用户需求关键词：用户协作，智能搜索，搜索方法基金项目：国家科技基础条件平台建设专项资金（编号：2003DKA5G015）) 作者简介：张辉（1968-），男副教授，研究方向为计算机网络与应用。

　　吴辉（1981-），男，硕士*敏*感*词*，研究方向为计算机网络与应用。 155 2005.ll 计算机工程与应用 Ixguick Metasearch Web MP3 新闻图片。让 Ixguick 成为您的开始。 ixguick backstae -feedback -add ur.ansk -eutsch -En ish-Enish UK-Espa ais-Itaiano Nederands Norsk-Poski- Portuus -uomi -venska fastrowin 元搜索 enine 自 l999.... -l0k-webpage 快照类似到网页定位所需的信息。在步骤(2）)的操作中，基于相关性原则，重点关注(l)和(4）)两个结果的相似度。查询结果一般只显示标题和一个简短的描述，即用户选择的结果。这个的主要依据。首先使用分词工具将信息划分为关键词的集合，然后将(l)和(4）的关键字进行交集运算。结果这个操作的深度可以看成是用户的深度，搜索意图也可以看成是一个新的查询关键词，根据这个新的查询关键词，在当前结果集中重新搜索会形成一个新的结果集。上一个，这个结果集会小一些，可以更好的表达用户的查询需求。

　　2.2 模型的建立2.2.l 该模型假设搜索模型基于以下假设： (l) 搜索结果与查询项有一定的相关性，并且第一个查询结果可以提供多个结果供选择；（2）搜索结果不仅显示一个标题，每个结果还收录一个数据的简短介绍，这个简短的介绍可以反映查询中数据的关键内容，例如（）：（3）Search 结果是2.2.2 模型表达首先提出一个集合：有序幂集有序幂集是基于幂集的，提出元素之间保持相对序的概念，去除元素的空集，可以说有序幂集是幂集的一个子集，有序幂集的具体规则是：集合元素（x不大于集合中元素的总数t）形成一个新集合的元素在集合中的相对排列顺序保持不变，这些集合的有序幂集记为o(V)。例如，基于现有的集合。假设esut是一个结果集中的搜索结果项，对于R搜索结果项的关键字集，有一组 F"o(R)，使 F#R。在该模型中，所使用的表达式解释如下： (l) 用户搜索关键字字符串是字符串，它被分解为一组具有独立语义的关键字。 Reuet{r表示集合元素的总数，即关键字总数，r(l$$p)代表一个关键字；（2）search 引擎 i 搜索基于时间的关键字集合记为 search_i，其中收录的元素为 search_i{ 表示集合元素的总数，即关键字总数，（3）search引擎基于关键字集search_i，得到的搜索结果集记为Reult_i，其中收录的元素为Reult_i {搜索迭代得到的结果项总数，a)表示一个搜索结果项；（4）用户从第一个结果集Reult_i中选择的结果集是Chooe_i，其中收录的元素是Chooe_i{b）代表一个选择结果项；（5）select_i代表搜索生成的下一个搜索关键字集引擎来自 Chooe_i，元素为 select_i{c 显示一个关键词;（6）each 结果项 R 中收录的关键字集被记录为基于 keyord 模型的搜索过程和表达式。基本过程可以描述如下： (l) 根据关键字集search_ i、搜索引擎进行搜索。此时，搜索关键字集为用户输入的关键字集，即search_l=Reuet；搜索完成后，生成搜索结果集Reult_i； eult_i 中选择的结果形成它的第一个选择集 Chooe_i；（4）搜索引擎从集合Chooe_i中生成一个选择集合select_i；（5）如果用户刷新结果，那么所有的Chooe_i select_i都设置为空，并转为（2）；否则，不改变Chooe_i （6）如果用户继续往前看，则search_(i+l) = select_i，i=i+l，转(l)；如果用户往回走，则i=il，转到 (2）.

　　模型的具体工作流程图见模型操作流程l56计算机工程与应用2005.ll2.2.3模型操作介绍下面是模型操作的介绍模型： (l) 当用户“向后”时，基于的搜索关键字集也会“向后”。如果用户在已有选择的基础上进行选择，模型会在这个结果集上累加合并新的选择集和上一用户的选择集；如果用户没有新的动作，那么会保留用户之前的结果选择集；（2）对于“刷新”操作，这个操作可以认为是对当前Choose_i Select_i的消隐操作，有利于查询的灵活性，及时跟上用户的查询需求。有可能是用户想使用之前的结果如果模型的记录信息还是之前的，很可能会误导用户的查询，可以看出“刷新”操作是系统提供的改变查询方向的接口。2.3模型性能分析该模型的关键问题是生成每个结果项的关键词集合Key-words(R)，并从用户的结果选择集Choose_i中生成下一个搜索关键词集Select_i。代表每个结果项关键词的集合必须能够准确表达结果项的含义。基于目前该领域的研究成果，可以考虑创建知识库的形式。

　　知识库的建立可以参考各种语言词典和专业学科名词列表搜索关键词集Select_i。如果Choose_i 中收录的元素相交，则会产生快速收敛的效果。但同时也有可能丢失用户的反馈信息，所以这种方法不好。为了有效提取用户反馈信息，本文建议先取一个有限集合的交集，再取这些交集的并集。该方法从多个局部结果中提取共性，可以有效避免共性提取失败。如果是两个集合的交集，则从Choose_i生成Select_i的产生式为： Select_i=UZ(Keywords) 另*敏*感*词*，在第一次搜索时，范围要尽可能大，收录的信息要多一些。可以考虑使用元搜索技术（即：调用多个搜索引擎并结合它们的搜索）结果整合在一起）这个模型最大的优点是它根据用户行为决定了他们的实时需求，用户在搜索的时候，用关键词告诉搜索引擎他们最想要的信息。只有搜索引擎才能理解和基于这个表面意义进行搜索，所以搜索到的内容可能与用户的需求有所不同。

　　用户看到搜索结果后，可以根据自己的需求再做判断。这些信息将非常接近用户的实际需求。许多搜索引擎现在提供“相关搜索”，列出与关键字相关的搜索主题。例如，在“”中，当查询请求为“智能搜索引擎”时，系统还会列出“中文智能搜索”、“智能搜索”等相关主题，帮助用户定位。给用户的搜索带来了很多启发，但仍需改进。在很多情况下，人们可以通过自己的行为告诉别人自己需要什么，但是当通过语言表达出来时，很可能会有很大的不同。让机器从人的行为中了解人的意图，不仅减少了人在搜索中的工作量，也有利于人与人之间更好的沟通。根据人们的意图，过滤掉一些无用的信息，展示用户最关心的信息。这不仅可以帮助用户找到他们最需要的信息，还可以大大提高他们的工作效率。这种基于原型的学习方法将是搜索引擎非常重要的发展趋势。另*敏*感*词*绕这个目标来设计搜索引擎，找出影响这个目标的因素。

　　当然，快速响应也是一种要求，但这里不考虑。从搜索结果来看，搜索结果最关心的往往是结果的准确性和收敛性。一开始，搜索引擎面临着海量的信息。当用户提交查询请求时，信息查询空间变得非常小。那么，缩小这个范围的前提是保证一定的准确率，否则所做的工作将毫无价值。换句话说，不仅要减少第二次搜索找到的结果数量，而且要向用户展示更多有价值的信息。对于这项技术，可以改进的领域包括：如何在搜索时有效地使用词关联方法来扩展关键字，例如同义词、同义词和其他语言的翻译；如何设置一个有效的“阈值”来控制收敛等等。总之，这项技术还有很大的研发空间。结束语搜索引擎的搜索功能相比以前有了很大的提升，但搜索结果的准确性和有效性仍然是困扰搜索引擎技术发展的关键问题。搜索引擎的智能化是目前该领域的研究热点和重点。搜索引擎具有一定的自动学习功能，提供个性化的搜索服务，将大大提高用户的搜索效率。笔者在研究过程中注意到，用户对搜索结果的选择代表了用户需求的方向，而这种隐藏的信息对于提高搜索的准确率非常重要。因此，本文讨论了反馈信息在搜索优化中的应用，并提出了搜索优化模型。

　　希望借此机会吸引他人，为智能搜索方法的研究和实现提供思路。（收稿：2004 参考文献 l.董小英、马章华等.互联网信息资源的检索、利用与服务[M].第一版，北京大学出版社，2003-072.杜阿宁，方斌星等. .中文交互式网络搜索引擎及其自学习能力[J]. 计算机工程与应用, 2003; 39 (l0）:l48~l50 3.王建勇, 李晓明等. 海量网络搜索中的用户行为引擎系统的分布特点及启示[J].中国科学丛书,200l;(4）4.高广太着.搜索引擎挑战智能[J].计算机知识与技术,200l;(4）5.张晓刚, 李明树. 智能搜索引擎技术研究与发展[J]. 计算机工程与应用, 2001; 37 (24）: 67~70 6.曾春, 邢春晓, 周丽珠. 基于内容的个性过滤搜索算法[J]. 软件学报, 2003; l4 (5） 7.http: / 200l06l2_NLP-BAED-EARCH-ENGINE (M).pdf 8.http: / 2003-06-06-76.htm 9.李国辉、唐大全、吴德峰。信息组织与检索[M]．第一版，北京：科学出版社，2003-0l l57

0

2021-06-07

搜索引擎主题模型优化

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

用户协作式智能搜索模型采用短期跟踪方法的设计思想

0 个评论

发起人