搜索引擎优化论文( 利用垂直搜索次数的1.56%,Google、Yahoo、Bing)
优采云 发布时间: 2021-12-21 06:20搜索引擎优化论文(
利用垂直搜索次数的1.56%,Google、Yahoo、Bing)
近年来,随着在线信息容量的增加和类型的多样化,作为在线信息检索系统的通用搜索引擎,已经无法满足特定领域、特定人群的精准信息需求。此外,市场需求的多元化也决定了搜索引擎的服务模式必然会细分,针对不同行业的更精准的垂直搜索服务将会出现。但据统计,垂直搜索的使用率仅占网络搜索使用率的1.56%。面对这种情况,为了满足用户的需求,搜索引擎企业同时对多个信息源进行垂直搜索,将各个信息源采集的搜索结果聚合起来,
韩国的 Naver 是第一个开始聚合搜索业务的公司。2000年,Naver开始了聚合搜索的商业服务。截至2011年6月,它已占韩国国内搜索市场的77%,是韩国使用率最高的搜索引擎。目前,谷歌、雅虎、必应、百度等全球知名搜索引擎公司也纷纷推出聚合搜索业务。
但是,这些公司的网络搜索引擎公司并不定期开展聚合搜索业务。是否实施聚合搜索,除了用户的问题需求,还要根据最新的新闻报道和博客报道来判断。Naver 的特点是不仅提供网络信息,还提供每个垂直搜索的相关信息,并单独显示每个垂直搜索问题。例如,输入“大学”进行搜索时,页面上会显示“大学”在字典、知识iN、知识百科、图片等垂直搜索引擎中的结果。与Naver不同,谷歌、雅虎、必应、百度等将网页搜索和垂直搜索的结果放在一起显示。聚合搜索,如谷歌、雅虎、必应等。
从上面可以看出,聚合搜索结果的显示方式有两种:一种是单独显示每个垂直搜索;另一种是混合显示网页搜索结果。
有报道称,这两种搜索结果显示方式对用户点击次数影响不大。但是当以混合形式显示时,无论是哪种垂直搜索,在搜索结果中排名靠前的那些更容易被点击,因此将垂直搜索结果插入到哪个位置很重要。
换句话说,当以混合形式显示 Web 搜索结果和垂直搜索结果时,最好将认为重要的垂直搜索结果排在最前面。
1、“聚合搜索”技术
为了实现聚合搜索,重要的是将垂直搜索的搜索结果混合到Web搜索引擎的问题输入中。因此,下面重点介绍垂直搜索选择方法及其评价方法。
1.垂直搜索的选择方法。垂直搜索的选择和判断使用三个要素,即问题、垂直搜索语料和问题日志。聚合搜索时,要么使用其中一个元素选择垂直搜索,要么使用逻辑回归组合多个元素选择垂直搜索。
(1)问题。使用问题选择垂直搜索的方法是判断问题是否收录特定的关键词作为判断材料。具体是指定垂直搜索名称和相关的“图片” Ad Hoc 网站上的"、电影""、产品""、购物"等词,以及地名、旅游地名等,使用关键词作为垂直搜索的选择。例如, 搜索“数码相机购物”时,使用“”“购物”为关键词 购物垂直搜索选择为对象。搜索“大雁塔”问题时,“塔”为关键词@ > 并选择图像垂直搜索作为对象。
(2)垂直搜索语料库。使用垂直搜索语料选择垂直搜索方式,即同时将网页搜索问题输入到垂直搜索中,选择更多与搜索结果匹配的垂直搜索问题,因为这种方法把Web搜索中输入的所有问题都送到垂直搜索,所以计算成本比较高。一个简化的索引,每个垂直搜索都是唯一的,以简化索引是完整索引的摘录。
但有时也会频繁出现在多个垂直搜索中。这时候可以选择多个垂直搜索来搜索是否完整。
2. 聚合搜索评论。为了在聚合搜索中实现更好的信息聚合,需要熟悉聚合搜索的评价方法。
后一种方法是基于 每次垂直搜索的搜索结果都是对象获得的评价。②问题意图的存在。本次测评有两种意见,一种是意向,即告知测评者问题背后的意图进行测评;另一种是无意图,即不告知评估者问题背后的意图,允许评估者在评估之前考虑问题背后的意图。之前的评价方法被TREC和NTCIR在信息检索领域的竞赛大会采用。目前,它在信息检索的评价中被广泛使用。但是,对于聚合搜索评价,目前还没有统一的评价方法。
(2)不同评价方法对评价的影响。图卢兹大学的Kopliku等人调查了不同评价方法对评价的影响。本次调查使用视频、图片、新闻、地图、维基、产品、A&Q、以8次垂直搜索为对象,使用2007年TREC会议使用的300道题,33位测评者参与测评。
从调查结果来看,评估者使用实际搜索结果做出更准确、更全面的判断。以视频垂直搜索为例,仅从问题来看,12%的问题适合视频垂直搜索。但在阅读搜索结果后,我们判断所有问题中有 24% 适合视频垂直搜索。第二种是将问题背后的意图通知给评价者的评价和不通知评价者的评价,表明问题背后的意图被告知时的评价更加有限和不灵活。例如,当问题是“海南岛”时,就说明搜索意图是要知道海南岛的地理位置,给出正确解释的垂直搜索是地图或维基。但是,在没有告知搜索意图的情况下,通过图片的纵向搜索和*敏*感*词*的纵向搜索也可以得到正确的解读。可以看出,在未告知搜索意图的情况下,评估者的视野更广,使用正确解释的垂直搜索的类型也随之增加。
(3)搜索结果的多样性。图卢兹大学的Kopliku等人也对聚合搜索结果的多样性进行了调查。调查显示,仅适合Web搜索的问题占19%,问题仅适合垂直搜索的占16%,80%以上的问题适合垂直搜索,65%的问题适合多个垂直搜索。此外,最适合垂直搜索的问题适合多个垂直搜索被调查,其次是50%的问题适合网页搜索,23%的问题适合维基,10%的问题适合问答,6%的问题适合*敏*感*词*。结论是:垂直搜索不能有多样化的搜索结果; 如果执行聚合搜索,可以实现垂直搜索无法实现的多样性。
二、聚合搜索的主题和未来
聚合搜索的研究近年来比较火爆,涉及的话题也多种多样。其中,作为新的方向研究,有新闻搜索的选择方法和用户属性推断的应用。
1.如何选择新闻搜索。为了将不断变化的信息源混合到聚合搜索中,用户必须知道“他们现在在寻找什么?” 雅虎的迪亚兹提出了一种聚合新闻搜索结果的有效方法。例如,如果您输入问题“Yahoo!”,从有关 Yahoo! 的事件开始,这不是搜索导航的问题,而是搜索新闻事件的问题。在这种情况下,您不能使用2.1 来告诉 选择新闻搜索的方法。
迪亚兹提议用“问题是突然发生的吗?” 使用此问题搜索新闻。头条新闻是不是几分钟前注册的新报道?”作为判断标准。另外,从聚合新闻搜索结果的点击率,动态补充是否继续聚合。与Diaz方法类似,微软也提出了对最新的新闻报道进行选择新闻搜索的方法,该方法使用了过去7天内出现在新闻报道和博客报道中的关键词选择新闻搜索。
雅虎的迪亚兹进一步提出不使用新闻报道和博客报道,而是使用推特的微博报道作为选择方式。假设描述微博的网址是最新的新闻和网页,网址上的报道内容排在第一位,以显示其重要性。具体来说,实验是在推特上进行的,将 URL 上报告的发件人的推文数、转推数、关注数等各种信息输入到学习器中,提取有用的 URL。这些可以用作选择新闻搜索的指标。
2.用户属性推断的应用。如果可以推断出网络搜索用户的专业度,就可以实*敏*感*词*融专家、医学专家还是法律专家。具体按照网络搜索输入问题的长度、问题中专业术语的内容程度、搜索提出的问题数量、访问的网页数量、会话时间进行分类。有实验报告说,当复现率为50%时,计算机专家的准确率可以达到80%。其余三类专家在复现率为50%时的准确率都低于60%。如果判断专家的准确率提高,可以作为选择垂直搜索的一个要素。
参考
[1]Liu,N.;Yan,J.;ChenZ.Aprobabilistic model based approach for blendedsearch,Proceedings of 18th International World Wide Web Conference.2009.
[2] Murdok,V.;Lalmas,M. 聚合搜索研讨会 ACM SIGIRForum.2008,42 (2).