搜索引擎进行信息检索的优化策略方法( lao用户在不同场景下输入同一个表达的需求可能不一致)
优采云 发布时间: 2022-03-18 04:14搜索引擎进行信息检索的优化策略方法(
lao用户在不同场景下输入同一个表达的需求可能不一致)
老菜
产品目标:高效获取信息
需求复杂多变,不同用户输入同一个查询表达的需求可能不一致,同一用户输入同一个查询在不同场景下表达的需求也可能不一致。
一、需求理解:广义查询解析
1.需求明确(让机器按照人对文本的理解来处理)
2.需求不明确,需要扩大预测。比如杨幂,需要扩展到杨幂的照片、杨幂的电视剧等。
有明确要求的查询
一种。查询简单明了:分词后可进行后续检索
栗子:黄山优采云车站订票电话——黄山优采云车站订票电话(距离与亲近成正比)
湾。口语查询:需要进行纠错、同义词转换等语义处理
栗子:怎么从杭州到盐城高速——怎么从杭州到盐城高速优先,所以这句话可以放入地图垂直引擎)
C。表达复杂的查询:需要更独特的语义处理
板栗:皮兴()月,我尝了一整天,想了想,后者(),不能用一般的治疗方法,需要在后续单独取出
d。要求明确,对答题有特殊要求:除了统一查询变换外,具体要求需要转化为搜索引擎能理解的特征
栗子:猪肉最新价格——资源的时效性
要求不明确的查询
需要需求扩展和预测
例如:欢乐颂-欢乐颂视频、剧情介绍、演员表、评论……
如何扩大需求?
上下文数据:搜索欢乐颂后,用户是否主动改变查询欢乐颂视频的查询
品类数据:像《欢乐颂》这样的电视剧,自然有视频和剧情的需求。pm可以提前整理出各种用途的需求清单
个性化数据:特定品类可进行地域扩展,家乐福-北京家乐福,有的用户喜欢看电影剧情,有的喜欢看评论
需要理解
理解了上述需求后,一个查询会经过上述分类处理,统一成如下输出供下一次检索:需求类别/需求词、需求强度、要检索的词、以及其他有限的特征(如作为地区等)
二、指标
1.评估每个分析规则的召回率和精度
2.用户搜索满意度
基于用户行为的搜索满意度
一种。提取满足需求;湾。以单一的结果满足需求;C。主动变换查询比例低;d。翻页比例低等
基于人工评价的搜索满意度
a.query评估前n个结果的相关性——认为需求是盘盾,当前的结果是否能满足,对比竞品是否有更好的结果,排名是否更好;b.会话满意度,可以从用户的一个行为片段来分析用户是否满意
三、解决方案:排序并呈现
排序逻辑
在不同的需求中,顺序是根据需求的强度来决定的,比如达到需求的概率;
在相同的要求中,排名基于结果的质量,例如相关性(文本角度)、权威性、及时性和可用性。
所有排名均基于点击行为。实际上,以需求强度和结果质量作为初始排名,以用户点击行为作为后续不断调整排名的依据。
显示逻辑
通用策略:将结果页中与查询相关的信息提取成标题/摘要,并进行红色标记等处理,帮助用户过滤信息
细化策略:针对不同的需求,有不同的细化策略如下:
一种。单一明确的信息需求,直接显示在摘要中;
湾。针对用户在下一条路径中相对收敛的需求,可以预先定位下一条需求,缩短步骤。比如搜索结果中的网易邮箱可以直接登录;
C。针对不同资源类型的结果,可以有针对性地优化汇总。例如,视频、图片、新闻和地图。
四、资源支持
自然语言相关性和页面类型支持
1.各种基础词库:用于查询分词、同义词转换、纠错;2.语义理解和处理规则:用于查询解析;3.网页收录(蜘蛛):保证各种网页的覆盖率收录,以及网页的及时性收录:根据网页类型定义更新频率页面,如果需要重要或者时效,可以选择高普资源,站长主动请求提交4.页面分析:识别页面类型,分析页面内容,赋能词条等。