搜索引擎进行信息检索的优化策略方法(功能导向型核心业务的策略框架网页搜索策略思考方法(组图))

优采云 发布时间: 2021-09-08 01:03

  搜索引擎进行信息检索的优化策略方法(功能导向型核心业务的策略框架网页搜索策略思考方法(组图))

  面向功能的核心业务的战略框架

  

  网络搜索策略思维方法一、producttarget

  

  产品目标:高效获取信息

  1)需求复杂多变

  2)从海量的候选人中找到正确的信息

  不同的用户可能会输入相同的查询并且表达他们的需求不一致;

  同一用户在不同场景输入相同查询所表达的需求也可能不一致。

  二、需求理解

  这里的需求理解其实就是一个广义的查询分析

  分为三类:

  1)clear 需求

  A) 一个结构简单明了的查询:经过分词处理,可以进行后续的检索

  例如:黄山优采云站订票*敏*感*词*——>黄山优采云站订票*敏*感*词*

  B) 口语查询:需要进行纠错、同义转换等语义处理

  例如:如何从杭州到盐城高速

  ——>杭州|到|盐城|高速公路|怎么走|去

  ——>[地图][来自:杭州][至:盐城][类型:驾车]

  C) 具有复杂表达式的查询:需要更多独特的语义处理

  例如:

  丕行()月

  我已经尝了一整天了,以后再想想

  2)需求明确,有特殊要求的回答

  除了统一查询转换,具体需求还需要转化为搜索引擎可以理解的特征

  例如:

  猪肉最新价格——>资源时效

  3)需求不明确,需要进行需求扩展和预测

  例如:

  欢乐颂——>欢乐颂视频、剧情介绍、演员表和解说。 . .

  人猿星球崛起3——>预告片上映时间需在放映前,放映时需要评价,需要网上购票,放映后需要影评

  三种类型的扩展维度:

  上下文数据:用户搜索欢乐颂后,是否主动改变查询来搜索欢乐颂视频

  品类数据:对于《欢乐颂》,自然有视频和剧情的需求。 PM可以提前整理出各种用途的扩展清单。

  个性化数据:针对特定品类,可以进行区域扩展。家乐福——>北京家乐福;电影片名。有的用户更喜欢看剧情,有的用户更喜欢看评论。

  经过上面的分类处理,一个query会统一到这个输出中,供下次检索:

  [需求类别/需求词]

  [需求强度]

  [要检索的术语/模式]

  [其他受限功能(地区等)]

  指标:

  1)每个查询分析规则的召回率和准确率

  2)各个需求的召回率和准确率

  三、解决方案

  分为排序和展示两部分

  1.sort

  不同的需求:根据需求强度(达到需求的概率)

  相同要求之间:根据结果的质量(相关性、权威性、及时性、可用性)

  根据用户的点击行为进行调整

  实际上,需求强度、结果质量、用户点击行为都会统一到【唯一指标】中,决定首页结果的排名

  LTR:learningtorank 机器学习排序

  

  2.show

  一般策略:提取结果页面中查询相关信息作为标题/摘要,进行飘红等处理,帮助用户过滤信息

  (对于所有搜索引擎,将搜索对象中用户最关心的内容提取到搜索结果列表页面,并根据情况以各种增强样式展示)

  细化策略:针对不同的需求,有以下细化策略:

  A) 对于单个明确的信息需求,可以在摘要中显示答案信息

  例如:天气、客服电话

  B) 对于用户要求下一条路径相对收敛的需求,可以转发下一步以缩短步长

  例如:网易邮箱(登录)、欢乐颂视频(集数)、凡人之歌(播放)

  C) 针对不同资源类型的结果,可以具体优化汇总

  例如:视频、图片、新闻、地图

  3.衡量指标

  1)各个需求评分、质量评分、展示策略的召回率和准确率

  2)用户视角下的搜索满意度

  A) 基于用户行为的搜索满意度:

  满足总结需求 -> 没有/很少点击行为

  单个结果满足需求->点击关注收货结果

  主动查询转化比例低

  翻页率低等

  B) 基于人工评估的搜索满意度:

  查询前3/5/10结果的相关性->根据人的需求判断,是否能满足当前结果;对比竞品,是否有更好的成绩收录,排名是否更好等

  Session Satisfaction -> 从一个行为片段分析用户是否满意

  四、资源Support1.自然语言相关

  各种基础词库:用于查询分词处理、同义转换、纠错等

  语义理解和处理规则:用于查询解析

  2.网页相关

  网页收录(蜘蛛):

  1)Guarantee 各种网页收录coverage

  2)保证各种网页收录时效:根据网页类型定义更新频率,对于重要或时效性的资源,可选择站长主动提交的方式

  页面分析:

  识别页面类型,分析页面内容,为术语附加权限等

  指标

  1)NLP相关:各种词库,处理策略准确率,召回率等;

  2)对于网页收录:收录覆盖范围、更新及时性等;

  3)用于页面分析:各种准确率、召回率等

  五、Summary

  

  以上是三期战略产品课程的个人学习笔记。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线