搜索引擎进行信息检索的优化策略方法(功能导向型核心业务的策略框架网页搜索策略思考方法(组图))
优采云 发布时间: 2021-09-08 01:03搜索引擎进行信息检索的优化策略方法(功能导向型核心业务的策略框架网页搜索策略思考方法(组图))
面向功能的核心业务的战略框架
网络搜索策略思维方法一、producttarget
产品目标:高效获取信息
1)需求复杂多变
2)从海量的候选人中找到正确的信息
不同的用户可能会输入相同的查询并且表达他们的需求不一致;
同一用户在不同场景输入相同查询所表达的需求也可能不一致。
二、需求理解
这里的需求理解其实就是一个广义的查询分析
分为三类:
1)clear 需求
A) 一个结构简单明了的查询:经过分词处理,可以进行后续的检索
例如:黄山优采云站订票*敏*感*词*——>黄山优采云站订票*敏*感*词*
B) 口语查询:需要进行纠错、同义转换等语义处理
例如:如何从杭州到盐城高速
——>杭州|到|盐城|高速公路|怎么走|去
——>[地图][来自:杭州][至:盐城][类型:驾车]
C) 具有复杂表达式的查询:需要更多独特的语义处理
例如:
丕行()月
我已经尝了一整天了,以后再想想
2)需求明确,有特殊要求的回答
除了统一查询转换,具体需求还需要转化为搜索引擎可以理解的特征
例如:
猪肉最新价格——>资源时效
3)需求不明确,需要进行需求扩展和预测
例如:
欢乐颂——>欢乐颂视频、剧情介绍、演员表和解说。 . .
人猿星球崛起3——>预告片上映时间需在放映前,放映时需要评价,需要网上购票,放映后需要影评
三种类型的扩展维度:
上下文数据:用户搜索欢乐颂后,是否主动改变查询来搜索欢乐颂视频
品类数据:对于《欢乐颂》,自然有视频和剧情的需求。 PM可以提前整理出各种用途的扩展清单。
个性化数据:针对特定品类,可以进行区域扩展。家乐福——>北京家乐福;电影片名。有的用户更喜欢看剧情,有的用户更喜欢看评论。
经过上面的分类处理,一个query会统一到这个输出中,供下次检索:
[需求类别/需求词]
[需求强度]
[要检索的术语/模式]
[其他受限功能(地区等)]
指标:
1)每个查询分析规则的召回率和准确率
2)各个需求的召回率和准确率
三、解决方案
分为排序和展示两部分
1.sort
不同的需求:根据需求强度(达到需求的概率)
相同要求之间:根据结果的质量(相关性、权威性、及时性、可用性)
根据用户的点击行为进行调整
实际上,需求强度、结果质量、用户点击行为都会统一到【唯一指标】中,决定首页结果的排名
LTR:learningtorank 机器学习排序
2.show
一般策略:提取结果页面中查询相关信息作为标题/摘要,进行飘红等处理,帮助用户过滤信息
(对于所有搜索引擎,将搜索对象中用户最关心的内容提取到搜索结果列表页面,并根据情况以各种增强样式展示)
细化策略:针对不同的需求,有以下细化策略:
A) 对于单个明确的信息需求,可以在摘要中显示答案信息
例如:天气、客服电话
B) 对于用户要求下一条路径相对收敛的需求,可以转发下一步以缩短步长
例如:网易邮箱(登录)、欢乐颂视频(集数)、凡人之歌(播放)
C) 针对不同资源类型的结果,可以具体优化汇总
例如:视频、图片、新闻、地图
3.衡量指标
1)各个需求评分、质量评分、展示策略的召回率和准确率
2)用户视角下的搜索满意度
A) 基于用户行为的搜索满意度:
满足总结需求 -> 没有/很少点击行为
单个结果满足需求->点击关注收货结果
主动查询转化比例低
翻页率低等
B) 基于人工评估的搜索满意度:
查询前3/5/10结果的相关性->根据人的需求判断,是否能满足当前结果;对比竞品,是否有更好的成绩收录,排名是否更好等
Session Satisfaction -> 从一个行为片段分析用户是否满意
四、资源Support1.自然语言相关
各种基础词库:用于查询分词处理、同义转换、纠错等
语义理解和处理规则:用于查询解析
2.网页相关
网页收录(蜘蛛):
1)Guarantee 各种网页收录coverage
2)保证各种网页收录时效:根据网页类型定义更新频率,对于重要或时效性的资源,可选择站长主动提交的方式
页面分析:
识别页面类型,分析页面内容,为术语附加权限等
指标
1)NLP相关:各种词库,处理策略准确率,召回率等;
2)对于网页收录:收录覆盖范围、更新及时性等;
3)用于页面分析:各种准确率、召回率等
五、Summary
以上是三期战略产品课程的个人学习笔记。