伪原创工具词库(微博搜索功能拆解、业务逻辑分析(1)(组图))

优采云 发布时间: 2022-03-12 01:00

  伪原创工具词库(微博搜索功能拆解、业务逻辑分析(1)(组图))

  本文从满足用户需求的使用场景出发,拆解典型解决方案,分析业务逻辑,从功能和策略两方面探讨搜索功能的迭代优化。

  

  一、项目背景

  选择查询来考察满足用户需求的微博搜索功能,从以下两个维度对选择的查询进行分类,

  内容类型维度:社会、影视娱乐、时尚美容、体育、旅游、美食、互联网、娱乐、科普教育、生活记录;需求理解维度:明确需求——结构简单清晰的查询,明确需求——口语 查询,需求明确,有附加条件,需求不明确。

  因此,案例研究的查询如下图所示:

  

  在微博手机客户端搜索这些查询,记录结果和对应问题,总结案例如下图。

  因为是手机截图,粘贴到文章会占用很大的空间,所以本文不贴本研究实际情况的截图。有兴趣的可以去微博搜索一下,自己试试。

  

  分析以上案例中存在问题的案例,如下图所示。

  

  总结一下这些案例的原因,也就是需要解决的问题,如下图所示。

  

  二、项目目标1.产品目标

  用户以最低的成本获得所需的信息。

  2.核心指标定义

  用户搜索成功率,即用户在搜索到该查询后,无需后续操作(包括更改查询、切换标签等),直接获得所需结果的概率。

  3.关键指标定义

  案例 满足以上五项指标如下图所示:

  

  4.项目目标三、需求概述

  针对本项目需要解决的问题,设计相应的改进方案,并根据问题的影响区域和预期可解决的影响区域和成本,对解决方案进行优先排序,如下图所示.

  

  四、详细需求1.查询分析

  (1)改进计划一

  方案:查询解析增强了常用的口语词库和口语翻译词库,以提高识别查询的口语的能力。

  逻辑描述:对于口语查询,使用常用的口语词库,找到查询中的口语,然后使用口语转义词库进行转义,得到一个要求明确的简短查询,然后执行分词工作。

  案例示例:

  

  (2)改进计划2

  方案:查询解析提高了分词的准确性,并允许用多个查询处理结果搜索长查询。

  逻辑描述:当用户输入长查询时,不仅可以将查询的微博结果作为一个整体召回,还可以对查询进行分词处理,将其转化为各种可能的查询,并去掉一些的查询。不相干的话,再回忆一下微博结果。通过多次召回,在所有结果中,点击匹配最相关的微博。

  案例示例:

  

  (3)改进计划3

  程序:查询解析增强转义词库以提高识别附加查询条件的能力

  逻辑描述:用户输入的查询被切分后,可以通过转义词库提取查询中的附加条件,在匹配排序的逻辑中加入标签的权重

  案例示例:

  

  (4)改进计划4

  方案:查询解析增强了专有名词数据库,提高了识别查询需求主题的能力。

  逻辑描述:查询切分后,根据专有名词数据库找到查询体。

  案例示例:

  

  2.结果匹配

  (1)改进计划5

  方案:匹配逻辑中,根据搜索查询,提高匹配阈值,增加权威性、流行度、时效性、原创、内容相关标签权重

  逻辑描述:当用户的搜索查询复杂或长度较长且有附加条件时,需要提高召回结果的匹配阈值,过滤掉相关性低的微博。

  另外,根据搜索查询本身的特点和提取的额外条件,增加了额外条件对应的权威、流行度、时效、原创等标签的权重。

  案例示例:

  

  (2)改进计划6

  方案:根据搜索查询,在召回结果中,对因数量异常大、热度异常高导致的达到命中阈值的结果进行异常处理,减少刷单等行为造成的误匹配命中.

  逻辑描述:根据搜索查询,在召回结果中,当某类结果的微博数量异常多,或者某个结果的微博热度异常高,容易突破匹配阈值,有必要有针对性地改进这个功能。该类搜索查询内容相关性标签的权重,并以内容相关性作为辅助阈值。

  如果综合阈值被打破,但内容相关性阈值没有被打破,则将对召回结果进行特殊处理(不匹配,或折叠,或去重)。从而减少刷量、刷热等行为造成的误匹配命中。

  案例示例:

  3.结果排序

  (1)改进方案七

  方案:在用户的连续搜索行为中,提高排序逻辑中上下文场景之间的相关性标签权重和更新时间,提高连续搜索行为中同一主题的相关性。

  逻辑描述:当用户有连续搜索行为时触发该逻辑。对于用户搜索查询(如鹿晗电影、鹿晗)之间的相关性,当召回结果匹配时,增加与之前搜索行为相关的标签的权重,提高此类标签的更新及时性,及时更新。

  案例示例:

  4.结果展示

  (1)改进计划8

  程序:调整特定词(名词,如历史人物、特定名词)的页面显示逻辑

  逻辑描述:框定部分词汇范围(如莎士比亚,名人;*敏*感*词*,风土),调整此类词搜索结果的页面显示顺序逻辑,优先选择百科信息,优先选择热门问答, 流行

  @文章 和其他信息。

  案例示例:

  

  5.资源分析

  (1)改进方案九

  方案:提高网站微博信息语义分析的准确性,优化匹配结果

  逻辑描述:通过名词转义、口语词典和转义、名词转换、分词等手段,提高网站微博信息语义分析的准确性,优化匹配结果。

  案例示例:

  五、统计要求

  以下指标的统计数据用于评估优化需求的效果。

  

  本文由@misbone发布原创人人都是产品经理,未经允许禁止转载

  标题图片来自Unsplash,基于CC0协议

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线