伪原创工具词库(一个菜谱UGC社区从0到1的项目(组图))

优采云 发布时间: 2022-01-22 14:13

  伪原创工具词库(一个菜谱UGC社区从0到1的项目(组图))

  本文作者根据工作项目实践,结合案例等,对UGC平台业务背景的设计思路进行拆解,总结过程中的关键问题,希望对大家有所帮助。

  

  概述

  UGC(用户生成内容)是用户生成的内容。*敏*感*词*UGC社区可谓百花齐放。国外有Youtube、Instagram等月活跃用户10亿量级的巨头,也有贴吧、微博等国内巨头。随着 UGC 社区的广泛渗透,大家对它的前端交互肯定或多或少有一些经验,但隐藏在前端之下的业务逻辑却是大多数人不知道的。笔者前段时间碰巧参与了一个从0到1的菜谱UGC社区项目,主要负责后台的搭建,从核心能力/功能架构/详细分析各个方面分解了后台的设计思路功能板块和业务流程排序。

  一、确认后台核心能力

  UGC平台,顾名思义,其核心要素当然是用户和内容。那么后台的核心能力也得到了很好的印证:完善的内容(展示和处理)和支持基础操作的用户管理平台。

  分解核心能力:

  【内容安全】:通过后台的算法和内容逻辑,保证前端调用内容时未确认或不健康的内容不会主动推荐给用户。【内容质量】:通过多维度进行内容质量核算,确保优质内容展示在前端,并可作为初步热推荐。【内容处理】:对内容进行细分和识别,方便后台人员快速处理,以及前端相应的预处理。【用户管理】:后台用户可以手动识别和管理用户,快速查询用户状态和用户内容。【其他】:基本运营能力、内容管理和数据统计。二、

  

  三、主要职能部门的概念和业务流程

  我从三个方面分析每个功能块:主要功能/用途/实现方法。

  1. 配方管理——主要用于支持“内容安全”

  

  配方管理页面

  功能:主要用于配方导入/内容管理/分类管理;

  目的:

  菜谱导入主要用于批量导入官方菜谱,方便后台用​​户帮助公众号快速导入菜谱(如果只有前端可以上传菜谱,步骤繁琐,费时费力);内容管理主要包括菜谱/评论的显示/检索及相关操作(人工审核/帮助编辑/删除等),通过机器检查+人工判断+辅助编辑的方式排除不安全内容,维护安全平台内容;分类管理的目的是方便我们后台用户查看菜谱。差异化也是用来支持前端菜谱展示,也可以用来引导用户选择爱好(即用户第一次来APP时,

  实现方法:

  配方管理的业务逻辑如下。通过机检贴标+人工判断+辅助编辑,只能在前端显示无害的信息。

  

  PS:关于“先发后审”和“先审后发”的审稿机制选择,考虑到初期平台内容以少数PGC为主,为了快速丰富平台内容和实现用户积累,我们选择了“先发布,后审核”的机制。但是为了平衡内容的安全性,建议前端预先去除含有违禁词的内容。同时,引入了举报反馈机制,也建议前端对严重举报的内容进行预剔除,当然所有内容都需要人工审核,避免机器审核误判和恶意举报。

  在梳理后台业务流程时,需要

  A.首先明确后台每个状态/状态定义/状态操作项的名称——适合菜谱/笔记/评论

  

  B. 重组各个状态之间的流程:

  

  

  2. 笔记管理——主要用于支持“内容安全”

  “笔记管理”部分的主要功能/用途/实现方法与“配方管理”部分基本相同,此处不再赘述。

  3. 用户管理 - 用于支持“用户管理”

  

  用户管理页面

  功能:以列表的形式展示平台所有用户的个人信息,后台用户可以根据用户行为数据进行用户的封禁/封禁/限流/标签等基本的用户管理操作;

  目的:

  用户管理相关数据可以为之前的菜谱管理/笔记管理服务(比如低等级用户的菜谱/笔记要先审核,因为这些用户制作的内容很可能是低质量的;对于公众号/平台V的食谱/笔记可以稍后查看,因为这些用户制作的内容默认是高质量的);对违反平台建设的用户进行封禁/封禁/当前限制,以防止其劣质内容展示在平台上,也是维护平台内容质量的一种方式;

  实施方式:由后台用户手动对用户进行分级,流量导向优质用户,对低质量用户进行限制(对不良用户进行封禁/封禁),保证平台流量的正确流转。业务逻辑如下。

  

  4. 健康管理 - 用于支持“内容质量”

  

  健康管理页面

  功能:通过内容流/内容质量/用户质量三个维度对菜谱/笔记进行综合评分计算。后台用户可自主设置三个维度下每个加权项(PV/UV/评论数/采集数等)的权重,计算菜谱/笔记的综合得分;

  目的:菜谱/笔记的综合评分是前端展示每个用户推荐菜谱的依据,确保有针对性地向用户推荐高品质/高契合的菜谱;

  实现方式:基于综合评分,结合用户行为数据(查看/检索/点赞/采集/关注等)实现个性化推荐(即推荐算法)。

  5. 敏感词库 - 用于支持“内容安全”

  功能:分为敏感词管理和非法词管理(非法词严重程度高于敏感词,建议系统检测到非法词自动清除);

  目的:敏感词库用于支持系统对用户生产内容的初步判断和标注(敏感词/非法词以红色突出显示),方便后台用​​户快速定位需要审核的地方从预览内容,提高后端用户的审批效率;

  实现方法:敏感词库的工作逻辑如下,其中非法词为较严重的敏感词;敏感词库通过早期导入和后期手动改进的方式进行维护。

  

  PS:关于敏感词的处理,我采集了一些案例,得出的结论是,*敏*感*词*不同类型的UGC平台对敏感词普遍采取以下措施:

  (1)一般是机器审核和人工审核的双重过滤(机器审核为主+人工审核为辅);

  (2)机器复习步骤系统会对敏感词进行如下预处理:

  一个。系统会阻止用户发布敏感内容(不能发布);

  湾。系统将发布内容中的敏感文本替换为“*”(已发送但已转换);

  C。系统直接删除用户发送的收录敏感信息的内容(已发送但已删除);

  d。系统对收录敏感信息的内容进行潜入操作(发送但严格限制);

  同样基于快速丰富平台内容和积累用户的考虑,我们尽量降低用户发布的门槛,即可以发布敏感词;并且为了不引起用户反感(为什么我发布的正常内容被转换/删除!),我们不会转换/删除用户发布的内容;但平台的内容安全也不能掉以轻心,我们选择对收录敏感信息的内容进行操作,即只有发布者才能看到(用户不易察觉,不会造成用户电阻),然后人工审核后做最后的处理。

  对于其他形式的敏感内容(图片/音频/视频)过滤功能,如果你也自己构建,技术上很难实现。事实上,市场上已经有比较成熟的基于大数据的内容安全服务商,可以检测和过滤敏感的文本/图片/音频/视频内容,直接采用他们的安全解决方案是一种方便快捷的方式。

  6. 控制面板 - 用于支持“内容处理”

  

  控制面板页面

  功能:显示整个后台数据的实时统计/待处理项目管理/健康值管理;

  目的:主要方便后台用​​户快速了解业务数据,快速完成待办事项的处理,监控菜谱和笔记的健康值;

  实现方式:从菜谱/笔记/PV/UV等维度做一个简单的可视化面板,为后台用户提供快速访问。比如后台用户点击待审核状态的菜谱统计(共五种),可以快速跳转到菜谱管理。

  总结

  因为是从0到1的产品,所以后台功能并不完善,比如缺少分词能力——用于内容检索,缺少版本管理能力——用于用户版本统计和灰度发布。但考虑到平台建设初期内容和用户数量较少,内容检索并不是从0到1的必备能力,因此增加了后续的迭代计划。

  以上就是我对UGC平台业务背景设计思路的拆解,希望对大家有用。

  本文由@Eden East原创 发表 每个人都是产品经理。未经作者许可,禁止转载。

  标题图片来自 Unsplash,基于 CC0 协议。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线