网站内容发布审核流程(内容审核意味着什么?内容和视频/音频的审核策略)

优采云 发布时间: 2022-01-06 04:09

  网站内容发布审核流程(内容审核意味着什么?内容和视频/音频的审核策略)

  由于 Facebook、Twitter 和 YouTube 对内容审核团队的人力资源进行了不同程度的配置,以下是这些系统通常的工作方式。其中大部分是基于我在 YouTube 工作时的经验,但我发现我的同行公司也以类似的方式这样做。请注意,我将专注于用户生成/共享的内容,而不是广告策略。广告通常有自己独立的标准。以下是关于一般用户创建、上传和发布的文本、图像和视频/音频的评论策略的更多信息。

  内容审核是什么意思?

  内容审查或内容审查是一个术语,适用于用户在社交平台上上传、发布或共享的内容(文本、图像、音频、视频)。它与广告或社论有很大不同(例如,如果组织中有这样的功能,您可以在 网站 上找到特色/宣传内容),通常在审核内容时有单独的团队和指南。

  大多数内容审查团队的目标是实施产品的社区标准或服务条款。标准规定了平台上可以共享的内容和不能共享的内容。正如您可能猜到的那样,所有这些都有黑色、白色和灰色区域,这意味着对人工审核人员有指导、培训和升级策略。

  人们什么时候参与这个过程?

  以下两点审查对人类来说是罕见的(也是不可取的): (a) 审查 网站 上共享的所有内容。(B) 审核内容预发布,即当用户尝试分享某些内容时,需要在网站/app上线前获得“批准”。

  相反,公司依靠内容审查算法来完成大量繁重的工作。这些算法试图“理解”正在创建和共享的内容。其中包括:上传者(帐户历史记录或缺乏相关信息)、上传来源、内容本身和其他元数据。因为内容在产品中,你得到更多的数据——谁在使用它,它是否被用户标记,它是否被用户共享等等。

  这些更丰富的信号会影响算法,并不断调整其结论,即一段内容是否适合这个网站。这些系统中的大多数都有用户标记工具,这个因素对是否应该审查内容的算法评分有严重影响。

  一般来说,一段内容在任何给定时间都可以被视为绿色、*敏*感*词*或红色。绿色表示算法认为内容存在于 网站 上是好的。*敏*感*词*表示内容可疑。红色,红色表示它不应该在 网站 上。他们的界限不是固定的,也不是不完美的。一直存在误报。

  将内容策略的有效性视为合理的,技术质量将是不完整的。这实际上是一个由人类决定并在代码级别强制执行的战略问题。管理层需要在绿色、*敏*感*词*和红色之间设置分界线。它们确定默认情况下是否应该信任未知的新用户。他们总结了如何优先审查绿色、*敏*感*词*或红色数据存储容器中的项目。这是人类主要参与的地方......

  什么是审核队列?

  人工审核帮助算法创建训练集,但其主要功能是不断为算法吐出的内容审核队列配备人员。队列通常分为不同的容器,根据审稿的优先级(例如,这是紧急的,7*24小时实时审稿)和审稿人的特点——他们接受过不同类型的内容审稿培训,可以说不同的语言,等等。这是一个复杂的类似工厂的系统,内置了很多逻辑。

  进入平台的内容量和触发人工审核所需的算法阈值是影响进入审核队列的内容量的因素。人工审核员的数量、他们的培训/质量以及他们使用的工具的有效性都会影响内容审核的速度。

  因此,当听说“增加了一个10000人的审稿人”时,可能是(a)更多的内容需要审核[正在修改阈值以将更多内容放入审核队列)和/或(b)审核队列的内容需要审核速度更快【内容相同,但审核人更多】。

  这些公司真的关心这件事吗?

  坦率地说,答案是肯定的,但是……

  内容运营通常是成本中心,而非收益中心,因此其管理存在成本风险,可能缺乏资源。

  内容处理有时可能被视为产品经理、设计师和工程师的“初学者”工作,因此它可以让年轻、影响力较小的人在 1-2 年后习惯性地转向新项目。

  高层领导和团队缺乏多样性和错位的激励措施可能会导致低估平台上“不良”内容的真实成本(品牌、用户体验)。

  为什么裸体*敏*感*词*最容易审查……但为什么审查“性”内容更难?

  因为有很多比 Twitter、Facebook 和 YouTube 更好的分享*敏*感*词*内容的地方。而且该算法实际上非常擅长检测裸体。然而,为满足性需求而制作的内容并没有明确涉及裸体,这对于平台来说更难审查。

  管理层需要考虑的“最佳实践”是什么?

  将其用作仪表板级别的测量标准。如果 CEO 和她的团队在使用内容、收入等方面关注内容安全指标,就会证明它很重要,并且会更合适地配备人员。

  使用#s 而不是百分比,这些大平台总是说“好吧,我们的内容是 99% 安全的”,但他们真正的意思是“1% 的点数仍然是真正的大数据”。最小化框架实际上是一个公共关系问题——它偏离了认真对待这个问题的真正目标。

  致力于防止重复侵权并快速从原创侵权中恢复,没有人期望这些系统是完美的。我认为信任用户通常是好的,直到他们证明他们不值得信任。失信后,重创。Twitter 在这个问题上感觉特别糟糕——在任何时候,系统上都有很多用户的灰色地带。

  管理层应该花时间在审核队列上。当我在 YouTube 上领导产品时,我试图习惯性地将时间花在内容审查队列上,因为我不想让自己脱离现实。我见过很多烦人的事情,但我一直很欣赏我们的审核团队和用户的经历。

  响应时间是新的监管框架——我想知道政府是否有责任监控内容,但调整内容标记的响应时间。这里有很多复杂的东西,规则可以创造出激励不标记的内容,但这是一个我不知道的领域。

  本文由网易易盾翻译,来源:hterterwalk

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线