采集器的自动识别算法,尤其是条件判断机制这块

优采云 发布时间: 2021-02-24 08:02

  采集器的自动识别算法,尤其是条件判断机制这块

  采集器的自动识别算法,尤其是条件判断机制这块,在这个rtb大环境下算是我们的弱项。大概从十年前,进入到pc端互联网时代,基本上自动打包识别率已经可以稳定在85%了,毕竟是基于规则的识别器。从ngx_alpha的低到达率稳定到96%可以体现出准确率问题的突出。但是基于条件判断机制的打包识别率还远远不能够达到网络音频的70%以上。

  做直播的话这点体现尤为明显。自己之前确实曾经有过做法识别,把不同的手机把传输的音频分成60-70段,每段都通过几块的硬盘存储一遍,然后按照歌曲进行批量打包识别。做起来容易,但是做精确率还得有极其高的识别速度。由于播放平台的pc端,app端产品较少,能够做精确识别的也只有米兔。不过即使这样也远远做不到国际标准的a2dp。

  最近一段时间谷歌在gmail邮件中添加了一个v2dp功能。这个功能到底能不能大幅提升识别率也看过一些相关的分析报告。主要还是下载转码率。谷歌手机端v2dp的下载转码率可以达到926kbps(v6k3mpg)左右。据说确实能有效提升识别率。见下图所示。我做个简单的测试,用得到的样本打包测试音频做一个测试,基本上达到95%以上,放入公众号或者youtube某一个视频,只有中字也可以达到94%以上的识别率。

  就是说这个v2dp技术已经在公众号视频里面利用过。但是公众号版权局已经在2016年颁布禁令,禁止用公众号发布公众号视频。从这个角度来看,即使谷歌手机端v2dp技术在公众号视频版权监管已经对音频流进行严格标准的操作下,要达到大幅提升国际音频识别标准的地步,也很难。目前在大型直播平台这块可以和播放平台v2dp比一下识别率的高低,但是要达到接近b站版权检测的水平还要很久。不过有大厂也是资本市场的有力支持。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线