采集器的自动识别算法，尤其是条件判断机制这块

优采云发布时间: 2021-02-24 08:02

　　采集器的自动识别算法，尤其是条件判断机制这块，在这个rtb大环境下算是我们的弱项。大概从十年前，进入到pc端互联网时代，基本上自动打包识别率已经可以稳定在85%了，毕竟是基于规则的识别器。从ngx_alpha的低到达率稳定到96%可以体现出准确率问题的突出。但是基于条件判断机制的打包识别率还远远不能够达到网络音频的70%以上。

　　做直播的话这点体现尤为明显。自己之前确实曾经有过做法识别，把不同的手机把传输的音频分成60-70段，每段都通过几块的硬盘存储一遍，然后按照歌曲进行批量打包识别。做起来容易，但是做精确率还得有极其高的识别速度。由于播放平台的pc端，app端产品较少，能够做精确识别的也只有米兔。不过即使这样也远远做不到国际标准的a2dp。

　　最近一段时间谷歌在gmail邮件中添加了一个v2dp功能。这个功能到底能不能大幅提升识别率也看过一些相关的分析报告。主要还是下载转码率。谷歌手机端v2dp的下载转码率可以达到926kbps（v6k3mpg）左右。据说确实能有效提升识别率。见下图所示。我做个简单的测试，用得到的样本打包测试音频做一个测试，基本上达到95%以上，放入公众号或者youtube某一个视频，只有中字也可以达到94%以上的识别率。

　　就是说这个v2dp技术已经在公众号视频里面利用过。但是公众号版权局已经在2016年颁布禁令，禁止用公众号发布公众号视频。从这个角度来看，即使谷歌手机端v2dp技术在公众号视频版权监管已经对音频流进行严格标准的操作下，要达到大幅提升国际音频识别标准的地步，也很难。目前在大型直播平台这块可以和播放平台v2dp比一下识别率的高低，但是要达到接近b站版权检测的水平还要很久。不过有大厂也是资本市场的有力支持。

0

2021-02-24

采集器的自动识别算法

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

采集器的自动识别算法，尤其是条件判断机制这块

0 个评论

发起人

AI时代内容工厂

采集器的自动识别算法，尤其是条件判断机制这块

0 个评论

发起人

相关问题