采集器的自动识别算法(华为云AIGallery:如何汇聚AI应用开发的难题?)

优采云 发布时间: 2022-01-23 13:11

  采集器的自动识别算法(华为云AIGallery:如何汇聚AI应用开发的难题?)

  你见过哪些有趣又实用的 AI 开发案例?

  比如让静态照片中的人物唱歌,也可以使用*敏*感*词*人物;又如识别各类野生动物,分析种群结构实施保护;或智能检测口罩佩戴标准化,助力防疫...

  对于这些场景化的AI案例,你可以在华为云AI图库中找到对应的模型,也可以通过不断的训练来实现。AI Gallery拥有算法、模型、数据、笔记本等丰富的优质AI资产。开发者可以直接复用这些资产来解决AI应用开发的问题。

  

  纵观AI应用的整个开发过程,从数据采集、注解,到算法模型的构建,每个环节都会产生很多可以复用的AI资产,而AI Gallery的目的就是充分发挥利用这些资产,提高人工智能开发的效率。

  那么,它是如何聚合这些 AI 资产的,如何最大限度地发挥资产的效用,帮助开发者高效开发 AI?

  华为云社区邀请了AI Gallery负责人闫博士来听他讲述AI Gallery的原创设计、经典案例和未来规划。

  人工智能有三驾马车:数据、算法和计算能力。从这三点来看,当前的人工智能应用发展进入了哪个阶段?

  人工智能是人类不断探索和发展的领域。因为没有预先定义阶段,所以很难回答我们目前处于哪个阶段。但有一个清晰的感知,人工智能的发展与10年前相比有了显着的进步,应用越来越多.

  这个机会是2012年以深度学习为代表的一类算法的突破,在此之前大家都比较关注算法。大家都在用数据降维和一些分类器的方案做机器学习相关的AI开发,训练数据量也很小。

  2012年的转折点,在算力的加持下,通过算法和大量的数据迭代,我们看到AI开发模型的准确性有了一个数量级的提升。随着这个量级的提升,它可以将AI技术应用到更多的行业和领域,提高生产力。

  但现阶段,人工智能无法像人类一样通过对少量数据的学习获得逻辑推理的能力。本质上,人工智能仍然是对大量数据进行拟合和迭代,使其能够“记住”数据,然后做一些推理,但它不具备逻辑推理的能力。但与过去10年相比,AI的最终精度有所提升,应用领域进一步扩大。

  展望未来,我们将在算力上取得进一步突破,在整个算法和数据的支持下,最终能够训练出更高精度的AI,甚至获得像人类一样的逻辑推理能力。

  一个完整的AI应用开发流程包括哪些环节,有哪些挑战?

  一般分为三个过程。

  第一个环节是数据准备,需要采集数据对数据进行清洗和转换。每个环节都有自己的挑战。以数据为例,在采集阶段会有政策和法律的限制,数据孤岛很难打破。此外,还需要对数据进行有效的标注,需要大量的人力才能完成,经济成本高。

  第二阶段是建模。根据准备好的数据,选择合适的算法并开发相关模型。考虑训练模型的应用场景。例如,一个AI应用是放在移动端还是放在云服务器上,对推理的时延和准确性有不同的要求。因此,在AI开发的建模过程中,需要全面了解AI的应用场景,然后选择合适的算法流程架构。它不同于只追求准确性或推理速度的学术领域。我们需要综合考虑,所以挑战比较大。

  第三阶段是基于模型的特定人工智能应用开发。专注于特定的应用场景,配合一些IT系统、软件、UI交互的开发。比如算法工程师负责建模和开发,在应用开发阶段,可能由应用工程师承担,角色发生变化。作为应用开发工程师,你收到的是一个已经开发出来的模型,但是这个模型的推理延迟和准确度可能达不到理想状态。这时就需要通过压缩和蒸馏的技术对其进行进一步优化。如果精度达不到,就要考虑最终的应用能否通过一些巧妙的设计来规避这些问题。

  AI Gallery 是否旨在解决上述链接中的一些问题?它是为了什么而设计的?

  现在很多开发流程都是平台化的,AI开发的每个阶段都会产生一些数字资产:算法、模型、数据集,可能还有一些处理功能和方法。我们希望有一个可以存放和积累这些东西的地方,让后续的开发者可以复用之前的一些成果,这也是我们设计AI Gallery的初衷。

  当越来越多的开发者分享各种场景下的 AI 资产时,AI 画廊可以收录全场景下各种精度的实验。这时,其他开发者也可以根据最终的开发场景直接使用这些资产。

  例如,人工智能发展的三个阶段可能会受到不同角色的干预。如果应用工程师想参与 AI 开发,但缺乏相应的数据和算法工程师怎么办?AI图库中有经过训练的模型,应用工程师可以立即使用。从这个角度来说,它可以提高整体开发效率。

  开发者选择算法或模型的首要考虑是什么?此时,AI Gallery 是如何应对的?

  如果选择数据,一般是根据其行业和领域场景,看是否有合适的数据。这与领域和行业密切相关。目前,我们提供了一种数据共享机制。很多开发者分享了开源标准场景的数据集,供大家快速验证自己对ModelArts的想法。

  在算法方面,开发者首先考虑算法生成的最终模型是否是自己想要的,算法在训练时的输入数据格式,训练需要的开销,算法运行的环境等等。

  在模型方面,首先要明确应用开发是部署在云端、边缘端还是设备端,这对于最终的应用场景非常重要。二是推理的延迟。比如医疗场景中的数据会很大,它的推理是异步的。但是,某些场景需要实时推理,这可能需要很长时间才能进行推理响应。最后是准确度,评估应用场景对准确度的敏感度。

  

  综上所述,在人工智能发展的每个阶段,都有很多指标和维度需要考虑。我们要做的就是将这些维度和指标标准化,让发布AI资产的开发者可以填写这些指标,方便用户浏览、筛选、检索,快速找到自己想要的。

  有哪些 AI Gallery 的经典案例可以介绍给开发者?

  对于视觉领域的一些经典算法,比如YOLO和ResNet50,官方做了很多适配,但是这些算法实际上并没有落户这个领域和行业。因此,基于一些内部项目,我们也做了一些AI的实际案例。例如水表抄表、头盔检测等。这些案例可能使用相同的特定算法,但应用在不同的领域和行业场景。

  

  未来我们的合作伙伴、高校老师、开发者都会分享他们的案例,让其他开发者通过阅读这些案例可以快速复现,加速整个端到端的开发。

  这里我也推荐一些AI图库上的经典案例:

  安全帽检测、水表读数识别、工地钢筋盘点、使用PPO算法玩超级马里奥兄弟、对战中国象棋AI。

  比如工业头盔检测、水表抄表,都是基于华为在行业的一些项目沉淀下来的案例。在这些案例中生产的模型可以满足工业级的要求,可以直接部署使用。唯一的区别是数据。目前,我们只提供一个样本的数据。如果你能采集得到更多更好的数据,那么训练出来的模型的准确率会非常好。

  在 AI Gallery 中发布 AI 资产后,开发者可以享受哪些福利?

  对于ISV合作伙伴来说,AI Gallery对接华为云市场,可以将云市场上市,资产模型商业化销售,直接获得商业收益。

  对于开发者来说,更多的是个人成就和荣誉提升。后续我们也在积极引入个人开发者计划,让普通个人开发者参与整个项目,真正进入实战环节,不仅可以获得实战训练,还可以获得经济回报。

  AI Gallery 如何帮助包容性 AI?

  一是资产和*敏*感*词*的积累。目前很多开发者已经在 AI Gallery 上贡献了主流的开源数据集,其他人在直接验证算法时可以使用。在算法和模型方面,官方也预先集成了很多常用的算法。各大学也在将一些经典论文的算法发布到AI图库中进行分享。

  二是共享机制。开发者可以将算法和模型分享到AI图库,我们正在尝试采取一些激励机制,让他们更有动力去分享。

  第三,针对端到端的案例场景,我们推出了案例库。虽然目前案例不多,但华为官方、ISV、合作伙伴、个人开发者等会陆续发布开发交付的项目案例总结和发布,让开发者学习这些案例,加速应用开发进程。

  AI Gallery未来的规划是什么?

  第一个方向是加快人工智能应用在行业和企业中的落地。一是通过资产沉淀提高AI开发效率。二是我们正在做的项目的需求方,以及开发者的认证机制。通过减少开发环节,更多的开发者和合作伙伴可以通过AI画廊开发和交付AI项目,最终帮助行业和企业解决问题。加速应用落地。

  另一个方向主要是学习和教育场景。现在我们基于大量的计算能力和数据做迭代训练和开发,但是很多高校的硬件可能跟不上,教学实践需要在云端进行。所以针对教育行业,针对个人开发者的学习场景,我们也打算做一些事情,包括教学课程,论文解读等等。

  最终,我们希望打通这两条线,不仅可以提供教学、培训和学习的一站式解决方案,还可以让开发者通过真实的交付场景实践所学知识。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线