技术公开课实录:图像检查库PaddleDetection推动遥感图象检查
优采云 发布时间: 2020-08-16 05:56技术公开课实录:图像检查库PaddleDetection推动遥感图象检查
导读:飞桨(PaddlePaddle)致力于使深度学习技术的创新与应用更简单。为了使更多的开发者了解飞桨的近来技术进展,特别组织了系列技术稿件,视频来源于2019 WaveSummit夏季深度学习开发者大会上的技术公开课。
本期是由百度飞桨资深研制工程师为你们带来图象检查库PaddleDetection深度解析与应用,敬请观看。
视频关键知识点Notes:
PaddleDetection为百度结合科研和业务需求所建立的一套目标测量库。主要有四个特征:一是模块化设计;二是模型丰富;三是高性能;四是工业级布署。整体全景图如下图所示:
01
模块化设计
依据于测量算法的工作流程界定为几个相对独立子模块,如Backbone主干网路、AnchorHead、RoIExtract、RoIHead等,再加上优化器、数据模块可以十分便捷开发者组合使用。同时在应用层提供了训练、评估和推理、以及模型压缩的API。一般来说,用户只须要调用API和配置文件即可快速开始。
02
模型丰富
在算法层面,PaddleDetection支持了目前常用的主流检查算法,,单阶段测量算法包括: SSD, RetinaNet, YOLOv3, 两阶段测量算法包括:Faster-RCNN,Mask-RCNN, Cascade-RCNN,支持两阶段的FPN。在主干网、数据提高、在预训练模型方面,都提供了挺好的支持。
同时PaddleDetection还进一步提高了YOLOv3,基于COCO的mAP再进一步提高至41.4%,GPU上的推理速率进一步提高。本次还发布了BlazeFace等系列人脸检查模型,同时还发布了自研的搜索版本BlazeFace,模型大小压缩三倍的情况下(体积仅有234k),大幅提高预测速率。特别指出一下,预训练模型中的行人检查和汽车检查的模型,是基于百度内部的业务数据得到疗效不错的模型,值得推荐。
03
高性能
主要彰显在训练速率、训练内存和推理速率上。基于飞桨的内存优化策略,PaddleDetection大部分的模型内存占用较竞品少,训练及推理速率更快,比如YOLOv3比竞品快了40%以上。
04
工业级布署
PaddleDetection基于飞桨高性能的引擎,提供了一套完备的布署方案。对于Linux和Windows都提供了良好的支持,GPU预测底层支持TensorRT加速以及FP16预测。 CPU底层支持使用MKLDNN加速。再加上PaddleSlim提供的模型压缩策略,可以提供更小的模型和更快的速率,满足工业级布署的需求。
05
应用案例
5.1遥感图象高尔夫球场检查
自然场景图象一般人十分容易理解,但是遥感图象除了须要专家能够够辨识出对象,还会遭到四季、气候的变化影响。使用传统方式须要大量的人工配合。这种情况下对实时性要求没有这么高,对准确率和召回率要求比较高。通过选择二阶段的模型如FasterRCNN,重新设计了Anchor规格,并且进行了裁减、旋转等数据提高方案,最终在内部评测的数据集上得到82%的精度指标。相比传统的方式,大大提高了作业的效率。
5.2手机壳外型缺陷检查
手机壳外型缺陷通常主要收录压伤、划痕、污点、气泡等等。在工业生产流水线上,手机壳外型、环境背景复杂多变,对于实时性的要求也比较高。这样的场景下,选择预测速率比较快的YOLOv3,同时加上各类数据提高的举措。在内部的评测数据集上,准确率可以达到99.55%。值得一提的是,基于百度研制的EdgeBoard硬件,实际延时大于750毫秒,对比竞品预测速率提高200%以上。
进入云盘获取视频中的PPT,链接:
密码:wfwa
想与更多的深度学习开发者交流,请加入飞桨官方QQ群:796771754。