技术公开课实录：图像检查库PaddleDetection推动遥感图象检查

优采云发布时间: 2020-08-17 00:56

　　导读：飞桨（PaddlePaddle）致力于使深度学习技术的创新与应用更简单。为了使更多的开发者了解飞桨的近来技术进展，特别组织了系列技术稿件，视频来源于2019 WaveSummit夏季深度学习开发者大会上的技术公开课。

　　本期是由百度飞桨资深研制工程师为你们带来图象检查库PaddleDetection深度解析与应用，敬请观看。

　　视频关键知识点Notes：

　　PaddleDetection为百度结合科研和业务需求所建立的一套目标测量库。主要有四个特征：一是模块化设计；二是模型丰富；三是高性能；四是工业级布署。整体全景图如下图所示：

　　01

　　模块化设计

　　依据于测量算法的工作流程界定为几个相对独立子模块，如Backbone主干网路、AnchorHead、RoIExtract、RoIHead等，再加上优化器、数据模块可以十分便捷开发者组合使用。同时在应用层提供了训练、评估和推理、以及模型压缩的API。一般来说，用户只须要调用API和配置文件即可快速开始。

　　02

　　模型丰富

　　在算法层面，PaddleDetection支持了目前常用的主流检查算法，，单阶段测量算法包括： SSD, RetinaNet, YOLOv3, 两阶段测量算法包括：Faster-RCNN,Mask-RCNN, Cascade-RCNN，支持两阶段的FPN。在主干网、数据提高、在预训练模型方面，都提供了挺好的支持。

　　同时PaddleDetection还进一步提高了YOLOv3，基于COCO的mAP再进一步提高至41.4%，GPU上的推理速率进一步提高。本次还发布了BlazeFace等系列人脸检查模型，同时还发布了自研的搜索版本BlazeFace，模型大小压缩三倍的情况下（体积仅有234k），大幅提高预测速率。特别指出一下，预训练模型中的行人检查和汽车检查的模型，是基于百度内部的业务数据得到疗效不错的模型，值得推荐。

　　03

　　高性能

　　主要彰显在训练速率、训练内存和推理速率上。基于飞桨的内存优化策略，PaddleDetection大部分的模型内存占用较竞品少，训练及推理速率更快，比如YOLOv3比竞品快了40%以上。

　　04

　　工业级布署

　　PaddleDetection基于飞桨高性能的引擎，提供了一套完备的布署方案。对于Linux和Windows都提供了良好的支持，GPU预测底层支持TensorRT加速以及FP16预测。 CPU底层支持使用MKLDNN加速。再加上PaddleSlim提供的模型压缩策略，可以提供更小的模型和更快的速率，满足工业级布署的需求。

　　05

　　应用案例

　　5.1遥感图象高尔夫球场检查

　　自然场景图象一般人十分容易理解，但是遥感图象除了须要专家能够够辨识出对象，还会遭到四季、气候的变化影响。使用传统方式须要大量的人工配合。这种情况下对实时性要求没有这么高，对准确率和召回率要求比较高。通过选择二阶段的模型如FasterRCNN，重新设计了Anchor规格，并且进行了裁减、旋转等数据提高方案，最终在内部评测的数据集上得到82%的精度指标。相比传统的方式，大大提高了作业的效率。

　　5.2手机壳外型缺陷检查

　　手机壳外型缺陷通常主要收录压伤、划痕、污点、气泡等等。在工业生产流水线上，手机壳外型、环境背景复杂多变，对于实时性的要求也比较高。这样的场景下，选择预测速率比较快的YOLOv3，同时加上各类数据提高的举措。在内部的评测数据集上，准确率可以达到99.55%。值得一提的是，基于百度研制的EdgeBoard硬件，实际延时大于750毫秒，对比竞品预测速率提高200%以上。

　　进入云盘获取视频中的PPT，链接：

　　密码:wfwa

　　想与更多的深度学习开发者交流，请加入飞桨官方QQ群：796771754。

0

2020-08-17

原创智能优化,原创度检查,一键采集,文章组合

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

技术公开课实录：图像检查库PaddleDetection推动遥感图象检查

0 个评论

发起人