驭势科技潘争《如何构建低成本高效能的视觉感知系统》

2020-02-27 61浏览

1.如何构建低成本高效能的视觉感知系统潘争驭势科技
2.效率精度平衡的卷积网络卷积网络的压缩嵌入式GPU+CPU的加速低成本FPGA的加速
3.视觉感知的优势 • 信息更丰富 • 视野更宽阔 • 基建更配合 • 硬件更便宜
4.28.20% 25.80% 视觉识别算法飞速进步 ImageNet Top-5错误率 16.40% 11.70% 6.70% 5.10% 3.57% 2.99% 2.25%
5.视觉感知从demo到deploy • Demo：精度要高，不计成本，不管标准，不算功耗 • Deploy：低成本，低功耗，合车规，实时性，精度用户满意
6.硬件更便宜？ 3999美元
7.硬件更便宜
8.PVANet Hong S, Roh B, Kim K H, et al.PVANet:Lightweight Deep Neural Networks for Real-time Object Detection. arXiv, 2016.
9.PVANet+fasterRCNN物体检测
10.Standard convolution Depth wise convolution 1x1 convolution MobileNet ??????????????????. ???????????????????????? 11 ???????????? ???????????????????????? + 1??????1 ???????????????????????? = ??????01 + ?????? Howard A G, Zhu M, Chen B, et al.MobileNets:Efficient Convolutional Neural Networks for Mobile Vision Applications. arXiv, 2017.
11.效率精度平衡的卷积网络卷积网络的压缩嵌入式GPU+CPU的加速低成本FPGA的加速
12.?????? ?????? ?????? ?????? = 4 ??????(??????(??????8, ??????), ??????8) + ?????? 4 ?????? ? 8 @∈B Network slimming Liu Z, Li J, Shen Z, et al. Learning Efficient Convolutional Networks through Network Slimming. arXiv, 2017.
13.?????? = 0 ?????? = 0.0001 ?????? = 0.001 网络参数稀疏化效果
14.网络压缩结果
15.效率精度平衡的卷积网络卷积网络的压缩嵌入式GPU+CPU的加速低成本FPGA的加速
16.摄预神像处经后头理网处络理当前⽆无法显示该图像。 30fps Pipeline 20~30fps 当前⽆无法显示该图像。
17.TensorRT • FP16和INT8自动量化 • 多层合并 • 自动选择并行算法 • 显存动态优化 • 多任务并发
18.效率精度平衡的卷积网络卷积网络的压缩嵌入式GPU+CPU的加速低成本FPGA的加速
19.FPGA定点化 • 表示范围FP32：−3.4×10HI~3.4×10HI，INT8：−128~127 • 定点小数?????? = (??????O)??????? ⋯ ??????0. ⋯ ??????Q (??????O为符号位，??????8为0/1)代表的小数为 −1 RS[??????? ∗ 20V? + ??????1 ∗ 20V1 + ⋯ + ??????0 ∗ 2O + ⋯ + ??????Q ∗ 20VQ] • 定点小数表示范围在±20(1 − 0.5Q)之间，精度（最小单位）为20VQ • 用INT8定点表示FP32： ?????? = 20 ∗ −1 ZS ∗ 0. ?????????????1 ⋯ ??????Q FP32 Value ??????= FP32 scale factor ??????R * INT8 Value ??????R • ∑^ ??????^??????^ = ??????R??????` ∑^ ??????R^??????`^
20.-M A + M -M -T A +T + M ??????R -1 +1 ?????? = max ?????? ≤ 20 表示范围大，精度差 ??????R -1 +1 ?????? > ?????? = 20 表示范围小，精度好表示范围与精度的取舍
21.FPGA的网络选择 • MobileNet使用depth wise convolution+1x1 convolution • 理论计算量低，同时精度很高 • GPU加速比比较差，但适合CPU和定制计算设备
22.FPGA+MobileNet物体检测
23.UISEE UISEE Visual Perception demo video
24.

驭势科技 潘争《如何构建低成本高效能的视觉感知系统》

驭势科技潘争《如何构建低成本高效能的视觉感知系统》