虽然这一代的树莓派增加了内存,但主频的限制使得直接用纯主板推理,速度还是不够实时,这一篇我们介绍一下在树莓派上部署 OpenVINO 神经棒,进一步提升AI的推理速度。
Intel的了第二代神经计算棒(Neural Compute Stick 2/NCS 2),身材依然只有U盘大小,尺寸只有72.5×27×14毫米,内置了最新的Intel Movidius Myriad X VPU视觉处理器,集成16个SHAVE计算核心、专用深度神经网络硬件加速器,可以极低的功耗执行高性能视觉和AI推理运算,支持TensorFlow、Caffe开发框架。
按照Intel给出的数据,NCS 2的性能比之前的Movidius计算棒有了极大的提升,其中图像分类性能高出约5倍,物体检测性能则高出约4倍。
NCS2 的主要特点:
NCS2 支持树莓派作为其的一个特点,intel官方专门做了个主题文档,那部署起来就相当友好了。
https://docs.openvinotoolkit....
我选择的版本是 2020年4月的版本:
cd ~/Downloads/ sudo wget https://download.01.org/opencv/2020/openvinotoolkit/2020.4/l_openvino_toolkit_runtime_raspbian_p_2020.4.287.tgz # 创建安装文件夹 sudo mkdir -p /opt/intel/openvino # 解压缩文件 sudo tar -xf l_openvino_toolkit_runtime_raspbian_p_2020.4.287.tgz --strip 1 -C /opt/intel/openvino
之前已经安装过cmake,其实这步可跳过。
sudo apt install cmake
source /opt/intel/openvino/bin/setupvars.sh # 永久设置环境变量 echo "source /opt/intel/openvino/bin/setupvars.sh" >> ~/.bashrc
现在每打开一个新的命令行终端。将会出现下列信息:
[setupvars.sh] OpenVINO environment initialized
将当前的 Linux 用户添加到users群组:注销并登录,使设定生效。
sudo usermod -a -G users "$(whoami)"
安装 USB 规则
sh /opt/intel/openvino/install_dependencies/install_NCS_udev_rules.sh
重新插入NCS2,准备运行程序。
mkdir openvino && cd openvino mkdir build && cd build
cmake -DCMAKE_BUILD_TYPE=Release -DCMAKE_CXX_FLAGS="-march=armv7-a" /opt/intel/openvino/deployment_tools/inference_engine/samples/cpp make -j2 object_detection_sample_ssd
要下载.bin带权重的文件:
wget --no-check-certificate https://download.01.org/opencv/2020/openvinotoolkit/2020.1/open_model_zoo/models_bin/1/face-detection-adas-0001/FP16/face-detection-adas-0001.bin
要下载带网络拓扑.xml的文件:
wget --no-check-certificate https://download.01.org/opencv/2020/openvinotoolkit/2020.1/open_model_zoo/models_bin/1/face-detection-adas-0001/FP16/face-detection-adas-0001.xml
搜索一些包含人脸的图片作为被检测样本,保存到 ~/Downloads/image 目录下。
其中 -m 指定模型拓扑结构 .xml 文件,程序会自动寻找同名 .bin 权重文件;
-d MYRIAD 代表用神经棒作为推理设备;
-i 指定了被测图片的路径。
./armv7l/Release/object_detection_sample_ssd -m face-detection-adas-0001.xml -d MYRIAD -i ~/Downloads/image
make -j2 benchmark_app
其中 -i 是输入被检测的图片;
-m 是输入的模型参数;
-niter 为运行推理的迭代次数。
./armv7l/Release/benchmark_app -i car.png -m squeezenet1.1/FP16/squeezenet1.1.xml -pc -d MYRIAD -niter 1000
树莓派+神经棒的推理速度可达 280 FPS,这速度足够快了,再试试在电脑上插神经棒测试,与其对比一下。
还是280帧左右,运行速度没有区别,可见计算瓶颈都集中在NCS2上,主设备用电脑或是树莓派差别不大。在插神经棒的场合,用PC就显得有点浪费了。
再对比一个直接用笔记本电脑的 intel cpu 跑的openvino加速模型:
340 FPS,果然还是电脑的CPU更强些。
常规的开发方式,需要在 open model zoo 中寻找适合的模型,对于大多数业务来说,都能满足基本需要。若需要跑一些比较前沿的模型或者是自己设计的神经网络时,那各类模型转换的方法则是必备技能,难度相应也会大一些。
本期相关文件资料,可在公众号后台回复:“rpi08”,获取下载链接。
我们就将做一些模型转换的工作,
让yolov5在树莓派上,
用Openvino来运行一下...
敬请期待...