问题

参考上一章 ncnn 优化量化_ncnn aciq量化-CSDN博客

量化之后,识别速度没有提升,后面我只能换小点的模型了,把【det_10g】改为【det_500m】速度终于提升上来了,识别效果还在

在rk3399 上面由1s多 降为500ms左右,但是速度还是有点慢。

摄像头采用的uvc模式,通过jni来调face。

看了下识别时长,基本都是目标检测和人脸特征提取这两个时间有点长

虽然rk3399 没有算力芯片,但是cpu能力还是可以的,我想要把识别时长控制在100ms内感觉不现实,所以我得基于此对其进行优化,量化也试过了,速度提升不明显,那么我只能把入参图片缩小试试了,我之前是640x640 我改为320或者128试试,看看速度能够提升多少。

执行:

虽然是传入图片是动态的,经过测试,发现改为其他的尺寸,识别就会出现问题,要不bbox框不对,要不识别出一大堆的方框,而且都是无效方框,后续最终放弃此种方向。

后面经过调试发现,人脸识别一个是bbox和kps提取,还有一个是embding提取,其中bbox和embding提取时长都超200ms了。

后面替换了优化的库,由原来的【det_10g_sim和w600k_r50】改为【det_500m_sim和w600k_mbf】成功把速度500ms 降到了300ms多

看了下耗时,其实主要就是选择步长为8的

其他解决思路

insightface里面最轻量级的也是det_500m,速度上暂时没法提升了,所以考虑采用其他的轻量级网络 进行特征提取和kps(关键点)提取,比ShuffleNetV2、MobileNet或者nanodet等。虽然精度可能会丢失点,但是如果单纯的人脸识别够用的。速度可以从100ms提升到20~30ms,那完全满足功能需求了。

embding提取96ms,依然采用insightface。

这里openmp没有去开启,暂时未定位是哪里的问题,运行一段时间会崩溃,不开启openmp就完全没问题。

人脸识别采用的余弦相似度,相似度的代码:人脸识别之--计算余弦相似度-android-CSDN博客

insightface转ncnn模型打包:https://download.csdn.net/download/p731heminyang/89425438

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部