Free and open source mobile deep learning framework, deploying by Baidu.
This research aims at simply deploying CNN on mobile devices, with low complexity and high speed. It supports calculation on iOS GPU, and is already adopted by Baidu APP.
Size: 340k+ (on arm v7)
Speed: 40ms (for iOS Metal GPU Mobilenet) or 30 ms (for Squeezenet)
百度研发的移动端深度学习框架,致力于让卷积神经网络极度简单的部署在手机端。目前正在手机百度内运行。支持iOS gpu计算。体积小,速度快。
体积 armv7 340k+
速度 iOS GPU mobilenet 可以达到 40ms、squeezenet 可以达到 30ms
项目地址:https://github.com/baidu/mobile-deep-learning
更多机器学习教程:http://www.tensorflownews.com
特征
一键部署,脚本参数就可以切换ios或者android
支持iOS gpu运行MobileNet、squeezenet模型
已经测试过可以稳定运行MobileNet、GoogLeNet v1、squeezenet模型
体积极小,无任何第三方依赖。纯手工打造。
提供量化脚本,对32位float转8位uint直接支持,模型体积量化后4M上下
与ARM相关算法团队线上线下多次沟通,针对ARM平台会持续优化
NEON使用涵盖了卷积、归一化、池化所有方面的操作
汇编优化,针对寄存器汇编操作具体优化
loop unrolling 循环展开,为提升性能减少不必要的CPU消耗,全部展开判断操作
将大量繁重的计算任务前置到overhead过程