博客
关于我
【研究生】TensorFlow Lite发布重大更新!支持移动GPU、推断速度提升4-6倍
阅读量:309 次
发布时间:2019-03-03

本文共 588 字,大约阅读时间需要 1 分钟。

TensorFlow Lite的最新版本引入了对移动设备GPU的支持,这一功能显著提升了模型推断效率,为移动应用开发者带来了更强大的性能保障。

在资源受限的移动设备上运行复杂机器学习模型往往面临性能瓶颈。TensorFlow Lite通过量化优化模型以提升性能,但这通常需要牺牲模型精度。而使用GPU加速的浮点模型则避免了这种权衡,既保留了高精度又获得了更快的推断速度。

在Pixel 3和S9等旗舰设备上,GPU加速使人脸轮廓检测速度提升了4倍,而在iPhone 7上则达到了6倍的提升。对于实时视频处理任务,如YouTube Stories中的视频分割模型,速度提高了5-10倍。

这种改进尤其在处理复杂模型时更加明显,如深度估计模型的速度提升了10倍。相比之下,对于较小模型的使用,GPU加速的优势相对较低,且可能带来额外的内存传输延迟。

在实际应用中,安卓开发者可以通过将TensorFlow Lite的AAR文件替换为带有GPU支持的版本,并在Java初始化代码中添加相应的GPU代理配置。iOS开发者则需要下载对应的TensorFlow Lite二进制文件,并在模型创建后调用GPU代理。

当前GPU支持仅适用于特定操作,如ADD、CONV_2D等,未来版本将扩展更多操作和性能。完整开源版本计划于2019年晚些时候发布。

文章链接提供了详细的使用教程及更多信息。

转载地址:http://hsbm.baihongyu.com/

你可能感兴趣的文章
openlayers 入门教程(四):layers 篇
查看>>
OpenLayers 项目分析(三)-OpenLayers中定制JavaScript内置类
查看>>
Openlayers下载与加载geoserver的wms服务显示地图
查看>>
Openlayers中使用Cluster+Overlay实现点击单个要素和聚合要素时显示不同弹窗
查看>>
Openlayers中使用Cluster实现点位元素重合时动态聚合与取消聚合
查看>>
Openlayers中使用Cluster实现缩放地图时图层聚合与取消聚合
查看>>
Openlayers中使用Image的rotation实现车辆定位导航带转角(判断车辆图片旋转角度)
查看>>
Openlayers中使用Overlay实现点击要素弹窗并且弹窗随之移动
查看>>
Vmware系列&虚拟机系列【仅供参考】:使用vCenter Auto Deploy制作ESXI系统封装(适合高版本vSphere)
查看>>
Openlayers中加载GeoJson文件显示地图
查看>>
Openlayers中加载Geoserver切割的EPSG:900913离线瓦片图层组
查看>>
Openlayers中加载Geoserver切割的EPSG:900913离线瓦片地图并显示
查看>>
Openlayers中多图层遮挡时调整图层上下顺序
查看>>
Openlayers中实现地图上添加一条红色直线
查看>>
Openlayers中将某个feature置于最上层
查看>>
Openlayers中点击地图获取坐标并输出
查看>>
Openlayers中设置定时绘制和清理直线图层
查看>>
Openlayers入门教程 --- 万字长篇
查看>>
Openlayers图文版实战,vue项目从0到1做基础配置
查看>>
OpenLayers学习三:地图旋转及地图跳转到某一点的方式(以类为接口)
查看>>