平台
深度学习发展历程
深度学习框架历程
飞桨全景图
面临挑战
领先技术解决挑战
动静统一
高低融合
简化开发流程
丰富的模型库
教程丰富
用户和产业落地
训练框架整体架构
IR,降低复杂度
统一前端转换和性能
首创多层IR
第一次IR
静态图
映射
第二次IR
动静转换
动态图包含静态图
动态转树,树的优化,树生成静态图代码
树的转换
分析与转写
动静转换
各个阶段的优化
混合精度,减少空间加快速度
面临问题
解决问题,放大,备份高精度数据
整体混合精度解决方案
稀疏化加速
结构化硬件加速和非结构化软件加速
硬件加速,压缩
效果
模型量化
量化训练
训练后量化
量化效果,数据分布
OP融合优化
多个融合一个
纵向融合和横向融合,横向可以后面拆分
常用
编码优化
对比
算子优化,中间层,专注逻辑不同通用
kernel优化体系
效果
硬件自动感知优化
效果
XLA
TVM
编译器对比
百度编译器
训练和推理都可以自动调优
效果
总结