《利用 XLA 将 GPU 性能推向极限》，2018-11-22，Toby Boyd、Yanan Cao、Sanjoy Das、Thomas Joerg、Justin Lebar

《利用 XLA 将 GPU 性能推向极限》，2018-11-22，Toby Boyd、Yanan Cao、Sanjoy Das、Thomas Joerg、Justin Lebar

原文链接：https://mp.weixin.qq.com/s/RO3FrPxhK2GEoDCGE9DXrw

在各种内部模型上观察到速度提升1.13～3.04倍。

通常情况下，当您运行 TensorFlow 图表时，所有运算都由 TensorFlow 图表执行器单独执行。每个运算都会安装由图表执行器分派的预编译 GPU 内核（随附于 TensorFlow 二进制文件中）。

XLA 提供了另一种运行 TensorFlow 模型的模式：这种模式会将您的 TensorFlow 图表编译成专为您的模型生成的 GPU 内核序列。由于这些是您程序独有的内核，因此它们可以利用模型的特定信息进行优化。
相关阅读:
C#操作SQLite 报错 (Attempt to write a readonly database)
JS判断字符输入个数（数字英文长度记为1，中文记为2，超过长度自动截取）
JueryUI插件的简单应用(一）：介绍及第一个示例
 在VS2008(Winform)中使用WebService
Oracle触发器使用
 C# 创建Windows服务。服务功能：定时操作数据库
 aspnet前后台条件下根目录的读取
 xshell实现端口转发
 （转）使用FreeType实现矢量字体的粗体、斜体、描边、阴影效果
 D3D坐标系统和几何DirectX Griaphic学习
原文地址：https://www.cnblogs.com/CheeseZH/p/13385862.html