mirror of https://github.com/openmlsys/openmlsys-zh.git synced 2026-02-10 05:35:08 +08:00

Files

Corleone 039787dc8d sync overleaf for acceleerator (#420 )

Co-authored-by: Corleone <liuchao195@huawei.com>
Co-authored-by: Jiarong Han <jiaronghan@outlook.com>

2023-02-17 10:16:44 +08:00

979 B

Raw Permalink Blame History

硬件加速器

上一章节详细讨论了后端的计算图优化、算子选择以及内存分配。当前主流深度学习模型大多基于神经网络实现，无论是训练还是推理，都会产生海量的计算任务，尤其是涉及矩阵乘法这种高计算任务的算子。然而，通用处理器芯片如CPU在执行这类算子时通常耗时较大，难以满足训练和推理任务的需求。因此工业界和学术界都将目光投向特定领域的加速器芯片设计，希望以此来解决算力资源不足的问题。

本章将会着重介绍加速器的基本组成原理，并且以矩阵乘法为例，介绍在加速器上的编程方式及优化方法。

本章的学习目标包括：

掌握加速器的基本组成
掌握矩阵乘法的常见优化手段
理解编程API的设计理念

:maxdepth: 2

accelerator_introduction
accelerator_architecture
accelerator_programming
accelerator_practise
summary

979 B Raw Permalink Blame History Unescape Escape

硬件加速器

979 B

Raw Permalink Blame History