update ch03-2 (#301)

This commit is contained in:
Jiarong Han
2022-04-24 10:27:31 +08:00
committed by GitHub
parent 053a7cf578
commit bc124c9bbc

View File

@@ -7,7 +7,7 @@
:label:`simpledag`
### 张量和算子
在计算框架中基础组件包含张量和算子张量是基础数据结构算子是基本运算单元。在数学中定义张量是基于向量与矩阵的推广涵盖标量、向量与矩阵的概念。可以将标量理解为零阶张量向量为一阶张量我们熟悉的RGB彩色图像即为三阶张量。在计算框架中张量不仅存储数据还存储数据类型、数据形状、维度或秩以及梯度传递状态等多个属性表3.2.1所示,列举了主要的属性和功能。
在计算框架中基础组件包含张量和算子张量是基础数据结构算子是基本运算单元。在数学中定义张量是基于向量与矩阵的推广涵盖标量、向量与矩阵的概念。可以将标量理解为零阶张量向量为一阶张量我们熟悉的RGB彩色图像即为三阶张量。在计算框架中张量不仅存储数据还存储数据类型、数据形状、维度或秩以及梯度传递状态等多个属性:numref:`tensor_attr`所示,列举了主要的属性和功能。
:张量属性
@@ -145,7 +145,7 @@ $$
其中$\nabla_{\boldsymbol{X}}\boldsymbol{z}$表示$\boldsymbol{z}$关于$\boldsymbol{X}$的梯度矩阵。
上一小节中简单的循环控制模型前向传播可以表示为$\boldsymbol{Y}=\boldsymbol{W_2}(\boldsymbol{W_1}(\boldsymbol{W}(\boldsymbol{X})))$。在反向传播的过程中可以将前向计算等价为$\boldsymbol{Y}=\boldsymbol{W_2}\boldsymbol{X_2}$,首先得到参数$\boldsymbol{W_2}$的梯度表示。再接着根据$\boldsymbol{X_2}=\boldsymbol{W_1}\boldsymbol{X_1}$得到$\boldsymbol{W_1}$的梯度表示,按照层级即可推导得出$\boldsymbol{W}$的梯度表示
上一小节中简单的循环控制模型前向传播可以表示为$\boldsymbol{Y}=\boldsymbol{W_2}(\boldsymbol{W_1}(\boldsymbol{W}(\boldsymbol{X})))$。在反向传播的过程中可以将前向计算等价为$\boldsymbol{Y}=\boldsymbol{W_2}\boldsymbol{X_2}$,首先得到参数$\boldsymbol{W_2}$的梯度表示。再接着根据$\boldsymbol{X_2}=\boldsymbol{W_1}\boldsymbol{X_1}$得到$\boldsymbol{W_1}$的梯度表示,按照层级即可推导得出$\boldsymbol{W}$的梯度表示
$$
\begin{aligned}