深度学习·神经网络初步

16 阅读 0 评论 0 点赞

神经网络

$n^{[i]}:$ 第i层的神经元个数
$z^{[i]},w^{[i]},b^{[i]}$ ：第i层的参数
$a^{[i]}:$ 第i层的激活函数

$z^{[l+1]}=W^{[l+1]}A^{[l]}+b^{[l+1]}$
其中：

矩阵A的实际含义是：列是样本，行是特征
矩阵W的实际含义是：看作当前层神经元的权重向量(这是一个行向量)组成的列向量

提示：
$J (w, b)$ 等价于 $J(y,a^{[l+1]})$
利用链式法则求导，每次反向传播 $z^{[l+1]}$
推导过程如下
在这里插入图片描述

公式与线性回归一致，只不过对矩阵 $W$ 求范数，需要计算 $W$ 中所有权重的和np.sum

随机丢弃一些神经元(输出结果置0)

表现在代码上就是生成随机矩阵作为掩码与输出矩阵相乘
在这里插入图片描述

本站资源均来自互联网，仅供研究学习，禁止违法使用和商用，产生法律纠纷本站概不负责！如果侵犯了您的权益请与我们联系！

点赞(0) 打赏

暂无评论