吴恩达《机器学习》课程总结(8)_神经网络参数的反向传播算法-CFANZ编程社区

Q1代价函数

（1）假设神经网络的训练样本有m个，每一个包含一组输入x和一组输出信号y，L表示神经网络的层数，S_l表示每一层的神经元个数，S_L代表最后一层中处理单元的个数。

则代价函数为（同样不对θ₀正则化）：

吴恩达《机器学习》课程总结(8)_神经网络参数的反向传播算法_初始化

误差计算公式，注意第一列作为输入是没有误差的。

吴恩达《机器学习》课程总结(8)_神经网络参数的反向传播算法_神经网络_02

前向传播算法：

吴恩达《机器学习》课程总结(8)_神经网络参数的反向传播算法_代价函数_03

用δ表示误差，则δ（4）=a⁽⁴⁾-y

前一层的误差为：

吴恩达《机器学习》课程总结(8)_神经网络参数的反向传播算法_神经网络_04

吴恩达《机器学习》课程总结(8)_神经网络参数的反向传播算法_神经网络_05

再前一层的误差为：

吴恩达《机器学习》课程总结(8)_神经网络参数的反向传播算法_神经网络_06 。

输入层不存在误差。

每一层有了误差之后，即可分别进行求偏导，然后更新θ。

吴恩达《机器学习》课程总结(8)_神经网络参数的反向传播算法_初始化_07

误差值的计算则是从后向前计算，并且偏置误差可以不算，作为常数，对于求导没有影响。

吴恩达《机器学习》课程总结(8)_神经网络参数的反向传播算法_初始化_08

参数不再是向量而是矩阵

http://dy.163.com/v2/article/detail/DHCUPPTC0511FERQ.html

用某点领域的两个点的连线的斜率作为该点的估算值，然后用该值与神经网络计算出来的值作比较。

吴恩达《机器学习》课程总结(8)_神经网络参数的反向传播算法_神经网络_09

参数的初始化应该随机的，如果是相同的值的话，第二层的所有激活单元都会有相同的值，后面也类似。

吴恩达《机器学习》课程总结(8)_神经网络参数的反向传播算法_神经网络_10

使用神经网络时的步骤：

（1）网络结构：第一件要做的事是选择网络结构，即决定选择多少层以及决定每层分别有多少单元。

第一层的单元数即为我们训练集的特征数量。

最后一层的单元数是我们训练集的结果的类的数量。

（2）训练神经网络：

1.参数的随机初始化；(一般很小接近于0)

2.利用正向传播方法计算所有的h_θ（x）;

3.编写计算代价函数J的代码；

4.利用反向传播方法计算所有的偏导数；

5.利用数值检验方法得到的偏导数取检验这些偏导数，如果差别很小，则说明神经网络合理性；

6.使用优化算法（梯度下降）来最小化代价函数（反向传播算法可以计算出下降的方向，梯度下降算法则沿着该方向进行下降）。

作者：你的雷哥

本文版权归作者所有，欢迎转载，但未经作者同意必须在文章页面给出原文连接，否则保留追究法律责任的权利。