发布时间:2022-09-05 01:00
在视频中出现了归一化的方法:(注意:该归一化方法是将原始数据转化为均值为0,方差为1的分布)
第一步:零均值化 (中间坐标显示)
第二部:单位方差 (最右坐标显示)
对于其中为什么 极其疑惑,搜索了很多网站,发现公式应为。
为什么能够将方差变为1?
1.11 神经网络的权重初始化
这里提出的初始化方法叫做Xavier 初始化方法:为什么V=1/n[L-1]?
参考链接:https://zhuanlan.zhihu.com/p/27919794,图中的回答是链接中一部分。
而为什么
也是为了把W的方差变为1/n[L-1]。