representation learning ,表征学习:在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。
feature scaling ,特征缩放,特征值相近的情况下,梯度下降会收敛的更快。通常会将特征值约束到[-1,1]之间,-1和1并不强制要求,某些特征值在它们附近波动的话,也是可以的。比如[-2,0.5], [0,3]...
mean normalization,均值归一化,减少迭代次数.
梯度下降算法work的依据,每次迭代过后,代价函数的值减小。否则的话,就需要降低学习率α,使代价函数收敛,但同时不能使α太小,太小的学习率会使代价函数收敛的很慢。