机器学习相关笔记__数学知识扩展(内容杂且多，部分总结较浅)

发布时间：2024-12-22 08:01

数学知识扩展

期望和方差

期望

在概率论和统计学中，数学期望(mean)（或均值，亦简称期望）是试验中每次可能结果的概率乘以其结果的总和，是最基本的数学特征之一。它反映随机变量平均取值的大小。

方差

方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望（即均值）之间的偏离程度。统计中的方差（样本方差）是每个样本值与全体样本值的平均数之差的平方值的平均数。

方差是实际值与期望值之差平方的平均值，而标准差是方差算术平方根。在实际计算中，我们用以下公式计算方差。
$\"在这里插入图片描述\"$

方差是实际值与期望值之差平方的平均值，而标准差是方差算术平方根。在实际计算中，我们用以下公式计算方差。
$\"机器学习相关笔记__数学知识扩展(内容杂且多，部分总结较浅)_第1张图片\"$

协方差

协方差（Covariance）在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况，即当两个变量是相同的情况。
$\"机器学习相关笔记__数学知识扩展(内容杂且多，部分总结较浅)_第2张图片\"$

x和y事件不相关,则协方差为0

大于0趋势相同

<0趋势相反

协方差其意义：

度量各个维度偏离其均值的程度。协方差的值如果为正值，则说明两者是正相关的(从协方差可以引出“相关系数”的定义)，结果为负值就说明负相关的，如果为0，也是就是统计上说的“相互独立”。

当 cov(X, Y)>0时，表明 X与Y 正相关；

当 cov(X, Y)<0时，表明X与Y负相关；

当 cov(X, Y)=0时，表明X与Y不相关。

对角线上分别是x和y的方差，非对角线上是协方差。协方差大于0表示x和y若有一个增，另一个也增；小于0表示一个增，一个减；协方差为0时，两者独立。协方差绝对值越大，两者对彼此的影响越大，反之越小。

标准差:

方差开平方

协方差矩阵:

最大似然估计:

2.矩阵和线性代数

矩阵:mn 方阵:n n

正交阵:

A.T A=I

奇异阵：

首先，看这个矩阵是不是方阵（即行数和列数相等的矩阵。若行数和列数不相等，那就谈不上奇异矩阵和非奇异矩阵）。然后，再看此矩阵的行列式|A|是否等于0，若等于0，称矩阵A为奇异矩阵；若不等于0，称矩阵A为非奇异矩阵。同时，由|A|≠0可知矩阵A可逆，这样可以得出另外一个重要结论:可逆矩阵就是非奇异矩阵，非奇异矩阵也是可逆矩阵。　如果A为奇异矩阵，则AX=0有无穷解，AX=b有无穷解或者无解。如果A为非奇异矩阵，则AX=0有且只有唯一零解，AX=b有唯一解。

单位正交阵:

A.T A=I 且IAI=I

SVD分解(奇异值分解):

eg:应用,图像的虚化,将图片像素矩阵做svd处理,处理后奇异值矩阵取排在前面的若干个值,取的值越少图像越虚化.

代数余子式:

是一个数值,不是矩阵
$\"机器学习相关笔记__数学知识扩展(内容杂且多，部分总结较浅)_第8张图片\"$

伴随矩阵:

方阵的逆:

范德蒙行列式:

矩阵和向量的乘法:

向量秩和方程组:

特征值和特征向量：

正定阵：

对向量求导

QR分解(可以用来求特征值)

通过不断的迭代，最后可以求得特征值
$\"机器学习相关笔记__数学知识扩展(内容杂且多，部分总结较浅)_第19张图片\"$

3.回归

1)首先对数据进行分析，有些数据对结果没有强相关性，要筛选出去，方法可以用包含该数据时的整体数据的均方差值和不加该数据的均方差值来判断。

2).岭回归和lasso回归与线性回归的对比。

岭回归L2范数正则化与Lasso回归L1正则化的出现是为了解决线性回归出现的过拟合以及在通过正规方程方法求解θ的过程中出现的x转置乘以x不可逆这两类问题的，这两种回归均通过在损失函数中引入正则化项来达到目的
$\"机器学习相关笔记__数学知识扩展(内容杂且多，部分总结较浅)_第20张图片\"$
$\"机器学习相关笔记__数学知识扩展(内容杂且多，部分总结较浅)_第21张图片\"$
$\"机器学习相关笔记__数学知识扩展(内容杂且多，部分总结较浅)_第22张图片\"$
$\"机器学习相关笔记__数学知识扩展(内容杂且多，部分总结较浅)_第23张图片\"$
$\"机器学习相关笔记__数学知识扩展(内容杂且多，部分总结较浅)_第24张图片\"$
$\"机器学习相关笔记__数学知识扩展(内容杂且多，部分总结较浅)_第25张图片\"$