发布时间:2022-11-11 13:00
机器学习就是通过大量的数据进行训练,然后得出输入数据的模型特征;再次输入相关的数据时,能得到一个预测的结果。这在现实生活中解决了大量的问题,如:股票预测、物体分类、房价预测等等,这些都依赖机器学习带给我们的便利。
机器学习中又分为两大类:监督学习和非监督学习。
而监督学习中又分为回归问题和分类问题。
本文章中主要讲回归问题。
假设:
预测值:
真实值:
平均绝对误差 MAE,也叫平均绝对离差;在计算的时候,先对真实值与预测值求和,然后再取平均值。
公式:
范围 [0, +∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。
平均绝对百分误差是对 MAE 改进后,通过计算真实值与预测的误差百分比避免了数据范围大小的影响。
公式:
范围[0,+∞),MAPE 为0%表示完美模型,MAPE 大于 100 %则表示劣质模型。
可以看到,MAPE跟MAE很像,就是多了个分母。
注意点:当真实值有数据等于0时,存在分母0除问题,该公式不可用!
均方误差就是对平均绝对误差求平方根,这个指标在计算时,先对真实值与预测值的距离平方后求和,再取平均值。
公式:
范围[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。
一方面,该指标避免了MAE的绝对值导致函数不能求导的问题,因此均方误差常用于线性回归的损失函数;另一方面,均方误差可以通过平方来放大预测偏差较大的值,提高了检测的灵敏度。
均方根误差(Root Mean Square Error),其实就是MSE加了个根号,这样数量级上比较直观,比如RMSE=10,可以认为回归效果相比真实值平均相差10。
公式:
范围[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。
公式:
注意点:当真实值有数据等于0,而预测值也等于0时,存在分母0除问题,该公式不可用!
该指标需要了解另外三个指标:
计算预测数据与真实数据均值之差的平方和,反映的是模型数据相对真实数据均值的离散程度。
Total Sum of Squares,SST
计算真实数据和其均值之差的平方和,反映的是真实数据相对均值的离散程度。
Sum of Squares for Error,SSE
真实数据和预测数据之差的平方和
细心的小伙伴可能注意到,SST = SSR + SSE
决定系数 R^2,通过计算SSR 与 SST的比值,反应因变量 y 的全部变异能通过回归模型被自变量 x 解释的比例。比如,R^2 为0.9,则表示回归关系可以解释因变量 90% 的变异。
最适合新手的python刷题网站_有的人能轻松学会Python编程,不是基础好,而是有了这些刷题网站!...
面试官:Elasticsearch如何设计索引?满分答案来了
OSError: libcudart.so.8.0: cannot open shared object file: No such file or directory 解决方法
crypto-js-wasm: 当crypto-js遇上WebAssembly
2021年第二届“大湾区杯”粤港澳金融建模竞赛B题解题思路和部分代码
基于Xlinx的时序分析与约束(1)----什么是时序分析?什么是时序约束?什么又是时序收敛?
【图像增强】基于Frangi滤波器实现血管图像增强附matlab代码
Python爬虫实战,requests模块,Python实现IMDB电影top数据可视化
SpringBoot+Redis+RabbitMQ实现简单的商品秒杀