机器学习模型的可解释性

发布时间：2024-05-15 16:01

综述

机器学习业务应用以输出决策判断为目标。可解释性是指人类能够理解决策原因的程度。机器学习模型的可解释性越高，人们就越容易理解为什么要做出某些决定或预测。模型可解释性指对模型内部机制的理解以及对模型结果的解释。其重要性体现在：建模阶段，辅助开发人员理解模型，进行模型的对比选择，必要时优化调整模型；在投入运行阶段，向业务方解释模型的内部机制，对模型结果进行解释。比如基金推荐模型，需要解释：为什么向这个用户推荐某支基金。

机器学习流程步骤：收集数据、清洗数据、训练模型、基于验证或测试错误或其他评价指标选择最好的模型。第一步，选择比较小的错误率和比较高的准确率的高精度的模型。第二步，面临准确率和模型复杂度之间的权衡，但一个模型越复杂就越难以解释。一个简单的线性回归非常好解释，因为它只考虑了自变量与因变量之间的线性相关关系，但是也正因为如此，它无法处理更复杂的关系，模型在测试集上的预测精度也更有可能比较低。而深度神经网络处于另一个极端，因为它们能够在多个层次进行抽象推断，所以他们可以处理因变量与自变量之间非常复杂的关系，并且达到非常高的精度。但是这种复杂性也使模型成为黑箱，我们无法获知所有产生模型预测结果的这些特征之间的关系，所以我们只能用准确率、错误率这样的评价标准来代替，来评估模型的可信性。

可解释性的特质：

分类：建模前数据的可解释性、建模阶段模型可解释性、运行阶段结果可解释性
重要性：了解"为什么"可以帮助更深入地了解问题，数据以及模型可能失败的原因
范围：全局解释性、局部解释性、模型透明性、模型公平性、模型可靠性
评估：内在还是事后？模型特定或模型不可知？本地还是全局？
特性：准确定、保真性、可用性、可靠性、鲁棒性、通用性
人性化解释：人类能够理解决策原因的程度，人们可以持续预测模型结果的程度标示。

机器学习模型的可解释性

综述

相关推荐