看懂如何评价模型质量效果：机器学习模型性能指标汇总

职业培训 培训职业 2025-01-08

随着AI的火热，越来越多的人开始接触算法项目。在应用机器学习算法时，根据不同问题需要采用不同的模型评估标准。本文将主要从分类与回归两大类进行阐述。一、分类问题1. 混淆矩阵：用于比较分类结果和实例的真实信息，矩阵中的每一行代表实例的预测类别，每一列代表实例的真

随着AI的火热，越来越多的人开始接触算法项目。在应用机器学习算法时，根据不同问题需要采用不同的模型评估标准。本文将主要从分类与回归两大类进行阐述。

一、分类问题

1. 混淆矩阵：用于比较分类结果和实例的真实信息，矩阵中的每一行代表实例的预测类别，每一列代表实例的真实类别。

2. 准确率（Accuracy）：最常用的分类性能指标，即正确预测的正反例数除以总数。

3. 精确率（Precision）：针对预测正确的正样本，表现为预测出是正的里面有多少真正是正的。

4. 召回率（Recall）：表现出在实际正样本中，分类器能预测出多少。

5. F1 score：精确率和召回率的调和值，更接近于两个数较小的那个。

6. ROC曲线：根据分类结果计算得到ROC空间中相应的点，连接这些点形成ROC curve，横坐标为False Positive Rate(FPR假正率)，纵坐标为True Positive Rate(TPR真正率)。

7. AUC：ROC曲线下的面积，通常大于0.5小于1。

8. PR曲线：横坐标是精确率P，纵坐标是召回率R。

二、回归问题

1. 平均绝对误差（MAE）：l1范数损失。

2. 平均平方误差（MSE）：l2范数损失。

3. 均方根误差（RMSE）：使用平均误差，对异常点较敏感。

4. 解释变异：根据误差的方差计算得到。

5. 决定系数：又被称为R2分数。

三、聚类

1. 兰德指数：衡量聚类结果与真实情况越吻合。

2. 互信息：衡量两个数据分布的吻合程度。

3. 轮廓系数：适用于实际类别信息未知的情况。

四、搜索与信息检索

搜索属于信息检索，信息检索评价是对信息检索系统性能进行评估。

五、总结

在具体应用中，需要根据具体问题选择合适的衡量指标。

标签

上五文章