ROC 曲线 (ROC Curve)
🗺️ 这是什么?
如果你在做分类任务(判别模型,比如判断产品合格/不合格),ROC 曲线就是模型区分能力的“体检心电图”。
它展示了模型在不同严格程度(阈值)下,“抓对的概率”(True Positive Rate)和**“抓错的概率”**(False Positive Rate)之间的博弈。
🧐 怎么看?
- 看曲线的位置:
- 曲线越靠近左上角(即面积越大),说明模型越聪明,既能抓对,又不容易冤枉好人。
- 如果曲线贴着中间那条虚线(Random Chance),说明模型基本上在“瞎猜”(比如抛硬币)。
- 看 AUC 值:
- AUC (Area Under Curve) 就是曲线下面的面积。
- AUC 越接近 1 越好。比如图中类别 0 的 AUC=0.995,类别 2 的 AUC=1.000,说明模型对这些类别的区分能力极强,几乎完美。
- 多分类情况:
- 图中有不同颜色的线(0, 1, 2),分别代表模型对每一个类别的识别能力。你可以一眼看出模型对哪个类别的判断最拿手,对哪个类别比较吃力。
🛠️ 什么时候用?
- 当你想评估分类模型整体的硬实力,而不仅仅是看它在某个特定条件下的准确率时。
- 特别是在类别不均衡(比如 1000 个合格品里混了 5 个次品)时,看 ROC 曲线和 AUC 比单看准确率(Accuracy)靠谱得多!
