当99%准确率成为谎言:机器学习评估指标的深层博弈

一个训练好的疾病诊断模型号称达到了95%的准确率,医疗团队欣喜若狂,准备将其投入临床使用。然而,当数据科学家深入检查后发现:这个模型只是简单地给所有患者都打上"健康"的标签——因为健康患者占总数的95%。 ...

25 min · 12290 words

过拟合、欠拟合与偏差-方差权衡:机器学习最核心困境的完整解析

训练一个机器学习模型时,最令人沮丧的场景莫过于:训练集上的准确率高达 99%,但在测试集上却跌落到 60%。这不是代码 bug,也不是数据问题——这是机器学习最核心的困境:过拟合(Overfitting)。 ...

15 min · 7498 words