标签平滑的默认值为何是0.1:从训练稳定性到收敛理论的数学解析

训练一个图像分类模型,测试集准确率达到95%。随机抽取一个样本,模型输出预测概率:[0.999, 0.001, 0.000, …]。看起来模型对这个预测非常自信——99.9%的置信度。但这个置信度真的可靠吗? ...

16 min · 7926 words