前言模型训练最常遇到的两大问题就是欠拟合与过拟合,不管机器学习还是深度学习项目必谈,面试问答、项目复盘、实战调参高频必考。本文一次性讲清成因、判断方式、全套解决方案,背诵即可直接应对所有相关面试题。一、基础概念区分欠拟合模型学习能力不足,连训练集数据规律都没学好 表现:训练集误差大、测试集误差也大,整体效果差过拟合模型学习能力过强,死记硬背训练集噪声与细节,泛化能力变差 表现:训练集效果极好,测试集 / 真实业务数据效果断崖下跌二、快速判断拟合状态训练 loss 低,测试 loss 高 →过拟合训练 loss 高,测试 loss 也高 →欠拟合训练 loss 与测试 loss 同步平稳下降且趋于接近 →拟合状态优秀三、欠拟合产生原因模型结构过于简单,表达能力不足特征数量太少,有效信息不足训练迭代次数不足,未充分训练学习率过低,参数更新缓慢收敛不全正则化力度过大,过度限制模型学习四、欠拟合全套解决办法(面试必背)更换更复杂模型,提升模型拟合能力增加更多有效特征,做特征组合与特征挖掘增大模型网络层数、增加神经元数量调高初始学习率,加快参数更新速度增加训练迭代轮数,充分训练收敛降低正则化系数,减弱约束力度减少 Dropout 丢弃比例,保留更多学习能力五、过拟合产生核心原因