监督学习及相关算法特征工程本页总览特征工程 特征提取: 将任意数据转换为可用于机器学习的数学特征. 特征预处理: 预先处理, 包括归一化, 标准化, 异常样本清洗, 样本数据不平衡问题处理 特征降维: 降低的对象是多维数组. 降低的特征是个数. 得到一组不相关的主变量的过程 过拟合 机器学习训练的模型在训练集中表现很好, 但缺乏泛化性, 导致在测试集上很差 添加训练数据 减少特征个数 增加lambda值 正则化 欠拟合 机器学习训练的模型在训练集中表现很差 增加特征个数 降低lambda值