特征选择- MATLAB和Simulink - 卡塔尔世界杯8强比赛直播

减少特征以提高模型性能

特征选择是一种降维技术，它选择在建模一组数据时提供最佳预测能力的特征子集(预测变量)。

特征选择可用于:

有几种常见的特征选择方法。

迭代更改设置的特性以优化性能或损失

逐步回归按顺序添加或删除特征，直到预测没有改善。它与线性回归或广义线性回归算法一起使用。同样,sequ纵向特征选择建立一个特征集，直到精确度(或自定义性能测量)停止提高。

基于内在特征对特征进行排序

这些方法估计特征的排名，这反过来可以用来选择排名靠前的几个特征。最小冗余最大相关性(MRMR)寻找特征和响应变量之间的互信息最大化和特征本身之间的互信息最小化的特征。相关方法根据拉普拉斯分数对特征进行排序，或使用统计检验单个特征是否独立于响应来确定特征的重要性。

邻域成分分析(NCA)与ReliefF

这些方法通过最大化基于成对距离的预测精度和惩罚导致错误分类结果的预测器来确定特征权重。

在模型的同时了解特征的重要性

一些有监督的机器学习算法在训练过程中估计特征的重要性。训练完成后，这些估计值可以用来对特征进行排名。具有内置特征选择的模型包括线性支持向量机、增强决策树及其集合(随机森林)和广义线性模型。同样，在套索正则化收缩估计器在训练期间将冗余特征的权重(系数)减少到零。

MATLAB^®支持以下特性选择方法:

作为特征选择的一种替代方法，特征转换技术将现有特征转换为新特征(预测变量)，删除描述性较差的特征。特征转换方法包括:

有关使用MATLAB进行特征选择的更多信息，包括机器学习、回归和转换，请参见统计和机器学习工具箱™．

特征选择可以从小波散射自动生成的数百个特征中选择出一个合理的子集。下图为应用MATLAB函数得到的前50个特征的排名fscmrmr从人体活动传感器数据中自动生成小波特征。

读电子书