FeatureSelectionNCARegression类
基于邻域分量分析(NCA)的回归特征选择
描述
FeatureSelectionNCARegression
包含邻域成分分析(NCA)模型的数据、拟合信息、特征权重和其他模型参数。fsrnca
的对角自适应学习特征权重,并返回一个实例FeatureSelectionNCARegression
对象。该函数通过正则化特征权重来实现特征选择。
建设
创建一个FeatureSelectionNCAClassification
对象使用fsrnca
.
属性
NumObservations
- - - - - -训练数据中的观察数
标量
训练数据中的观察次数(X
而且Y
后删除南
或正
值,存储为标量。
数据类型:双
ModelParameters
- - - - - -模型参数
结构
用于训练模型的模型参数,存储为结构。
的字段ModelParameters
使用点符号。
例如,对于一个名为FeatureSelectionNCARegression的对象mdl
,您可以访问LossFunction
使用价值mdl.ModelParameters.LossFunction
.
数据类型:结构体
λ
- - - - - -正则化参数
标量
正则化参数用于训练该模型,存储为一个标量。为n观察,最好的λ
使NCA模型的泛化误差最小的值预期为1/的倍数n.
数据类型:双
FitMethod
- - - - - -用于拟合此模型的拟合方法的名称
“准确”
|“没有”
|“平均”
用于拟合此模型的拟合方法的名称,存储为以下其中之一:
“准确”
-使用所有数据进行拟合。“没有”
——不合适。使用此选项,使用调用中提供的初始特征权重来评估NCA模型的泛化误差fsrnca
.“平均”
-该软件将数据划分为分区(子集),每个分区使用确切的
方法,并返回特征权重的平均值。方法可以指定分区的数量NumPartitions
名称-值对的论点。
解算器
- - - - - -用于拟合此模型的求解器的名称
“lbfgs”
|“sgd”
|“minibatch-lbfgs”
用于拟合此模型的求解器的名称,存储为以下其中之一:
“lbfgs”
—有限内存Broyden-Fletcher-Goldfarb-Shanno (LBFGS)算法“sgd”
-随机梯度下降(SGD)算法“minibatch-lbfgs”
-随机梯度下降与LBFGS算法应用于小批量
GradientTolerance
- - - - - -梯度范数的相对收敛公差
积极的标量
梯度范数上的相对收敛公差“lbfgs”
而且“minibatch-lbfgs”
求解器,存储为正标量值。
数据类型:双
IterationLimit
- - - - - -优化的最大迭代次数
正整数
用于优化的最大迭代次数,存储为正整数值。
数据类型:双
PassLimit
- - - - - -最大通行次数
正整数
最大通过数“sgd”
而且“minibatch-lbfgs”
解决者。每次传递都会处理数据中的所有观察结果。
数据类型:双
InitialLearningRate
- - - - - -最初的学习速率
积极的真正的标量
的初始学习率“sgd”
而且“minibatch-lbfgs”
解决者。从指定的值开始的迭代中,学习率逐渐衰减InitialLearningRate
.
使用NumTuningIterations
而且TuningSubsetSize
控制初始学习率的自动调优fsrnca
.
数据类型:双
详细的
- - - - - -冗长的水平指示器
非负整数
冗长级别指示器,存储为非负整数。可能的值是:
0 -没有收敛摘要
1 -收敛总结,包括梯度范数和目标函数值
>1 -更多的收敛信息,取决于拟合算法。当您使用
“minibatch-lbfgs”
求解器和冗余级别> 1,收敛信息包括中间小批量LBFGS拟合的迭代日志。
数据类型:双
InitialFeatureWeights
- - - - - -初始特征权重
p-乘1的实标量向量
初始特征权重,存储为p-乘1的实标量向量,其中p预测因子的数量在吗X
.
数据类型:双
FeatureWeights
- - - - - -特征权值
p-乘1的实标量值向量
特性权重,存储为p-乘1的实标量值向量,其中p预测因子的数量在吗X
.
为“FitMethod”
等于“平均”
,FeatureWeights
是一个p——- - - - - -米矩阵,米分区的数量是否通过“NumPartitions”
调用中的名值对参数fsrnca
.
的绝对值FeatureWeights (k)
是否可以衡量预测器的重要性k
.如果FeatureWeights (k)
趋近于0,那么这表示这个预测器k
不影响响应Y
.
数据类型:双
FitInfo
- - - - - -合适的信息
结构
拟合信息,存储为具有以下字段的结构。
字段名 | 意义 |
---|---|
迭代 |
迭代索引 |
客观的 |
最小化的正则化目标函数 |
UnregularizedObjective |
非正则化的最小化目标函数 |
梯度 |
最小化正则化目标函数的梯度 |
的分类,
UnregularizedObjective
表示NCA分类器对训练数据的漏一准确率的负值。对于回归,
UnregularizedObjective
表示使用NCA回归模型时,真实响应与预测响应之间的遗漏损失。为
“lbfgs”
解算器,梯度
是最终的梯度。为“sgd”
而且“minibatch-lbfgs”
解决,梯度
是最终的小批渐变。如果
FitMethod
是“平均”
,然后FitInfo
是一个米-by-1结构数组米分区的数量是否通过“NumPartitions”
名称-值对的论点。
的字段FitInfo
使用点符号。例如,对于命名为FeatureSelectionNCARegressionobject的mdl
,您可以访问客观的
现场使用mdl.FitInfo.Objective
.
数据类型:结构体
μ
- - - - - -预测方法
p1的向量|[]
预测器的意思是,存储为p-by-1向量表示标准化训练数据。在这种情况下,预测
方法中心预测矩阵X
通过减去各自的元素μ
从每一列。
如果在培训过程中数据没有标准化,那么μ
是空的。
数据类型:双
σ
- - - - - -预测标准差
p1的向量|[]
预测标准差,存储为p-by-1向量表示标准化训练数据。在这种情况下,预测
方法尺度预测矩阵X
的元素除以每一列σ
定心后的数据使用μ
.
如果在培训过程中数据没有标准化,那么σ
是空的。
数据类型:双
X
- - - - - -预测的值
n——- - - - - -p矩阵
用于训练该模型的预测器值,存储为n——- - - - - -p矩阵。n观察的次数和p是训练数据中预测变量的数量。
数据类型:双
Y
- - - - - -响应值
数字尺寸向量n
用于训练该模型的响应值,存储为大小的数字向量n,其中n为观测次数。
数据类型:双
W
- - - - - -观察权重
数字尺寸向量n
用于训练该模型的观察权重,存储为大小的数字向量n.观察权重之和为n.
数据类型:双
例子
探索FeatureSelectionNCARegression
对象
加载样例数据。
负载进口- 85
前15列包含连续预测变量,而第16列包含响应变量,即汽车价格。定义邻域组件分析模型的变量。
预测= X (: 1:15);Y = X (: 16);
拟合邻域成分分析(NCA)模型进行回归,以检测相关特征。
mdl = fsrnca(预测,Y);
返回的NCA模型,mdl
,是一个FeatureSelectionNCARegression
对象。该对象存储关于训练数据、模型和优化的信息。您可以使用点表示法访问对象属性,例如特征权重。
绘制特征权重。
图()图(mdl。FeatureWeights,“罗”)包含(“功能指数”) ylabel (“功能重量”网格)在
无关特征的权重为零。的“详细”,1
选项中的fsrnca
显示命令行优化信息。您还可以通过绘制目标函数与迭代次数的关系来可视化优化过程。
图()图(mdl.FitInfo.Iteration mdl.FitInfo.Objective,“ro - - - - - -”网格)在包含(的迭代次数) ylabel (“目标”)
的ModelParameters
属性是一个结构体
其中包含关于模型的更多信息。可以使用点表示法访问此属性的字段。例如,查看数据是否标准化。
mdl.ModelParameters.Standardize
ans =逻辑0
0
意味着数据在拟合NCA模型之前没有标准化。当预测器的规模非常不同时,可以使用“标准化”,1
调用中的名值对参数fsrnca
.
复制语义
价值。要了解值类如何影响复制操作,请参见复制对象.
版本历史
介绍了R2016b
MATLAB命令
你点击了一个对应于这个MATLAB命令的链接:
在MATLAB命令窗口中输入命令来运行该命令。Web浏览器不支持MATLAB命令。
您也可以从以下列表中选择网站:
如何获得最佳的网站性能
选择中国网站(中文或英文)以获得最佳的网站表现。其他MathWorks国家网站没有针对从您的位置访问进行优化。