FeatureSelectionNCARegression类

基于邻域分量分析(NCA)的回归特征选择

描述

FeatureSelectionNCARegression包含邻域成分分析(NCA)模型的数据、拟合信息、特征权重和其他模型参数。fsrnca的对角自适应学习特征权重，并返回一个实例FeatureSelectionNCARegression对象。该函数通过正则化特征权重来实现特征选择。

建设

创建一个FeatureSelectionNCAClassification对象使用fsrnca．

属性

全部展开

`NumObservations`- - - - - -训练数据中的观察数
标量

训练数据中的观察次数(X而且Y后删除南或正值，存储为标量。

数据类型:双

`ModelParameters`- - - - - -模型参数
结构

用于训练模型的模型参数，存储为结构。

的字段ModelParameters使用点符号。

例如，对于一个名为FeatureSelectionNCARegression的对象mdl，您可以访问LossFunction使用价值mdl.ModelParameters.LossFunction．

数据类型:结构体

`λ`- - - - - -正则化参数
标量

正则化参数用于训练该模型，存储为一个标量。为n观察,最好的λ使NCA模型的泛化误差最小的值预期为1/的倍数n．

数据类型:双

`FitMethod`- - - - - -用于拟合此模型的拟合方法的名称
`“准确”`|`“没有”`|`“平均”`

用于拟合此模型的拟合方法的名称，存储为以下其中之一:

“准确”-使用所有数据进行拟合。
“没有”——不合适。使用此选项，使用调用中提供的初始特征权重来评估NCA模型的泛化误差fsrnca．
“平均”-该软件将数据划分为分区(子集)，每个分区使用确切的方法，并返回特征权重的平均值。方法可以指定分区的数量NumPartitions名称-值对的论点。

`解算器`- - - - - -用于拟合此模型的求解器的名称
`“lbfgs”`|`“sgd”`|`“minibatch-lbfgs”`

用于拟合此模型的求解器的名称，存储为以下其中之一:

“lbfgs”—有限内存Broyden-Fletcher-Goldfarb-Shanno (LBFGS)算法
“sgd”-随机梯度下降(SGD)算法
“minibatch-lbfgs”-随机梯度下降与LBFGS算法应用于小批量

`GradientTolerance`- - - - - -梯度范数的相对收敛公差
积极的标量

梯度范数上的相对收敛公差“lbfgs”而且“minibatch-lbfgs”求解器，存储为正标量值。

数据类型:双

`IterationLimit`- - - - - -优化的最大迭代次数
正整数

用于优化的最大迭代次数，存储为正整数值。

数据类型:双

`PassLimit`- - - - - -最大通行次数
正整数

最大通过数“sgd”而且“minibatch-lbfgs”解决者。每次传递都会处理数据中的所有观察结果。

数据类型:双

`InitialLearningRate`- - - - - -最初的学习速率
积极的真正的标量

的初始学习率“sgd”而且“minibatch-lbfgs”解决者。从指定的值开始的迭代中，学习率逐渐衰减InitialLearningRate．

使用NumTuningIterations而且TuningSubsetSize控制初始学习率的自动调优fsrnca．

数据类型:双

`详细的`- - - - - -冗长的水平指示器
非负整数

冗长级别指示器，存储为非负整数。可能的值是:

0 -没有收敛摘要
1 -收敛总结，包括梯度范数和目标函数值
>1 -更多的收敛信息，取决于拟合算法。当您使用“minibatch-lbfgs”求解器和冗余级别> 1，收敛信息包括中间小批量LBFGS拟合的迭代日志。

数据类型:双

`InitialFeatureWeights`- - - - - -初始特征权重
p-乘1的实标量向量

初始特征权重，存储为p-乘1的实标量向量，其中p预测因子的数量在吗X．

数据类型:双

`FeatureWeights`- - - - - -特征权值
p-乘1的实标量值向量

特性权重，存储为p-乘1的实标量值向量，其中p预测因子的数量在吗X．

为“FitMethod”等于“平均”,FeatureWeights是一个p——- - - - - -米矩阵,米分区的数量是否通过“NumPartitions”调用中的名值对参数fsrnca．

的绝对值FeatureWeights (k)是否可以衡量预测器的重要性k．如果FeatureWeights (k)趋近于0，那么这表示这个预测器k不影响响应Y．

数据类型:双

`FitInfo`- - - - - -合适的信息
结构

拟合信息，存储为具有以下字段的结构。

字段名	意义
`迭代`	迭代索引
`客观的`	最小化的正则化目标函数
`UnregularizedObjective`	非正则化的最小化目标函数
`梯度`	最小化正则化目标函数的梯度

的分类,UnregularizedObjective表示NCA分类器对训练数据的漏一准确率的负值。
对于回归,UnregularizedObjective表示使用NCA回归模型时，真实响应与预测响应之间的遗漏损失。
为“lbfgs”解算器,梯度是最终的梯度。为“sgd”而且“minibatch-lbfgs”解决,梯度是最终的小批渐变。
如果FitMethod是“平均”,然后FitInfo是一个米-by-1结构数组米分区的数量是否通过“NumPartitions”名称-值对的论点。

的字段FitInfo使用点符号。例如，对于命名为FeatureSelectionNCARegressionobject的mdl，您可以访问客观的现场使用mdl.FitInfo.Objective．

数据类型:结构体

`μ`- - - - - -预测方法
p1的向量|`［］`

预测器的意思是，存储为p-by-1向量表示标准化训练数据。在这种情况下，预测方法中心预测矩阵X通过减去各自的元素μ从每一列。

如果在培训过程中数据没有标准化，那么μ是空的。

数据类型:双

`σ`- - - - - -预测标准差
p1的向量|`［］`

预测标准差，存储为p-by-1向量表示标准化训练数据。在这种情况下，预测方法尺度预测矩阵X的元素除以每一列σ定心后的数据使用μ．

如果在培训过程中数据没有标准化，那么σ是空的。

数据类型:双

`X`- - - - - -预测的值
n——- - - - - -p矩阵

用于训练该模型的预测器值，存储为n——- - - - - -p矩阵。n观察的次数和p是训练数据中预测变量的数量。

数据类型:双

`Y`- - - - - -响应值
数字尺寸向量n

用于训练该模型的响应值，存储为大小的数字向量n，其中n为观测次数。

数据类型:双

`W`- - - - - -观察权重
数字尺寸向量n

用于训练该模型的观察权重，存储为大小的数字向量n．观察权重之和为n．

数据类型:双

方法

损失	评估在测试数据上学习到的特征权重的准确性
预测	利用邻域成分分析(NCA)回归模型预测响应
改装	改进邻域分量分析(NCA)模型进行回归分析

例子

全部折叠

探索`FeatureSelectionNCARegression`对象

打开生活的脚本

加载样例数据。

负载进口- 85

前15列包含连续预测变量，而第16列包含响应变量，即汽车价格。定义邻域组件分析模型的变量。

预测= X (: 1:15);Y = X (: 16);

拟合邻域成分分析(NCA)模型进行回归，以检测相关特征。

mdl = fsrnca(预测,Y);

返回的NCA模型，mdl,是一个FeatureSelectionNCARegression对象。该对象存储关于训练数据、模型和优化的信息。您可以使用点表示法访问对象属性，例如特征权重。

绘制特征权重。

图()图(mdl。FeatureWeights,“罗”)包含(“功能指数”) ylabel (“功能重量”网格)在

图中包含一个axes对象。axis对象包含一个类型为line的对象。

无关特征的权重为零。的“详细”,1选项中的fsrnca显示命令行优化信息。您还可以通过绘制目标函数与迭代次数的关系来可视化优化过程。

图()图(mdl.FitInfo.Iteration mdl.FitInfo.Objective,“ro - - - - - -”网格)在包含(的迭代次数) ylabel (“目标”）

图中包含一个axes对象。axis对象包含一个类型为line的对象。

的ModelParameters属性是一个结构体其中包含关于模型的更多信息。可以使用点表示法访问此属性的字段。例如，查看数据是否标准化。

mdl.ModelParameters.Standardize

ans =逻辑0

0意味着数据在拟合NCA模型之前没有标准化。当预测器的规模非常不同时，可以使用“标准化”,1调用中的名值对参数fsrnca．

复制语义

价值。要了解值类如何影响复制操作，请参见复制对象．

版本历史

介绍了R2016b

另请参阅

预测|fsrnca|改装|损失

FeatureSelectionNCARegression类

描述

建设

属性

NumObservations- - - - - -训练数据中的观察数标量

ModelParameters- - - - - -模型参数结构

λ- - - - - -正则化参数标量

FitMethod- - - - - -用于拟合此模型的拟合方法的名称“准确”|“没有”|“平均”

解算器- - - - - -用于拟合此模型的求解器的名称“lbfgs”|“sgd”|“minibatch-lbfgs”

GradientTolerance- - - - - -梯度范数的相对收敛公差积极的标量

IterationLimit- - - - - -优化的最大迭代次数正整数

PassLimit- - - - - -最大通行次数正整数

InitialLearningRate- - - - - -最初的学习速率积极的真正的标量

详细的- - - - - -冗长的水平指示器非负整数

InitialFeatureWeights- - - - - -初始特征权重p-乘1的实标量向量

FeatureWeights- - - - - -特征权值p-乘1的实标量值向量

FitInfo- - - - - -合适的信息结构

μ- - - - - -预测方法p1的向量|［］

σ- - - - - -预测标准差p1的向量|［］

X- - - - - -预测的值n——- - - - - -p矩阵

Y- - - - - -响应值数字尺寸向量n

W- - - - - -观察权重数字尺寸向量n

方法

例子

探索FeatureSelectionNCARegression对象

复制语义

版本历史

另请参阅

主题

`NumObservations`- - - - - -训练数据中的观察数
标量

`ModelParameters`- - - - - -模型参数
结构

`λ`- - - - - -正则化参数
标量

`FitMethod`- - - - - -用于拟合此模型的拟合方法的名称
`“准确”`|`“没有”`|`“平均”`

`解算器`- - - - - -用于拟合此模型的求解器的名称
`“lbfgs”`|`“sgd”`|`“minibatch-lbfgs”`

`GradientTolerance`- - - - - -梯度范数的相对收敛公差
积极的标量

`IterationLimit`- - - - - -优化的最大迭代次数
正整数

`PassLimit`- - - - - -最大通行次数
正整数

`InitialLearningRate`- - - - - -最初的学习速率
积极的真正的标量

`详细的`- - - - - -冗长的水平指示器
非负整数

`InitialFeatureWeights`- - - - - -初始特征权重
p-乘1的实标量向量

`FeatureWeights`- - - - - -特征权值
p-乘1的实标量值向量

`FitInfo`- - - - - -合适的信息
结构

`μ`- - - - - -预测方法
p1的向量|`［］`

`σ`- - - - - -预测标准差
p1的向量|`［］`

`X`- - - - - -预测的值
n——- - - - - -p矩阵

`Y`- - - - - -响应值
数字尺寸向量n

`W`- - - - - -观察权重
数字尺寸向量n

探索`FeatureSelectionNCARegression`对象