降维与特征提取
主成分分析,因子分析,特征选择,特征提取等等
功能转换技术通过将数据转换为新特征来降低数据的维数。特征选择当变量的转换不可能时,例如,当数据中有分类变量时,技术是可取的。有关特别适用于最小二乘拟合的特征选择技术,请参见逐步回归.
住编辑任务
降低维数 | 在实时编辑器中使用主成分分析(PCA)降低维度 |
功能
对象
主题
特征选择
- 特征选择介绍
了解特征选择算法,并探索用于特征选择的函数。 - 连续的特征选择
本主题介绍顺序特征选择,并提供一个使用自定义标准和顺序选择特征的示例sequentialfs
函数。 - 邻域成分分析(NCA)特征选择
邻域分量分析(NCA)是一种非参数特征选择方法,其目标是使回归和分类算法的预测精度最大化。
- 正则化判别分析分类器
通过在不影响模型预测能力的情况下删除预测因子,使模型更健壮、更简单。 - 选择随机森林的预测器
利用交互测试算法选择随机森林的分裂预测器。
t-SNE多维可视化
- t-SNE
t-SNE是一种将高维数据进行非线性化简到二维或三维,同时保留原始数据的某些特征的可视化方法。 - 使用t-SNE可视化高维数据
这个例子展示了t-SNE如何创建高维数据的低维嵌入。 - tsne设置
这个例子展示了各种工具的效果tsne
设置。 - t-SNE输出函数
t-SNE输出功能说明及示例。
主成分分析与典型相关
- 主成分分析(PCA)
主成分分析通过用一组新的变量(原始变量的线性组合)替换几个相关变量来降低数据的维数。 - 用PCA分析美国城市的生活质量
执行加权主成分分析并解释结果。
因子分析
- 因子分析
因子分析是一种将模型与多变量数据拟合的方法,以估计被测变量对较少数量的未观察(潜在)因素的相互依赖性。 - 用因子分析分析股票价格
使用因素分析来调查同一行业的公司股价是否经历了类似的周与周的变化。 - 对考试成绩进行因素分析
这个例子展示了如何使用统计和机器学习工具箱™执行因素分析。
多维标度
- 多维标度
多维缩放允许您可视化点之间的距离有多近,对于许多种距离或不相似度指标,并可以在少量维度中生成数据的表示。 - 经典多维标度
使用cmdscale
执行经典(度量)多维标度,也称为主坐标分析。 - 经典多维尺度在非空间距离中的应用
方法执行经典的多维缩放cmdscale
统计和机器学习工具箱™中的功能。 - 模多维标度
这个例子展示了如何使用非经典形式的多维尺度(MDS)可视化不同的数据。 - 非经典和非度量多维尺度
执行非经典多维缩放mdscale
.
普罗克汝斯忒斯分析
- 使用Procrustes分析比较手写形状
使用Procrustes分析比较两个手写数字。