集群的数据
使用集群数据k-means算法在实时编辑器
描述
的集群的数据实时编辑器任务使您能够交互式地执行k——集群。任务生成MATLAB®代码,并将生成的聚类索引和聚类质心位置返回到MATLAB工作空间。
您可以:
通过选择聚类数量手动确定数据的最佳聚类数量,或者通过指定诸如间隙值、轮廓值、davis - bouldin指标值和Calinski-Harabasz指标值等标准自动确定数据的最佳聚类数量。
自定义用于聚类数据的参数,包括距离度量和复制数量。
自动可视化集群数据。
有关实时编辑器任务的一般信息,请参见在活动脚本中添加交互式任务.
打开任务
要添加集群的数据任务到一个活动脚本:
在住编辑器选项卡上,选择任务>集群的数据.
在活动脚本中的代码块中,键入相关的关键字,例如
聚类
或kmeans
.选择集群的数据从建议的命令补全。
参数
输入数据
—数据集群
数字矩阵
通过从可用的工作区变量中选择一个变量,指定要集群的数据。变量必须是数值矩阵才能出现在列表中。
选择方法
-聚类选择方法
手册
(默认)|最优
指定用于确定数据的最佳群集数量的方法。
手册
—手动指定需要分组的集群数量。最优
-使用evalclusters
函数,根据间隙值、剪影值、davis - bouldin指数值和Calinski-Harabasz指数值等标准找到最佳聚类数量。
范围
-要评估的集群数量列表
2:5
(默认)|最小正整数和最大正整数
指定要计算的群集数量列表为由最小值和最大值组成的范围。例如,如果指定的最小值为2
最大值为6
,任务将评估2、3、4、5和6的簇数,以确定最优的簇数。
展示的情节
-用于显示结果的图表
复选框
要显示聚类数据,请从可用选项中选择:
选择二维散点图(PCA)在二维散点图中显示聚类数据的主要成分。的集群的数据任务使用
gscatter
函数来创建散点图。选择散点图矩阵在散点图矩阵中显示聚类数据。当你选择散点图矩阵时,复选框右侧会出现一个列表。列表中的每个项表示指定输入数据中的一列。按下Ctrl键,并从列表中选择最多四个输入数据列。的集群的数据任务使用
主成分分析
而且gplotmatrix
函数从选定的列创建散点图矩阵。矩阵中的散点图在聚类指数之间比较所选输入数据列。矩阵中的对角线图是直方图,显示每个聚类指数所选列的分布。
提示
默认情况下,集群的数据任务在修改任务参数时不会自动运行。要使任务在任何更改后自动运行,请选择自动运行按钮在任务的右上角。如果您的数据集很大,请不要启用此选项。
版本历史
R2021b中引入