主要内容

clusterDBSCAN.discoverClusters

在数据中查找集群层次结构

自从R2021a

描述

例子

(订单reachdist] = clusterDBSCAN.discoverClusters(Xmaxepsilonminnumpoints返回一个按簇排序的点列表,订单,可达距离,reachdist,为数据中的每个点X。指定最大值,maxepsilon,最小点数,minnumpoints。该方法实现对点排序以识别聚类结构(光学)算法。当簇的密度不同时,OPTICS算法是有用的。

clusterDBSCAN.discoverClusters (Xmaxepsilonminnumpoints显示表示集群层次结构的条形图。

例子

全部折叠

中创建随机检测的目标数据xy笛卡儿坐标。使用clusterDBSCAN.discoverClusters对象函数来显示底层集群层次结构。

首先,设置clusterDBSCAN.discoverClusters参数。

maxEpsilon = 10;minNumPoints = 6;

创建随机目标数据。

X = [randn(20,2) + [11.5,11.5];Randn (20,2) + [25,15];Randn (20,2) + [8,20];10*rand(10,2) + [20,20]];情节(X (: 1) X (:, 2),“。”)轴平等的网格

图中包含一个轴对象。坐标轴包含一个行对象,该对象仅使用标记显示其值。

绘制集群层次结构。

clusterDBSCAN.discoverClusters (X, maxEpsilon minNumPoints)

图可达距离包含一个轴对象。标题为Reachability distance, xlabel Order Index, ylabel Epsilon的axes对象包含一个类型为bar的对象。

从视觉上检查情节,选择ε为2,然后使用clusterDBSCAN对象和绘图的结果集群。

clusterer = clusterDBSCAN(“MinNumPoints”6‘ε’2,“EnableDisambiguation”、假);[idx,cidx] = clusterer(X);情节(clusterer运算,X, idx)

图集群包含一个轴对象。标题为Clusters的axis对象,xlabel Dimension 1, ylabel Dimension 2包含5个类型为line, scatter, text的对象。一行或多行仅使用标记显示其值

输入参数

全部折叠

输入特征数据,指定为实值N——- - - - - -P矩阵。的N行对应a中的特征点P-维特征空间。的P列包含发生聚类的特性的值。DBSCAN算法可以对任何类型的数据进行适当的聚类MinNumPointsε设置。例如,两列输入可以包含xy笛卡尔坐标,或者距离和多普勒。

数据类型:

群集层次结构搜索中使用的最大epsilon大小,指定为正标量。参数epsilon定义了点周围的聚类邻域。减少maxepsilon导致更短的运行时间。设置maxepsilon标识所有可能的集群。

OPTICS算法对参数设置相对不敏感,但选择较大的参数可以改善结果。

例子:5.0

数据类型:

用作阈值的最小点数,指定为正整数。该阈值用于设置集群的最小点数。

OPTICS算法对参数设置相对不敏感,但选择较大的参数可以改善结果。

例子:10

数据类型:

输出参数

全部折叠

样本索引的群集有序列表,返回为1 × -的整数值N行向量。N输入数据的行数是矩阵吗X

可达距离,返回为正的实值1 × -N行向量。N输入数据的行数是矩阵吗X

数据类型:

算法

的输出clusterDBSCAN.discoverClusters让您创建一个可达性图,从中可以可视化集群的层次结构。可达性图包含上的有序点x的可达距离y设在。使用输出检查在广泛的参数设置范围内的群集结构。您可以使用输出来帮助为DBSCAN算法估计适当的epsilon聚类阈值。属于集群的点到最近邻居的可达距离较小,集群在可达性图中表现为山谷。更深的山谷对应着更密集的星系团。从山谷底部的纵坐标确定。

OPTICS假设密集的星团完全包含在密度较小的星团中。OPTICS通过跟踪点密度邻域,以正确的顺序处理数据。这一过程是通过按最短可达距离对数据点进行排序来执行的,确保首先识别出密度较高的集群。

扩展功能

版本历史

R2021a中引入

Baidu
map