聚类分析
无监督学习技术来发现自然分组和数据中的模式
聚类分析也称为细分分析或分类分析,分区样本数据组,或集群。集群形成对象在同一集群相似,和对象在不同的集群是不同的。统计和机器学习工具箱™提供几个相似(也称为集群技术和措施距离度量)来创建集群。此外,集群评价确定最优数量的集群的数据使用不同的评估标准。集群可视化选项包括系统树图和轮廓图。工具箱还提供了几个异常检测特性来识别异常值和小礼品。
聚类分析基础知识
类别
- 分层聚类
产生嵌套组集群 - k - means和k-Medoids集群
集群通过最小化的意思或medoid距离,计算距离 - Density-Based空间聚类的应用程序与噪音
通过使用DBSCAN算法找到集群和异常值 - 谱聚类
利用图论算法找到集群 - 高斯混合模型
集群使用采用基于高斯混合模型的算法 - 最近的邻居
找到最近的邻居使用穷举搜索或Kd-tree搜索 - 隐马尔可夫模型
马尔可夫模型数据生成 - 异常检测
检测异常值和小礼品 - 集群可视化和评价
情节集群的数据和评估最优数量的集群