多维标度
可视化数据最重要的目标之一是了解点之间的距离是近是远。通常,你可以用散点图来做这件事。然而,对于一些分析,您所拥有的数据可能根本不是点的形式,而是案例、观察或主题之间的成对相似或不相似的形式。没有情节。
即使您的数据是点的形式而不是成对距离,这些数据的散点图可能也没有用。对于某些类型的数据,测量两点有多近的相关方法可能不是它们的欧氏距离。虽然原始数据的散点图可以很容易地比较欧氏距离,但在比较其他类型的点间距离(例如城市街区距离)或更普遍的差异时,它们并不总是有用的。此外,由于有大量的变量,除非数据可以用少量的维度表示,否则很难可视化距离。通常需要某种形式的降维。
多维标度(MDS)是解决所有这些问题的一组方法。MDS允许您可视化点之间的距离有多近,对于许多种距离或不相似度指标,并可以在少量维度中生成数据的表示。MDS不需要原始数据,只需要一个成对距离或不相似度的矩阵。