数据可视化

什么是数据可视化?

你需要知道三件事

数据可视化是将数据转换为图形表示的过程,如图、图表、地图和3D可视化,帮助您轻松识别数据中的模式、趋势和异常值。

这些数据可视化可以让您看到仅仅通过查看原始数据很难或不可能观察到的关系,特别是使用来自传感器、数据记录器、医疗记录、web搜索模式和购买模式等来源的大数据集。数据可视化在将数据转换为可操作的信息方面起着关键作用。

数据可视化如何提供帮助?

数据可视化技术因领域而异。

计算金融

使用历史或实时市场数据,数据可视化有助于快速识别模式和趋势,检测异常,并获得有意义的见解。数据可视化有助于执行分析、开发预测模型、评估风险和形式化交易策略。

下面的图模拟了电力现货价格的未来行为从一个时间序列模型拟合的历史数据。

电力现货价格图,显示历史现货价格和趋势与模拟现货价格和趋势。数据在x轴,现货价格在y轴。

电力现货价格图,显示具有预测确定性趋势的历史数据。

信号处理

信号处理用于语音分析、心率监测、无线通信、遥感、气候监测和GPS等应用。常见的任务包括预处理和比较信号、设计数字滤波器、转换信号、执行测量以及检测模式和事件。数据可视化用于在时间、频率和时频域分析感兴趣的信号。

下图是来自太平洋蓝鲸的音频数据。可视化是在MATLAB中创建的®使用信号分析仪的应用这有助于在时域和频域中可视化信号。

从太平洋蓝鲸的音频中提取信号数据的信号分析仪应用程序截图和数据图表。

从太平洋蓝鲸的音频中提取的兴趣区域。

图像处理与计算机视觉“,

图像和视频处理有助于发现形状、计算物体数量、识别颜色、测量物体属性以及查找其他有意义的信息。图像处理技术是计算机视觉工作流程中常用的预处理步骤。该领域的应用包括智能手机的面部识别、自动驾驶汽车中的行人和车辆躲避、视频监控、医疗核磁共振中的肿瘤检测和其他图像检索系统。

例如,宝马在辅助驾驶视图(ADV)中使用计算机视觉功能来描述周围的车辆并识别它们的类型。

BMW Assisted Driver View. MATLAB was used for automated verification including image registration, objection detection, ground truth labeling, and testing the ADV scene against the test output.

" data-toggle="lightbox" class="add_margin_0 ">B M W辅助驾驶员视图演示对象检测的截图。

宝马辅助驾驶员视图。利用MATLAB进行自动验证,包括图像配准、目标检测、地面真值标注,并根据测试输出对ADV场景进行测试。

人工智能(AI)

数据可视化在开发人工智能模型(使用机器学习或深度学习)中发挥着重要作用,因为这些模型依赖于难以解释的大型数据集。在机器学习中,聚类分析有助于异常检测和监督学习中的数据预处理。主成分分析(PCA)而且t-分布式随机邻居嵌入(t-SNE)是两种最常用的数据可视化技术,因为它们有助于减少数据维度,以便您可以专注于关键的区分维度。

在深度学习中,您可以使用数据可视化(如网络精度和损失图)来监视训练进度,并使用可视化技术(如梯度加权类激活映射(梯度- cam)、遮挡敏感性、局部可解释模型未知解释(LIME)和深度梦)来研究训练过的网络。

tsne function.

" data-toggle="lightbox" class="add_margin_0 ">三种鸢尾的马氏,余弦,切比切夫和欧氏图。

利用Fisher虹膜数据集绘制不同种类虹膜的分布图。的可视化绘图tsne函数。

数据可视化如何工作?

软件包提供了将原始数据转换为丰富可视化的功能,例如图表、图表和图表。下面是一个说明自行车交通密度数据的例子。仅仅通过视觉检查原始数据,很难建立数据点之间的关系。

预览原始自行车交通密度数据。
时间戳 一天 总计 西行 往东的 时间
“2015-06-24 07:00:00” “星期三” 141 13 128 7
“2015-06-24 08:00:00” “星期三” 327 44 283 8
“2015-06-24 09:00:00” “星期三” 184 32 152 9
“2015-06-24 10:00:00 “星期三” 94 30. 64 10
“2015-06-24 11:00:00 “星期三” 67 24 43 11
“2015-06-24 12:00:00” “星期三” 66 32 34 12
“2015-06-24 13:00:00” “星期三” 67 32 35 13

条形图下图显示的是自行车交通密度在一周中的上升和下降。现在很明显,工作日骑自行车的人比周末多。这个可视化让我们可以推断这条路线上骑自行车的人主要是上下班通勤。

一周里每天骑自行车的人数中位数的柱状图。

自行车交通数据用柱状图绘制。

一个散点图可以从相同的数据中获得更多的见解。下面的图表显示了一天中特定时间向东行和向西行的自行车总数。根据这个图,我们可以得出结论,东行路线通往商业区,西行路线通往居民区。此外,我们可以建立交通高峰时段为上午8:00-10:00的东行路线和下午4:00-6:00的西行路线。

波士顿自行车交通的散点图。x轴是一天中的时间,y轴是自行车的总数。蓝点表示东行乘客,血橙点表示西行乘客。

按时间划分东行和西行的自行车交通情况。

一个群图是一种特殊的散点图,它可以显示自行车交通的密度模式在一天的不同时间,一周的每一天,和方向。

波士顿自行车交通的蜂群图,绘制工作日、时间和出行方向,以显示自行车租赁数量的密度。

按日和方向划分的自行车交通密度。

在自行车交通示例中,使用不同类型的图(如条形图、散点图和群图)可视化数据有助于我们从数据集中提取有用的信息,包括高峰交通天数、通勤方向和一天中最繁忙的时间。

MATLAB数据可视化

MATLAB是一个用于分析数据、开发算法和创建模型的编程和数值计算平台。它支持整个数据分析工作流程,包括获取数据直接到MATLAB;分析和可视化数据;并输出结果。您可以使用交互式应用程序无需编写任何代码即可可视化数据;这些应用程序将自动为您生成适当的MATLAB代码,因此您可以自动化和重用您的工作。

创建数据可视化

MATLAB提供了广泛的内置的图表类型如线状图、散点图、分布图和地理图,以可视化来自不同应用程序的数据集。您可以使用MATLAB语言以交互方式或编程方式创建可视化。

探索数据可视化

您可以交互式地探索您的可视化,包括:

  • 放大和缩小数据集的特定部分
  • 交互式平移和旋转可视化
  • 在可视化中直接显示趋势线或数据值
  • 阴影和高亮数据点
  • 域间切换(如时间、频率、S、Z域)

标注和定制数据可视化

您可以通过突出显示您希望传达的基本信息来交互式地注释您的可视化,例如:

  • 标注关键数据点
  • 添加数据提示
  • 增加轴标签
  • 按不同的颜色和图案分组
  • 添加数据标记、线条样式和颜色

MATLAB从您的交互式图表修改自动生成代码。您可以通过将该代码添加到脚本中来重用它。

I-Q信号的曲线图。X在X轴上,归一化振幅在y轴上。显示了同相信号和正交信号。

修改可视化时,“更新代码”选项。

复杂的数据集很难用简单的图表来可视化。MATLAB可以让你创建自定义图表以满足您的可视化需求并向其添加自定义交互。

例子包括:

  • Sparklines component—创建小线形图,显示多向量数据集(如表)中每个向量的总体趋势。观察和比较每一行/列的数据趋势。
  • 密度散点图——使用颜色(或透明)来识别点的密度。
火花线组件和密度散点图的截图,都绘制了未标记的数据。

(左)Sparklines组件和(右)密度散点图。

探索更多的自定义图表容器的示例在MATLAB中央文件交换。

导出数据可视化

您可以直接导出您的自定义和注释的可视化,以便在web上、演示和报告中使用。

显示一个数字被保存到某个位置的屏幕截图。

出口一个图。

数据可视化与数据分析的集成

数据可视化通常与数据分析和预处理相结合。MATLAB的应用程序,比如数据更清洁信号分析仪,把这些步骤结合起来。

交互式控件允许您指定操作而不需要编写任何代码,相应的数据可视化直接集成在应用程序中。这允许您立即看到给定任务的结果。一旦你的分析和预处理完成,应用程序可以自动生成相应的MATLAB代码,允许你自动化的步骤,即使是在不同的数据。

特定于应用程序的可视化

MATLAB工具箱提供了特定于应用程序的可视化,以及将可视化与数据预处理和分析相结合的交互式应用程序。

计量经济模型应用程序的截图。

用于可视化和分析单变量或多变量时间序列数据(在计量经济学工具箱™)的计量经济学建模应用程序。

振幅响应图的截图,频率以MHz为x轴,振幅为y轴。

多级数字下变频各级的频率响应(在DSP系统工具箱™中)。

一幅图的截图,显示了通缉信号和干扰信号的频谱,x轴为GHz, y轴为dBm。

蓝牙LE阻塞、互调和载波干扰性能测试(在蓝牙中®工具箱)。

相控阵系统的波束形成图的截图,以dB为单位测量多个维度的归一化功率。

相控阵系统的波束形成(在相控阵系统工具箱™中)。

MATLAB与其他数据可视化工具的连接

您可以使用MATLAB的计算和数据处理功能与其他商业智能工具创建可视化和仪表板,例如:

案例研究部分

有趣的数据可视化应用

MATLAB中的数据可视化功能使组织能够有效地满足他们的研究目标。

福特开发分析驱动周期测试结果的工具

福特汽车能源管理工程团队使用MATLAB开发了CycleTool来评估汽车的排放、燃油经济性和性能。该工具使他们能够通过可视化硬件测试结果来评估系统性能,对比他们的模型预测和模拟。

读故事

MATLAB的截图,演示了将硬件测试结果与模型预测和仿真可视化的能力。

在摘要应用程序中刷取数据以找出趋势。

用高速摄像机和风洞解码蝴蝶飞行

隆德大学的研究人员了解了是什么让蝴蝶有了独特的扇动模式,并使用MATLAB进行图像处理、数据分析、建模和可视化。通过研究蝴蝶的飞行行为,工程师可以建造更高效、更有活力的飞行无人机——甚至是游泳无人机。研究人员使用MATLAB数据可视化功能来分析和比较他们的翅膀设计的性能,灵感来自他们对蝴蝶飞行行为的分析。

读故事

四张图显示了不同翼型在归一化时间内的脉冲和能量。

柔性翼提高了拍翼的力和效率。

道富环球投资开发评分模型,为ESG投资带来透明度

道富环球投资顾问公司的开发团队生成了直方图、散点图、箱形图和其他可视化图,以完善他们的算法,作为R-Factor™开发的一部分,该系统帮助投资者做出明智的决策,并提高他们的环境、社会和治理(ESG)分数。

读故事

12张图表组成了一个直方图,显示了M S C I World按行业划分的R-Factor ESG评分。

直方图显示行业的r -因子ESG评分。

博世开发了汽车测试数据分析和可视化的单一平台

博世使用MATLAB开发了ENValyzer(工程测试数据可视化和分析仪),这是一个工具,用于可视化、处理、分析和生成来自测量设备、测试台和车辆的测试数据报告。博世工程师能够在单轴、二次轴、矩阵图和多轴视图中渲染数据。

读故事

ENValyzer图显示突出比(P R)与R P M谱结果。

ENValyzer图显示突出比(PR)与RPM光谱结果。

Baidu
map