技术文章和通讯

为学生工程师提供数据科学技能

沃里克大学Thomas Popham著


数据科学正在成为工程师们迫切需要的技能。目前,大多数工程学位在最后一年提供数据科学主题作为选择,通常是在一个狭窄的研究领域。2018年,我们将数据科学作为华威大学所有本科工程专业(包括土木、机械、电子和系统)的核心主题。根据我们的工业经验,我们知道数据分析正在影响工程开发和运营的几乎每个领域。

数据科学和机器学习将很快成为所有工程师的必备技能,无论他们是在应用机器学习算法、为这些算法提供数据,还是根据结果做出决策。这就是为什么我们在华威工程学位中引入了数据科学作为一个主线,从第一年引入编程和简单的统计模型开始,第二年转移到核心数据分析模块,然后在第三年和第四年提供更多特定于流的模块。

第一学年:系统建模、仿真和计算

所有一年级的工程专业本科生都要上ES197:系统建模、仿真和计算.在本模块中,学生学习如何使用物理和(简单的)数据驱动方法对工程系统建模。本模块还介绍了编程。

熟悉编程和MATLAB®在美国,学生从网上完成课程MATLAB基础课程。从教育工作者的角度来看,这种方法非常有效,因为它允许学生按自己的节奏学习,通过完成各种编程练习并获得即时反馈。

在将他们学到的MATLAB技能应用到曲线拟合和从数据中推导出简单模型和关系的作业之后,学生们使用电气、热学和平移系统的例子来处理建模和仿真问题。与计算机科学专业的学生不同,他们认为编程是一种必要的技能,许多工程专业的学生可能一开始并没有意识到它的相关性。通过在建模和仿真的背景下介绍编程,我们的目标是向学生展示编程是一种技能,在他们的整个职业生涯中都是有用的。

在以后的作业中,学生将噪声或其他随机效应纳入模型。例如,我们让他们在MATLAB中创建了一个简单的模型,在这个模型中,粒子在受到随机力的作用时射向空气,然后又掉下来。模拟产生了一个有趣的3D可视化(图1)。整个项目让学生对他们以编程方式创建自己的模型的能力有信心。

图1。粒子响应随机力的MATLAB三维可视化。

图1。粒子响应随机力的MATLAB三维可视化。

第二年:工程数学和数据分析

二年级的模块工程数学与数据分析专注于解决回归、分类和聚类问题。当我在行业中工作时,我发现,一旦数据是干净的并且格式正确,解决数据科学问题就相对简单了,但现实世界的数据很少是这样。带着这一点,我教学生如何识别和删除异常值,处理缺失值,并在表中组织数据。

MATLAB Live脚本在课堂上特别有用,因为我可以包括格式化的文本和图像来提醒我我想要涵盖的内容,因为代码的输出和产生它的代码一起出现。同时,统计和机器学习工具箱™中的分类学习者和回归学习者应用程序使教授回归和分类的基本原理成为可能,而无需深入研究实现细节(图2)。

图2。分类学习者应用

图2。分类学习者应用。

一旦学生们了解了这些应用程序的功能以及如何使用它们,我就会向全班展示MATLAB中的底层算法是如何工作的。

在完成关于回归、分类和聚类的实验室作业后,学生们将进行一个小组项目,在这个项目中,我要求他们想象为一个工程咨询公司工作,其任务是评估制造的钢构件的质量。学生们必须使用两个数据集来预测哪些组件最有可能发生故障,一个是相当干净的数据集,另一个是混乱而复杂的数据集。

处理各种文件格式(包括Excel)中的噪声数据®, CSV和纯文本,学生删除异常值,执行连接,并准备用于训练模型的数据。大多数小组使用回归学习者应用程序或在MATLAB脚本中实现线性回归;有些人两种方法都尝试了。为了完成项目并展示他们在整个模块中开发的技能,每个小组创建了一个视频,展示他们的发现和他们使用的方法。

三年级及以上

对于有兴趣进一步探索数据科学和机器学习的学生,华威大学提供了智能系统设计的三年级模块,涵盖了计算机视觉和更高级的机器学习技术。在本模块中,我将向学生介绍在许多自主控制系统应用中使用的感觉-感知-行为框架。Simulink中的四轴飞行器模型®(图3)非常有助于展示这个基本框架,同时向学生介绍本模块后面将要涉及的主题,如卡尔曼滤波和光流。

图3。Simulink四轴飞行器模型的三维可视化

图3。Simulink四轴飞行器模型的三维可视化。

之后,学生们用MATLAB开发了一个结合了计算机视觉和机器学习的手势识别应用程序。在这个项目中,学生们开发了一个模型,能够解释网络摄像头拍摄的他们自己的手的图像,并将其分类为几种预定的手势之一。该项目特别吸引学生,因为他们正在处理自己的数据,需要考虑诸如光照和需要多少不同的图像来训练一个准确的分类器等因素。

在学习早期学习如何将数据科学技术应用于现实问题背景下的学生,不仅为之后几年的高级课程工作做好了充分准备,而且为实践工程师的职业生涯做好了充分准备。我们已经从我们的学生那里得到了非常积极的反馈——他们发现他们能够在本科实习期间应用这些技巧,并在面试中谈论这些技巧。

随着设备连接使公司能够基于数据而不是直觉或以往的经验来进行设计决策,具有数据分析背景的工程师非常受欢迎。虽然我们的毕业生中很少有人能进入工作岗位,向高级工程师演示新工具,但我们有信心,他们将能够在情况需要时应用机器学习和数据分析。

关于作者

Thomas Popham是华威大学的副教授。他拥有华威大学(University of Warwick)计算机视觉博士学位,曾在捷豹路虎(Jaguar Land Rover)担任机器学习技术专家。

2020年出版的

查看相关功能的文章

Baidu
map