预测分析
你需要知道的3件事
预测分析使用历史数据来预测未来的事件。通常,历史数据被用来建立一个数学模型来捕捉重要的趋势。然后,该预测模型被用于当前数据,以预测接下来会发生什么,或为获得最佳结果而建议采取的行动。
近年来,由于支持技术的进步,特别是在大数据和机器学习领域的进步,预测分析受到了很多关注。
大数据的崛起
预测分析经常在……的背景下讨论大数据例如,工程数据来自世界上的传感器、仪器和连接系统。公司的业务系统数据可能包括交易数据、销售结果、客户投诉和营销信息。越来越多的企业基于这一宝贵的信息宝库做出数据驱动的决策。
日益激烈的竞争
随着竞争的加剧,企业在向拥挤的市场提供产品和服务时寻求优势。2022世界杯八强谁会赢?数据驱动的预测模型可以帮助公司以新的方式解决长期存在的问题。
例如,设备制造商可能会发现,仅在硬件方面很难创新。产品开发人员可以向现有的解决方案添加预测功能,以增加对客户的价值。使用预测分析进行设备维护,或者预见性维护可以预测设备故障,预测能源需求,降低运营成本。例如,测量汽车零部件振动的传感器可以在汽车上路前发出需要维修的信号。
公司还使用预测分析来做出更准确的预测,比如预测电网的电力需求。这些预测使资源规划(例如,各种发电厂的调度)能够更有效地完成。
大数据和机器学习的前沿技术
从…中提取价值大数据,企业将算法应用于大型数据集使用工具,如Hadoop和火花.数据源可能包括事务数据库、设备日志文件、图像、视频、音频、传感器或其他类型的数据。创新往往来自于将多个来源的数据结合起来。
有了所有这些数据,提取见解和趋势的工具是必要的。机器学习技术用于在数据中寻找模式并建立预测未来结果的模型。有各种各样的机器学习算法,包括线性和非线性回归、神经网络、支持向量机、决策树和其他算法。
预测分析的例子
预测分析可以帮助金融、医疗保健、制药、汽车、航空航天和制造业等不同行业的团队。
- 汽车-在自动驾驶汽车方面开拓新领域
开发驾驶辅助技术和新型自动驾驶汽车的公司使用预测分析技术来分析联网车辆的传感器数据,并构建驾驶辅助算法。 - 航空航天-监控飞机发动机运行状况
为了提高飞机的正常运行时间,降低维护成本,一家发动机制造商创建了一个实时分析应用程序,以预测油、燃料、起飞、机械健康和控制子系统的性能。 - 能源生产-预测电力价格及需求
复杂的预测应用程序使用模型来监测植物的可用性、历史趋势、季节性和天气。 - 金融服务——建立信用风险模型
金融机构使用机器学习技术和量化工具来预测信用风险。 - 工业自动化与机械-预测机器故障
一家塑料和薄膜生产商使用健康监测和预测性维护应用程序,减少停机时间并最大限度地减少浪费,每月节省50,000欧元。 - 医疗设备-使用模式检测算法来发现哮喘和慢性阻塞性肺病
哮喘管理设备记录和分析患者的呼吸声,并通过智能手机应用程序提供即时反馈,帮助患者管理哮喘和慢性阻塞性肺病。
预测分析是利用数据分析在数据基础上做出预测的过程。这个过程使用数据以及分析、统计和机器学习为预测未来事件创建预测模型的技术。
术语“预测分析”描述了统计或机器学习技术的应用,以创建对未来的定量预测。通常情况下,监督机器学习技术用于预测未来值(这台机器能运行多久才需要维修?)或估计概率(这个客户拖欠贷款的可能性有多大?).
预测分析始于一个商业目标:利用数据减少浪费、节省时间或削减成本。该过程将异构的、通常是大规模的数据集利用到模型中,可以生成清晰的、可操作的结果,以支持实现该目标,例如减少材料浪费、减少库存和满足规格的生产产品。
预测分析工作流程
我们都熟悉天气预报的预测模型。预测模型的一个重要工业应用与能源有关负荷预测预测能源需求。在这种情况下,能源生产者、电网运营商和贸易商需要准确的能源负荷预测,以便对电网负荷进行管理决策。海量的数据是可用的,通过使用预测分析,电网运营商可以将这些信息转化为可操作的见解。
预测能源负荷的分步工作流程
通常,预测分析应用程序的工作流程遵循以下基本步骤:
- 从不同的来源导入数据,例如web档案、数据库和电子表格。
数据来源包括CSV文件中的能源负载数据和显示温度和露点的国家天气数据。 - 通过删除异常值和组合数据源来清理数据。
识别要从数据中删除的数据峰值、缺失数据或异常点。然后将不同的数据源聚合在一起—在本例中,创建一个包含能源负载、温度和露点的单一表。 - 使用统计、曲线拟合工具或机器学习,基于聚合数据开发精确的预测模型。
能源预测是一个包含许多变量的复杂过程,因此您可以选择使用神经网络来构建和训练预测模型。迭代您的训练数据集,以尝试不同的方法。训练完成后,可以根据新数据对模型进行测试,看看它的性能如何。 - 将该模型集成到生产环境中的负载预测系统中。
一旦您找到了一个能够准确预测负载的模型,您就可以将其移到您的生产系统中,使软件程序或设备(包括web应用程序、服务器或移动设备)可以使用分析结果。
贝克休斯利用数据分析和机器学习为油气开采设备开发预测性维护软件
贝克休斯的卡车配备了容积泵,可将水和砂的混合物注入钻井深处。在该卡车150万美元的总成本中,泵的成本约为10万美元,贝克休斯需要确定泵何时会出现故障。他们处理和分析了多达1tb的数据,这些数据以每秒5万个样本的速度从安装在现场作业的10辆卡车上的传感器中收集到,并训练了一个神经网络,利用传感器数据来预测泵的故障。该软件有望将维护成本降低30 - 40%,即超过1000万美元。
BuildingIQ为大型建筑的暖通空调能源优化开发主动算法
大型商业建筑中的供暖、通风和空调(HVAC)系统通常效率低下,因为它们没有考虑到不断变化的天气模式、可变的能源成本或建筑的热特性。Building IQ基于云的软件平台使用先进的算法连续处理来自电能表、温度计和暖通空调压力传感器的千兆字节的信息。机器学习被用来分割数据,并确定燃气、电力、蒸汽和太阳能在加热和冷却过程中的相对贡献。优化用于确定一天中每个建筑的供暖和制冷的最佳时间表。Building IQ平台可使大型商业建筑正常运行时的暖通空调能耗降低10-25%。
开发检测算法以减少重症监护病房的虚警
在重症监护病房(icu),来自心电图和其他病人监测设备的假警报是一个严重的问题。假警报的噪音干扰患者的睡眠,频繁的假警报使临床工作人员对真正的警报失去敏感性。在PhysioNet/Computing in Cardiology挑战赛中,参赛者的任务是开发一种算法,可以区分ICU监控设备记录的信号中的真警报和假警报。捷克科学院的研究人员凭借MATLAB算法获得了该挑战实时类别的第一名,该算法可以检测QRS复合体,区分正常心跳和心室心跳,并过滤掉由心脏起搏器刺激引起的虚假QRS复合体。该算法的真阳性率(TPR)和真阴性率(TNR)分别为92%和88%。
为了解锁业务和工程数据的价值,以便做出明智的决策,开发预测分析应用程序的团队越来越多地转向MATLAB。
使用MATLAB工具和函数,您可以使用工程、科学和现场数据以及业务和事务数据执行预测分析。使用MATLAB,您可以将预测应用程序部署到大规模生产系统和嵌入式系统。
为什么使用MATLAB进行预测分析?
- MATLAB分析可用于商业和工程数据。
MATLAB具有对传感器、图像、视频、遥测、二进制和其他实时格式的原生支持。使用Hadoop和Spark的MATLAB Tall数组,并通过连接到ODBC/JDBC数据库的接口来研究这些数据。 - MATLAB让工程师自己做数据科学。
让您的领域专家从事数据科学,使用强大的工具帮助他们进行机器学习、深度学习、统计、优化、信号分析和图像处理。 - MATLAB分析在嵌入式系统中运行。
通过从MATLAB代码创建可移植的C和c++代码,开发在嵌入式平台上运行的分析。 - MATLAB分析部署到企业IT系统。
MATLAB集成到企业系统、集群和云,具有免版税的可部署运行时。
你的数据+ MATLAB =成功的预测分析
在这种简化的观点中,工程数据来自世界上的传感器、仪器和连接系统。数据被收集并存储在内部或云端的文件系统中。
“无论我们的客户在哪个行业,无论他们要求我们分析什么数据——文本、音频、图像或视频,matlab代码使我们能够更快地提供清晰的结果。”
G. Subrahamanya VRK Roo博士,Cognizant
这些数据与来自传统业务系统的数据相结合,如成本数据、销售结果、客户投诉和营销信息。
在此之后,由工程师或领域专家使用MATLAB开发分析。处理缺失数据、异常值或其他不可预见的数据质量问题几乎总是需要预处理。然后,统计和机器学习等分析方法被用来生成“分析”——系统的预测模型。
为了发挥作用,该预测模型将被部署到提供实时事务或IT系统(如电子商务网站)的生产IT环境中,或部署到嵌入式设备(传感器、控制器或现实世界中的智能系统,如自动驾驶汽车)中。
应用MATLAB而且动态仿真模块®作为该体系结构的一部分是非常理想的,因为这些工具使使用基于模型的设计的嵌入式系统或使用应用程序部署产品的IT系统的部署路径变得容易。2022世界杯八强谁会赢?
“MATLAB凭借其健壮的数值算法、广泛的可视化和分析工具、可靠的优化例程、对面向对象编程的支持,以及与我们的生产Java应用程序在云中运行的能力,帮助我们加快了研发和部署。”
BuildingIQ首席数据科学家Borislav Savkovic