什么是统计和机器学习工具箱?
统计和机器学习工具箱™提供了访问、预处理和可视化数据的工具;提取功能;训练和优化模型;为部署准备模型。
典型的工作流程从访问、清理和预处理数据开始,为提取特征做准备。该工具箱支持所有广泛使用的分类、回归和聚类算法,它使建模的挑战性部分更容易:
•用于训练和比较模型的指向点击应用程序
•自动超参数调优和特征选择,以优化模型性能
•使用相同的代码将处理扩展到大数据和集群
•与流行的开源工具相比,执行速度更快
使用MATLAB Coder™,您可以从机器学习模型自动生成C/ c++代码,用于嵌入式和高性能应用程序。
统计和机器学习工具箱提供了发现模式和选择特征的工具,用应用程序训练分类或回归模型,并部署到企业和嵌入式系统。在本例中,一个回归模型使用多个数据源(包括带有时间戳的历史电力负荷数据和天气数据)预测电网的未来负荷。您可以开始探索描述性统计和可视化,包括盒图来比较平均值和方差,树状图来揭示聚类和结构。
在MATLAB中对数据进行预处理后,您可以根据预测器和响应之间的高度相关性确定选择哪些变量作为特征。让主成分分析确定转换后的特征,这些特征占数据可变性的大部分,或者使用自动化的特征选择方法。
通过分类和回归学习者应用程序,您可以交互式地构建预测分类或回归模型,包括最近邻、决策树和浅神经网络。优化超参数,比较来自多个模型的结果和独立测试数据的交叉验证,并用混淆矩阵或ROC曲线可视化性能。许多工具箱算法处理内存不足的数据,不需要更改任何代码。一旦确定了机器学习模型,就可以使用MATLAB编译器将该模型部署到IT系统中,或者使用MATLAB Coder生成可在嵌入式设备上使用的独立c代码。
您可以使用新数据增量地更新线性模型,也可以在不重新生成预测代码的情况下更新嵌入式模型。统计和机器学习工具箱提供了各种统计功能,包括假设检验、方差分析和工业统计。要开始,请参考一个示例、产品页面上的信息,或者下载下面的免费试用版。
您也可以从以下列表中选择网站:
如何获得最佳的网站性能
选择中国网站(中文或英文)以获得最佳的网站表现。其他MathWorks国家网站没有针对从您的位置访问进行优化。