监督式学习

从已知输入和响应数据建立预测模型的机器学习技术

监督学习是最常见的机器学习算法。它使用一个已知的数据集(称为训练数据集),用一组已知的输入数据(称为特征)和已知的响应来训练算法,从而做出预测。训练数据集包括与期望输出或响应值配对的标记输入数据。在此基础上,监督学习算法通过发现特征和输出数据之间的关系来创建一个模型,然后对新数据集的响应值进行预测。

在应用监督学习之前,无监督学习通常用于在输入数据中发现建议候选特征的模式,特征工程将它们转换为更适合监督学习的模式。除了识别特征之外,还需要为训练集中的所有观察结果识别正确的类别或响应,这是一个非常劳动密集型的步骤。半监督学习允许您用非常有限的标记数据训练模型,从而减少标记工作。

一旦对算法进行了训练,通常会使用未用于训练的测试数据集来预测算法的性能并对其进行验证。为了获得准确的性能结果,训练和测试集都是“现实”的良好表示是至关重要的(即,来自生产环境的数据和模型都得到了正确的验证)。

模型验证的问答

模型验证的问答

您可以训练、验证和调整预测性监督学习模型MATLAB®深度学习工具箱™,统计和机器学习工具箱™。

监督学习算法分类

分类:用于分类响应值,其中数据可以被分为特定的类。二元分类模型有两个类,多类分类模型有更多类。你可以用MATLAB的分类学习者应用程序训练分类模型。

常用的分类算法包括:

回归:用于数值连续响应值。回归模型可以很容易地训练与回归学习者应用程序与MATLAB,学习如何这个视频在这个文章

常见的回归算法包括:

监督学习应用

监督学习用于金融应用信用评分算法交易和债券分类;在肿瘤检测和药物发现的生物学应用中;在能源应用的价格和负荷预测;在模式识别语音和图像的应用;在预测性维护方面设备寿命估算

参见:统计和机器学习工具箱深度学习工具箱机器学习无监督学习演算法线性回归非线性回归数据拟合数据分析数学建模预测建模人工智能AutoML正则化生物医学信号处理

Baidu
map