高斯过程回归模型gydF4y2Ba
高斯过程回归模型是一种基于非参数核的概率模型。你可以训练探地雷达模型使用gydF4y2BafitrgpgydF4y2Ba
函数。gydF4y2Ba
考虑训练集gydF4y2Ba ,在那里gydF4y2Ba 而且gydF4y2Ba ,来自一个未知的分布。探地雷达模型解决了预测响应变量值的问题gydF4y2Ba ,给定新的输入向量gydF4y2Ba ,以及训练数据。线性回归模型的形式是gydF4y2Ba
在哪里gydF4y2Ba .误差方差gydF4y2BaσgydF4y2Ba2gydF4y2Ba和系数gydF4y2BaβgydF4y2Ba是根据数据估计的。探地雷达模型通过引入潜在变量来解释响应,gydF4y2Ba ,从高斯过程(GP)和显式基函数,gydF4y2BahgydF4y2Ba.潜在变量的协方差函数捕捉响应的平滑性,基函数投影输入gydF4y2Ba 成一个gydF4y2BapgydF4y2Ba维特征空间。gydF4y2Ba
GP是一组随机变量,使得任意有限数量的随机变量都具有联合高斯分布。如果gydF4y2Ba 是全科医生,那么给gydF4y2BangydF4y2Ba观察gydF4y2Ba 为随机变量的联合分布gydF4y2Ba 是高斯。GP由其均值函数定义gydF4y2Ba 和协方差函数,gydF4y2Ba .也就是说,如果gydF4y2Ba 是高斯过程,那么gydF4y2Ba 而且gydF4y2Ba
现在考虑下面的模型。gydF4y2Ba
在哪里gydF4y2Ba ,这是gydF4y2BafgydF4y2Ba(gydF4y2BaxgydF4y2Ba)来自一个具有协方差函数的零均值GP,gydF4y2Ba .gydF4y2BahgydF4y2Ba(gydF4y2BaxgydF4y2Ba)是对原始特征向量进行变换的一组基函数gydF4y2BaxgydF4y2Ba在RgydF4y2BadgydF4y2Ba变成一个新的特征向量gydF4y2BahgydF4y2Ba(gydF4y2BaxgydF4y2Ba在R中)gydF4y2BapgydF4y2Ba.gydF4y2BaβgydF4y2Ba是一个gydF4y2BapgydF4y2Ba-乘1的基函数系数向量。该模型代表GPR模型。一个响应实例gydF4y2BaygydF4y2Ba可以建模为gydF4y2Ba
因此,探地雷达模型是一个概率模型。有一个潜在变量gydF4y2BafgydF4y2Ba(gydF4y2BaxgydF4y2Ba我gydF4y2Ba)gydF4y2Ba ,这使得GPR模型是非参数的。在向量形式下,这个模型等价于gydF4y2Ba
在哪里gydF4y2Ba
潜变量的联合分布gydF4y2Ba 在GPR模型中的为:gydF4y2Ba
接近线性回归模型,其中gydF4y2Ba 看起来如下:gydF4y2Ba
协方差函数gydF4y2Ba 通常由一组内核参数或超参数参数化,gydF4y2Ba .经常gydF4y2Ba 被编写为gydF4y2Ba 显式地表示依赖于gydF4y2Ba .gydF4y2Ba
fitrgpgydF4y2Ba
估计基函数系数,gydF4y2Ba
,噪声方差,gydF4y2Ba
,超参数,gydF4y2Ba
在训练GPR模型时,从数据中提取核函数。您可以指定基函数、核(协方差)函数和参数的初始值。gydF4y2Ba
由于探地雷达模型是概率的,因此可以使用训练过的模型计算预测间隔(参见gydF4y2Ba预测gydF4y2Ba
而且gydF4y2BaresubPredictgydF4y2Ba
).gydF4y2Ba
您还可以使用训练过的GPR模型计算回归误差(参见gydF4y2Ba损失gydF4y2Ba
而且gydF4y2BaresubLossgydF4y2Ba
).gydF4y2Ba
比较探地雷达模型的预测区间gydF4y2Ba
本例将探地雷达模型适用于无噪声数据集和有噪声数据集。算例比较了两种拟合GPR模型的预测响应和预测区间。gydF4y2Ba
从函数中生成两个观测数据集gydF4y2Ba .gydF4y2Ba
rng (gydF4y2Ba“默认”gydF4y2Ba)gydF4y2Ba%的再现性gydF4y2Bax_observed = linspace(0, 10日,21)';y_observed1 = x_observed。* sin (x_observed);y_observved2 = y_observved1 + 0.5*randn(size(x_observed));gydF4y2Ba
中的值gydF4y2Bay_observed1gydF4y2Ba
是否无噪声,值在gydF4y2Bay_observed2gydF4y2Ba
包括一些随机噪声。gydF4y2Ba
拟合探地雷达模型与观测数据集。gydF4y2Ba
gprMdl1 = fitrgp (x_observed y_observed1);gprMdl2 = fitrgp (x_observed y_observed2);gydF4y2Ba
利用拟合模型计算预测响应和95%预测区间。gydF4y2Ba
x = linspace (0, 10) ';[ypred1, ~, yint1] =预测(gprMdl1 x);[ypred2, ~, yint2] =预测(gprMdl2 x);gydF4y2Ba
调整图形的大小以在一个图形中显示两个图形。gydF4y2Ba
无花果=图;fig.Position (3) = fig.Position (3) * 2;gydF4y2Ba
创建一个1 × 2平铺的图表布局。gydF4y2Ba
tiledlayout(1、2、gydF4y2Ba“TileSpacing”gydF4y2Ba,gydF4y2Ba“紧凑”gydF4y2Ba)gydF4y2Ba
对于每个贴图,画一个观察数据点的散点图和一个函数图gydF4y2Ba .然后添加GP预测响应的图和预测间隔的patch。gydF4y2Ba
nexttile举行gydF4y2Ba在gydF4y2Ba散射(x_observed y_observed1,gydF4y2Ba“r”gydF4y2Ba)gydF4y2Ba观测数据点百分比gydF4y2Bafplot (@ x (x)。* sin (x) [0, 10],gydF4y2Ba“——r”gydF4y2Ba)gydF4y2Bax*sin(x)的%函数图gydF4y2Ba情节(x, ypred1,gydF4y2Ba‘g’gydF4y2Ba)gydF4y2Ba% GPR预测gydF4y2Ba补丁([x; flipud (x)], [yint1 (: 1); flipud (yint1 (:, 2))),gydF4y2Ba“k”gydF4y2Ba,gydF4y2Ba“FaceAlpha”gydF4y2Ba, 0.1);gydF4y2Ba%的预测区间gydF4y2Ba持有gydF4y2Ba从gydF4y2Ba标题(gydF4y2Ba“无噪声观测的探地雷达拟合”gydF4y2Ba)({传奇gydF4y2Ba“无噪声的观察”gydF4y2Ba,gydF4y2Ba“g (x) = x * sin (x) 'gydF4y2Ba,gydF4y2Ba“探地雷达预测”gydF4y2Ba,gydF4y2Ba“95%的预测区间”gydF4y2Ba},gydF4y2Ba“位置”gydF4y2Ba,gydF4y2Ba“最佳”gydF4y2Ba) nexttile举行gydF4y2Ba在gydF4y2Ba散射(x_observed y_observed2,gydF4y2Ba“xr”gydF4y2Ba)gydF4y2Ba观测数据点百分比gydF4y2Bafplot (@ x (x)。* sin (x) [0, 10],gydF4y2Ba“——r”gydF4y2Ba)gydF4y2Bax*sin(x)的%函数图gydF4y2Ba情节(x, ypred2,gydF4y2Ba‘g’gydF4y2Ba)gydF4y2Ba% GPR预测gydF4y2Ba补丁([x; flipud (x)], [yint2 (: 1); flipud (yint2 (:, 2))),gydF4y2Ba“k”gydF4y2Ba,gydF4y2Ba“FaceAlpha”gydF4y2Ba, 0.1);gydF4y2Ba%的预测区间gydF4y2Ba持有gydF4y2Ba从gydF4y2Ba标题(gydF4y2Ba“探地雷达拟合噪声观测”gydF4y2Ba)({传奇gydF4y2Ba“嘈杂的观察”gydF4y2Ba,gydF4y2Ba“g (x) = x * sin (x) 'gydF4y2Ba,gydF4y2Ba“探地雷达预测”gydF4y2Ba,gydF4y2Ba“95%的预测区间”gydF4y2Ba},gydF4y2Ba“位置”gydF4y2Ba,gydF4y2Ba“最佳”gydF4y2Ba)gydF4y2Ba
当观测值无噪声时,探地雷达拟合的预测响应跨越观测值。预测响应的标准差几乎为零。因此,预测区间很窄。当观测值中包含噪声时,预测响应不会跨越观测值,预测区间变宽。gydF4y2Ba
参考文献gydF4y2Ba
拉斯穆森,C. E.和C. K. I.威廉姆斯。gydF4y2Ba机器学习的高斯过程。gydF4y2Ba麻省理工学院出版社。马萨诸塞州剑桥,2006年。gydF4y2Ba
另请参阅gydF4y2Ba
fitrgpgydF4y2Ba
|gydF4y2BaRegressionGPgydF4y2Ba
|gydF4y2Ba预测gydF4y2Ba