CompactLinearModel
紧凑线性回归模型
描述
CompactLinearModel
是完整线性回归模型对象的紧凑版本吗LinearModel
.由于紧凑模型不存储用于拟合模型的输入数据或与拟合过程相关的信息,因此可以使用CompactLinearModel
对象消耗的内存小于LinearModel
对象。您仍然可以使用紧凑模型来预测使用新输入数据的响应,但是有些LinearModel
对象函数不适用于紧凑模型。
创建
创建一个CompactLinearModel
模特出身丰满,训练有素LinearModel
通过使用紧凑的
.
属性
系数估计
CoefficientCovariance
- - - - - -系数估计的协方差矩阵
数字矩阵
CoefficientNames
- - - - - -系数的名字
字符向量的单元格数组
此属性是只读的。
系数名,指定为字符向量的单元格数组,每个单元格包含相应项的名称。
数据类型:细胞
系数
- - - - - -系数值
表格
此属性是只读的。
系数值,指定为表格。系数
每个系数包含一行,这些列:
估计
-估计系数值SE
-估算的标准误差tStat
- - - - - -t-统计量用于双侧检验,原假设系数为零pValue
- - - - - -p-valuet统计
使用方差分析
(仅适用于线性回归模型)或coefTest
对系数进行其他测试。使用coefCI
求系数估计的置信区间。
若要以向量的形式获取这些列,请使用点表示法将其索引到属性中。例如,得到模型中估计的系数向量mdl
:
beta = mdl.系数。估计
数据类型:表格
NumCoefficients
- - - - - -模型系数数
正整数
此属性是只读的。
模型系数的数目,指定为正整数。NumCoefficients
包括当模型项秩亏时设置为零的系数。
数据类型:双
NumEstimatedCoefficients
- - - - - -估计系数数
正整数
此属性是只读的。
模型中估计的系数数,指定为正整数。NumEstimatedCoefficients
不包括当模型项秩亏时设置为零的系数。NumEstimatedCoefficients
是回归的自由度。
数据类型:双
摘要统计信息
教育部
- - - - - -误差的自由度
正整数
此属性是只读的。
误差(残差)的自由度,等于观测数减去估计系数数,指定为正整数。
数据类型:双
LogLikelihood
- - - - - -Loglikelihood
数值
此属性是只读的。
响应值的对数似然性,指定为数值,基于每个响应值服从正态分布的假设。正态分布的平均值是拟合的(预测的)响应值,方差是均方误差
.
数据类型:单
|双
ModelCriterion
- - - - - -模型比较准则
结构
此属性是只读的。
模型比较的标准,指定为具有以下字段的结构:
另类投资会议
-赤池信息准则。AIC = -2 *logL + 2*m
,在那里logL
loglikelihood和米
是估计参数的个数。AICc
-赤池信息标准校正样本量。AICc = AIC + (2*m*(m + 1))/(n - m - 1)
,在那里n
是观测的数量。BIC
-贝叶斯信息准则。BIC = -2 *logL + m*log(n)
.中安集团经贸
—一致赤池信息标准。CAIC = -2 *logL + m*(log(n) + 1)
.
信息标准是模型选择工具,您可以使用它来比较适合相同数据的多个模型。这些标准是基于可能性的模型拟合度量,包括对复杂性的惩罚(具体地说,参数的数量)。不同的信息标准通过处罚的形式来区分。
当对多个模型进行比较时,信息准则值最低的模型为最佳拟合模型。最佳拟合模型可以根据用于模型比较的标准而变化。
若要以标量形式获取任何标准值,请使用点表示法将其索引到属性中。例如,获取AIC值另类投资会议
在模型中mdl
:
aic = mdl.ModelCriterion.AIC
数据类型:结构体
均方误差
- - - - - -均方误差
数值
此属性是只读的。
均方误差(残差),用数值表示。
均方误差=上交所/教育部,
在哪里均方误差是均方误差,上交所误差平方和,和教育部就是自由度。
数据类型:单
|双
RMSE
- - - - - -均方根误差
数值
此属性是只读的。
均方根误差(残差),用数值表示。
RMSE=√均方误差),
在哪里RMSE均方根误差和均方误差是均方误差。
数据类型:单
|双
Rsquared
- - - - - -模型的r平方值
结构
此属性是只读的。
模型的r平方值,指定为具有两个字段的结构:
普通的
-普通(未经调整)r平方调整
- r平方调整系数的数量
r平方值是由模型解释的总平方和的比例。普通的r平方值与苏维埃社会主义共和国
而且风场
属性:
r平方= SSR/SST
,
在哪里风场
总平方和,和苏维埃社会主义共和国
为回归平方和。
详细信息请参见决定系数(r平方).
若要以标量形式获取这些值,请使用点表示法将其索引到属性中。例如,得到模型中调整后的r平方值mdl
:
r2 = mll . rsquared .已调整
数据类型:结构体
上交所
- - - - - -误差平方和
数值
此属性是只读的。
误差平方和(残差),用数值表示。如果用观察权值训练模型,则模型的平方和为上交所
计算是加权平方和。
对于有截距的线性模型,毕达哥拉斯定理意味着
SST = sse + SSR
,
在哪里风场
是总平方和,上交所
误差平方和,和苏维埃社会主义共和国
为回归平方和。
有关计算的更多信息风场
有关稳健线性模型,请参见风场
.
数据类型:单
|双
苏维埃社会主义共和国
- - - - - -回归平方和
数值
此属性是只读的。
回归平方和,指定为数值。苏维埃社会主义共和国
等于拟合值与响应均值之间的偏差平方和。如果用观察权值训练模型,则模型的平方和为苏维埃社会主义共和国
计算是加权平方和。
对于有截距的线性模型,毕达哥拉斯定理意味着
SST = sse + SSR
,
在哪里风场
是总平方和,上交所
误差平方和,和苏维埃社会主义共和国
为回归平方和。
有关计算的更多信息风场
有关稳健线性模型,请参见风场
.
数据类型:单
|双
风场
- - - - - -总平方和
数值
此属性是只读的。
总平方和,指定为数值。风场
等于响应向量的偏差平方和y
从意思是(y)
.如果用观察权值训练模型,则模型的平方和为风场
计算是加权平方和。
对于有截距的线性模型,毕达哥拉斯定理意味着
SST = sse + SSR
,
在哪里风场
是总平方和,上交所
误差平方和,和苏维埃社会主义共和国
为回归平方和。
对于一个鲁棒线性模型,风场
不是按响应向量的方差平方和计算的吗y
从意思是(y)
.计算方法为SST = sse + SSR
.
数据类型:单
|双
拟合方法
健壮的
- - - - - -健壮的拟合信息
结构
此属性是只读的。
健壮的拟合信息,指定为具有本表中所述字段的结构。
场 | 描述 |
---|---|
WgtFun |
鲁棒加权函数等“bisquare” (见“RobustOpts” ) |
调优 |
调优常数。此字段为空([] )如果WgtFun 是“ols” 或者,如果WgtFun 是自定义权重函数的函数句柄,其默认调优常数为1。 |
权重 |
鲁棒拟合的最终迭代中使用的权重向量。此字段为空CompactLinearModel 对象。 |
这个结构是空的,除非你用稳健回归拟合模型。
数据类型:结构体
输入数据
公式
- - - - - -模型信息
LinearFormula
对象
此属性是只读的。
模型信息,指定为LinearFormula
对象。
显示拟合模型的公式mdl
使用点符号:
mdl。公式
NumObservations
- - - - - -观察次数
正整数
此属性是只读的。
拟合函数在拟合中使用的观察数,以正整数指定。NumObservations
原始表、数据集或矩阵中提供的观察数是否减去任何排除的行(用“排除”
名称-值对参数)或缺少值的行。
数据类型:双
NumPredictors
- - - - - -预测变量数量
正整数
此属性是只读的。
用于拟合模型的预测变量数,指定为正整数。
数据类型:双
NumVariables
- - - - - -变量数量
正整数
此属性是只读的。
输入数据中的变量数,指定为正整数。NumVariables
是原始表或数据集中的变量数,或预测器矩阵和响应向量中的列总数。
NumVariables
还包括不用于拟合模型作为预测因子或响应的任何变量。
数据类型:双
PredictorNames
- - - - - -用于拟合模型的预测因子名称
字符向量的单元格数组
此属性是只读的。
用于拟合模型的预测器名称,指定为字符向量的单元格数组。
数据类型:细胞
ResponseName
- - - - - -响应变量名
特征向量
此属性是只读的。
响应变量名,指定为字符向量。
数据类型:字符
VariableInfo
- - - - - -关于变量的信息
表格
此属性是只读的。
中包含的变量的信息变量
,指定为一个表,每个变量有一行,该表中描述的列。
列 | 描述 |
---|---|
类 |
变量类,指定为字符向量的单元格数组,例如“双” 而且“分类” |
范围 |
变量范围,指定为单元格向量数组
|
InModel |
拟合模型中变量的指示器,指定为逻辑向量。取值为真正的 如果模型包含变量。 |
IsCategorical |
类别变量的指示符,指定为逻辑向量。取值为真正的 如果变量是分类的。 |
VariableInfo
还包括不用于拟合模型作为预测因子或响应的任何变量。
数据类型:表格
VariableNames
- - - - - -变量名
字符向量的单元格数组
此属性是只读的。
变量的名称,指定为字符向量的单元格数组。
如果拟合基于表或数据集,则此属性提供表或数据集中变量的名称。
如果拟合是基于预测矩阵和响应向量,
VariableNames
属性指定的值“VarNames”
拟合方法的名称-值对参数。的默认值“VarNames”
是{x1, x2,…,‘xn’,‘y’}
.
VariableNames
还包括不用于拟合模型作为预测因子或响应的任何变量。
数据类型:细胞
对象的功能
评估线性模型
方差分析 |
线性回归模型的方差分析 |
coefCI |
线性回归模型系数估计的置信区间 |
coefTest |
线性回归模型系数的线性假设检验 |
partialDependence |
计算部分依赖关系 |
可视化线性模型
plotEffects |
在线性回归模型中绘制预测因子的主要效应 |
plotInteraction |
线性回归模型中两个预测因子的交互作用 |
plotPartialDependence |
创建部分依赖图(PDP)和个别条件期望图(ICE) |
plotSlice |
通过拟合的线性回归曲面绘制切片图 |
线性模型的集合性质
收集 |
收集属性统计和机器学习工具箱来自GPU的对象 |
例子
紧凑线性回归模型
将线性回归模型与数据拟合,并通过丢弃样本数据和一些与拟合过程相关的信息来减小完整的拟合线性回归模型的大小。
加载largedata4reg
数据集,其中包含15,000个观测值和45个预测变量。
负载largedata4reg
为数据拟合线性回归模型。
mdl = fitlm(X,Y);
压缩模型。
compactMdl = compact(mdl);
紧凑模型丢弃了原始样本数据和一些与拟合过程相关的信息。
比较完整模型的大小mdl
以及紧凑的模型compactMdl
.
Vars = whoos (“compactMdl”,“mdl”);(var (1) .bytes一样,var (2) .bytes]
ans =1×281538 11409065
紧凑模型比完整模型消耗的内存更少。
扩展功能
C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。
GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。
版本历史
在R2016a中引入
MATLAB命令
你点击了一个对应于这个MATLAB命令的链接:
在MATLAB命令窗口中输入该命令来运行该命令。Web浏览器不支持MATLAB命令。
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。