CompactGeneralizedLinearModel

紧凑广义线性回归模型类

描述

CompactGeneralizedLinearModel完整广义线性回归模型对象的精简版吗GeneralizedLinearModel．由于紧凑模型不存储用于拟合模型的输入数据或与拟合过程相关的信息，因此，aCompactGeneralizedLinearModel对象消耗的内存比对象少GeneralizedLinearModel对象。您仍然可以使用一个紧凑的模型来预测使用新的输入数据的响应，但是有些问题GeneralizedLinearModel对象函数不能与紧凑模型一起工作。

创建

创建一个CompactGeneralizedLinearModel模特从一个完整，训练有素GeneralizedLinearModel通过使用紧凑的．

fitglm返回CompactGeneralizedLinearModel当您使用高数组时，并返回GeneralizedLinearModel当使用内存中的表和数组时。

属性

全部展开

系数估计

`CoefficientCovariance`- - - - - -系数估计的协方差矩阵
数字矩阵

此属性是只读的。

系数估计的协方差矩阵，表示为ap——- - - - - -p数值矩阵。p为拟合模型中的系数数。

详情请参见系数、标准误差和置信区间．

数据类型:单|双

`CoefficientNames`- - - - - -系数的名字
字符向量的单元格数组

此属性是只读的。

系数名称，指定为字符向量的单元格数组，每个单元格包含相应的项的名称。

数据类型:细胞

`系数`- - - - - -系数值
表格

此属性是只读的。

系数值，用表格表示。系数每个系数都包含一行，下面这些列:

估计-估计系数值
SE-估计的标准误差
tStat- - - - - -t-统计量的双边检验，零假设系数为零
pValue- - - - - -p的值。t统计

使用方差分析(仅适用于线性回归模型)或coefTest对系数进行其他测试。使用coefCI求系数估计的置信区间。

若要将这些列作为向量获取，请使用点表示法将其索引到属性中。例如，得到模型中估计的系数向量mdl：

beta = mdl.系数

数据类型:表格

`NumCoefficients`- - - - - -模型系数数
正整数

此属性是只读的。

模型系数的数目，指定为正整数。NumCoefficients包括当模型项秩不足时设为零的系数。

数据类型:双

`NumEstimatedCoefficients`- - - - - -估计系数数
正整数

此属性是只读的。

模型中估计系数的数目，指定为正整数。NumEstimatedCoefficients不包括当模型项秩不足时设为零的系数。NumEstimatedCoefficients是回归的自由度。

数据类型:双

摘要统计信息

`异常`- - - - - -拟合偏差
数值

此属性是只读的。

配合的偏差，用数值表示。当一个模型是另一个模型的特例时，偏差对比较两个模型很有用。两种模型的偏差之差呈卡方分布，其自由度等于两种模型估计参数数目之差。有关更多信息，请参见异常．

数据类型:单|双

`教育部`- - - - - -误差的自由度
正整数

此属性是只读的。

误差(残差)的自由度，等于观察数减去估计系数数，指定为正整数。

数据类型:双

`分散`- - - - - -响应方差的比例因子
数字标量

此属性是只读的。

响应方差的比例因子，指定为数值标量。

如果“DispersionFlag”的名值对参数fitglm或stepwiseglm是真正的，则函数估计分散计算响应方差时的比例因子。响应的方差等于理论方差乘以比例因子。

例如，二项分布的方差函数为p(1 -p) /n,在那里p是概率参数和n是样本容量参数。如果分散近了1，数据的方差似乎与二项分布的理论方差一致。如果分散大于1，数据集相对于二项分布是“过度分散”的。

数据类型:双

`DispersionEstimated`- - - - - -标志，指示使用分散尺度因子
逻辑值

此属性是只读的。

标志，指示是否fitglm使用了分散比例因子计算系数的标准误差系数。SE，指定为逻辑值。如果DispersionEstimated是假，fitglm采用理论值的方差。

DispersionEstimated可以假仅适用于二项分布和泊松分布。
集DispersionEstimated通过设置“DispersionFlag”的名值对参数fitglm或stepwiseglm．

数据类型:逻辑

`LogLikelihood`- - - - - -Loglikelihood
数值

此属性是只读的。

模型分布在响应值处的对数似然性，用数值表示。从模型拟合平均值，其他参数作为模型拟合的一部分进行估计。

数据类型:单|双

`ModelCriterion`- - - - - -模型比较准则
结构

此属性是只读的。

模型比较的标准，指定为具有以下字段的结构:

另类投资会议-赤池信息标准。AIC = -2 *logL + 2*m,在那里logL对数似然和米是估计参数的个数。
AICc-修正了Akaike信息准则的样本量。AICc = AIC + (2*m*(m + 1))/(n - m - 1),在那里n是观察数。
BIC-贝叶斯信息准则。BIC = -2 *logL + m*log(n)．
中安集团经贸—一致的赤池信息标准。CAIC = -2 *logL + m*(log(n) + 1)．

信息标准是模型选择工具，您可以使用它来比较适合相同数据的多个模型。这些标准是基于可能性的模型拟合度量，包括对复杂性的惩罚(具体地说，参数的数量)。不同的信息标准通过惩罚的形式来区分。

当对多个模型进行比较时，信息准则值最低的模型为最佳拟合模型。最佳拟合模型可以根据用于模型比较的标准而变化。

若要以标量形式获取任何标准值，请使用点表示法将其索引到属性中。例如，获取AIC值另类投资会议在模型中mdl：

aic = mdl. modelcriteria . aic

数据类型:结构体

`Rsquared`- - - - - -模型的r平方值
结构

此属性是只读的。

模型的r平方值，指定为具有五个字段的结构。

场	描述	方程
`普通的`	普通(未调整)r平方	$R_{普通的}^{2} ＝ 1 - \frac{上交所}{风场}$ `上交所`误差的平方和，和`风场`是响应向量与响应向量均值的偏差平方和。
`调整`	r平方调整系数的数量	$R_{调整}^{2} ＝ 1 - \frac{上交所}{风场} \cdot \frac{N - 1}{教育部}$ N为观测次数(`NumObservations`),`教育部`是误差的自由度(残差)。
`LLR`	Loglikelihood比率	$R_{LLR}^{2} ＝ 1 - \frac{l}{l_{0}}$ l为拟合模型的对数似然(`LogLikelihood`),l₀是只包含一个常数项的模型的对数似然。R²_LLR麦克法登伪r平方值是多少[1]用于逻辑回归模型。
`异常`	偏差平方	$R_{异常}^{2} ＝ 1 - \frac{D}{D_{0}}$ D为拟合模型的偏差(`异常`),D₀是只包含一个常数项的模型的偏差。
`AdjGeneralized`	调整广义r平方	$R_{AdjGeneralized}^{2} ＝ \frac{1 - 经验值（ \frac{2 （ l_{0} - l ）}{N} ）}{1 - 经验值（ \frac{2 l_{0}}{N} ）}$ R²_{AdjGeneralized}是Nagelkerke调整吗[２]马达拉提出的公式[3]考克斯和斯内尔[4]和玛吉［5］用于逻辑回归模型。

若要将这些值作为标量获取，请使用点表示法将其索引到属性中。例如，得到模型中调整后的r方值mdl,输入:

r2 = mml . rsquared . adjusted

数据类型:结构体

`上交所`- - - - - -误差平方和
数值

此属性是只读的。

误差平方和(残差)，用数值表示。如果用观察权值训练模型，则模型的平方和上交所计算是加权平方和。

数据类型:单|双

`苏维埃社会主义共和国`- - - - - -回归平方和
数值

此属性是只读的。

回归平方和，指定为数值。苏维埃社会主义共和国等于拟合值与响应均值之间偏差的平方和。如果用观察权值训练模型，则模型的平方和苏维埃社会主义共和国计算是加权平方和。

数据类型:单|双

`风场`- - - - - -总平方和
数值

此属性是只读的。

总平方和，指定为数值。风场等于响应向量的偏差平方和吗y从意思是(y)．如果用观察权值训练模型，则模型的平方和风场计算是加权平方和。

数据类型:单|双

输入数据

`分布`- - - - - -广义分布信息
结构

此属性是只读的。

广义分布信息，指定为具有该表中描述的字段的结构。

场	描述
`的名字`	发行版的名称:`“正常”`，`“二”`，`“泊松”`，`“伽马”`,或`逆高斯分布的`
`DevianceFunction`	作为拟合参数值和响应值的函数计算偏差分量的函数
`VarianceFunction`	计算作为拟合参数值函数的分布的理论方差的函数。当`DispersionEstimated`是`真正的`，软件将方差函数乘以`分散`在计算系数标准值误差时。

数据类型:结构体

`公式`- - - - - -模型信息
`LinearFormula`对象

此属性是只读的。

型号信息，指定为LinearFormula对象。

显示拟合模型的公式mdl使用点表示法:

mdl。F或米ula

`链接`- - - - - -链接功能
结构

此属性是只读的。

链接函数，指定为具有该表中描述的字段的结构。

场	描述
`的名字`	链接函数的名称，指定为字符向量。如果使用函数句柄指定链接函数，则`的名字`是`”`．
`链接`	函数f它定义链接函数，指定为函数句柄
`导数`	的导数f，指定为函数句柄
`逆`	逆的f，指定为函数句柄

链接函数是一个函数f它链接了分布参数μ到拟合的线性组合Xb预测因子:

f（μ) =Xb．

数据类型:结构体

`NumObservations`- - - - - -观察次数
正整数

此属性是只读的。

拟合函数中用于拟合的观测次数，指定为正整数。NumObservations原始表、数据集或矩阵中提供的观察数减去任何排除的行(用“排除”名称-值对参数)或缺少值的行。

数据类型:双

`NumPredictors`- - - - - -预测变量数量
正整数

此属性是只读的。

用于拟合模型的预测变量的数目，指定为正整数。

数据类型:双

`NumVariables`- - - - - -变量数量
正整数

此属性是只读的。

输入数据中的变量数，指定为正整数。NumVariables是原始表或数据集中的变量数量，或预测器矩阵和响应向量中的列总数。

NumVariables还包括任何不用于拟合模型的变量，作为预测因子或响应。

数据类型:双

`PredictorNames`- - - - - -用于拟合模型的预测器名称
字符向量的单元格数组

此属性是只读的。

用于拟合模型的预测器名称，指定为字符向量的单元格数组。

数据类型:细胞

`ResponseName`- - - - - -响应变量名
特征向量

此属性是只读的。

响应变量名，指定为字符向量。

数据类型:字符

`VariableInfo`- - - - - -关于变量的信息
表格

此属性是只读的。

中包含的变量的信息变量，指定为一个表，每个变量和该表中描述的列对应一行。

列	描述
`类`	变量类，指定为字符向量的单元格数组，例如`“双”`而且`“分类”`
`范围`	变量范围，指定为向量的单元格数组连续变量-二元向量`［最小值，马克斯］`，最小值和最大值分类变量-不同变量值的向量
`InModel`	指示哪些变量在拟合模型中，指定为逻辑向量。取值为`真正的`如果模型包含变量。
`IsCategorical`	类别变量的指示器，指定为逻辑向量。取值为`真正的`如果变量是绝对的。

VariableInfo还包括任何不用于拟合模型的变量，作为预测因子或响应。

数据类型:表格

`VariableNames`- - - - - -变量名
字符向量的单元格数组

此属性是只读的。

变量名，指定为字符向量的单元格数组。

如果匹配基于表或数据集，则此属性提供表或数据集中变量的名称。
如果拟合是基于预测矩阵和响应向量，VariableNames控件指定的值“VarNames”拟合方法的名值对参数。的默认值。“VarNames”是{x1, x2,…,‘xn’,‘y’}．

VariableNames还包括任何不用于拟合模型的变量，作为预测因子或响应。

数据类型:细胞

对象的功能

全部展开

预测的反应

`函数宏指令`	对每个预测器使用一个输入来预测广义线性回归模型的响应
`预测`	预测广义线性回归模型的响应
`随机`	广义线性回归模型的随机噪声响应模拟

评价广义线性模型

`coefCI`	广义线性回归模型系数估计的置信区间
`coefTest`	广义线性回归模型系数的线性假设检验
`devianceTest`	广义线性回归模型的偏差分析
`partialDependence`	计算偏依赖性

可视化广义线性模型和汇总统计

`plotPartialDependence`	创建偏依赖图(PDP)和个体条件期望图(ICE)
`plotSlice`	通过拟合广义线性回归曲面的切片图

广义线性模型的集合性质

`收集`	的集合属性统计和机器学习工具箱图形处理器对象

例子

全部折叠

紧凑广义线性回归模型

打开实时脚本

将广义线性回归模型与数据进行拟合，通过丢弃样本数据和与拟合过程相关的一些信息来减小完整拟合模型的大小。

加载largedata4reg数据集，包含15,000个观测值和45个预测变量。

负载largedata4reg

拟合一个广义线性回归模型的数据使用前15个预测变量。

mdl = fitglm(X(:，1:15)，Y);

压缩模型。

compactMdl = compact(mdl);

紧凑模型丢弃了原始样本数据和与拟合过程相关的一些信息，因此它比完整模型使用更少的内存。

比较完整模型的尺寸mdl紧凑型compactMdl．

Vars = whoos (“compactMdl”，“mdl”）;(var (1) .bytes一样,var (2) .bytes]

ans =1×215518 4382501

紧凑模型比完整模型消耗更少的内存。

参考文献

丹尼尔·麦克法登。定性选择行为的条件logit分析计量经济学前沿P. Zarembka编辑，105-42。纽约:文献出版社，1974年。

[2]新泽西州纳克尔克“决定系数的一般定义注记”。生物统计学78年,没有。3(1991): 691-92。

gamadharrao S.马达拉计量经济学中的有限因变量和定性变量。计量经济学会专著。纽约:剑桥大学出版社，1983年。

[4]考克斯，D. R.和E. J.斯内尔。二进制数据分析。统计与应用概率专论第2版32。伦敦;纽约:查普曼和霍尔，1989年。

马吉，朗尼。基于Wald和似然比联合显著性检验的r2测度美国统计学家44岁的没有。3(1990年8月):250-53。

扩展功能

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项和限制:

的预测而且随机函数支持代码生成。
当你用fitglm或stepwiseglm，您不能指定链接，导数,逆的字段“链接”名值对参数作为匿名函数。也就是说，您不能使用使用链接的匿名函数创建的广义线性模型来生成代码。相反，为链接组件定义函数。

有关更多信息，请参见代码生成简介．

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

使用注意事项和限制:

的对象函数CompactGeneralizedLinearModel模型完全支持GPU阵列。

有关更多信息，请参见在图形处理器上运行MATLAB函数(并行计算工具箱)．

版本历史

在R2016b中引入

另请参阅

GeneralizedLinearModel|fitglm|紧凑的|stepwiseglm

CompactGeneralizedLinearModel

描述

创建

属性

系数估计

CoefficientCovariance- - - - - -系数估计的协方差矩阵数字矩阵

CoefficientNames- - - - - -系数的名字字符向量的单元格数组

系数- - - - - -系数值表格

NumCoefficients- - - - - -模型系数数正整数

NumEstimatedCoefficients- - - - - -估计系数数正整数

摘要统计信息

异常- - - - - -拟合偏差数值

教育部- - - - - -误差的自由度正整数

分散- - - - - -响应方差的比例因子数字标量

DispersionEstimated- - - - - -标志，指示使用分散尺度因子逻辑值

LogLikelihood- - - - - -Loglikelihood数值

ModelCriterion- - - - - -模型比较准则结构

Rsquared- - - - - -模型的r平方值结构

上交所- - - - - -误差平方和数值

苏维埃社会主义共和国- - - - - -回归平方和数值

风场- - - - - -总平方和数值

输入数据

分布- - - - - -广义分布信息结构

公式- - - - - -模型信息LinearFormula对象

链接- - - - - -链接功能结构

NumObservations- - - - - -观察次数正整数

NumPredictors- - - - - -预测变量数量正整数

NumVariables- - - - - -变量数量正整数

PredictorNames- - - - - -用于拟合模型的预测器名称字符向量的单元格数组

ResponseName- - - - - -响应变量名特征向量

VariableInfo- - - - - -关于变量的信息表格

VariableNames- - - - - -变量名字符向量的单元格数组

对象的功能

预测的反应

评价广义线性模型

可视化广义线性模型和汇总统计

广义线性模型的集合性质

例子

紧凑广义线性回归模型

更多关于

异常

参考文献

扩展功能

C/ c++代码生成使用MATLAB®Coder™生成C和c++代码。

GPU数组通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

版本历史

另请参阅

主题

`CoefficientCovariance`- - - - - -系数估计的协方差矩阵
数字矩阵

`CoefficientNames`- - - - - -系数的名字
字符向量的单元格数组

`系数`- - - - - -系数值
表格

`NumCoefficients`- - - - - -模型系数数
正整数

`NumEstimatedCoefficients`- - - - - -估计系数数
正整数

`异常`- - - - - -拟合偏差
数值

`教育部`- - - - - -误差的自由度
正整数

`分散`- - - - - -响应方差的比例因子
数字标量

`DispersionEstimated`- - - - - -标志，指示使用分散尺度因子
逻辑值

`LogLikelihood`- - - - - -Loglikelihood
数值

`ModelCriterion`- - - - - -模型比较准则
结构

`Rsquared`- - - - - -模型的r平方值
结构

`上交所`- - - - - -误差平方和
数值

`苏维埃社会主义共和国`- - - - - -回归平方和
数值

`风场`- - - - - -总平方和
数值

`分布`- - - - - -广义分布信息
结构

`公式`- - - - - -模型信息
`LinearFormula`对象

`链接`- - - - - -链接功能
结构

`NumObservations`- - - - - -观察次数
正整数

`NumPredictors`- - - - - -预测变量数量
正整数

`NumVariables`- - - - - -变量数量
正整数

`PredictorNames`- - - - - -用于拟合模型的预测器名称
字符向量的单元格数组

`ResponseName`- - - - - -响应变量名
特征向量

`VariableInfo`- - - - - -关于变量的信息
表格

`VariableNames`- - - - - -变量名
字符向量的单元格数组

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。