主要内容

石灰

本地可model-agnostic解释(石灰)

    描述

    石灰解释了机器学习的预测模型(分类或回归)查询点通过寻找重要预测因子,要安装一个简单的解释模型。

    您可以创建一个石灰对机器学习模型对象与指定查询点(queryPoint)和指定数量的重要预测因子(numImportantPredictors)。软件生成一个合成数据集,并符合一个简单的可翻译的重要预测因子,有效地解释了预测模型合成数据的查询。简单的模型可以是线性模型(默认)或决策树模型。

    使用安装简单的模型来解释在本地机器学习模型的预测,在指定的查询。使用情节函数可视化石灰的结果。基于当地的解释,你可以决定是否信任机器学习模型。

    适应一个新的简单的模型通过使用另一个查询点适合函数。

    创建

    描述

    结果=石灰(黑箱)创建一个石灰对象使用机器学习模型对象黑箱包含预测数据。的石灰函数生成的合成样品预测数据集和计算的预测样本。要满足一个简单的模型,可以使用适合函数与结果

    例子

    结果=石灰(黑箱,X)创建一个石灰使用预测数据对象X

    结果=石灰(黑箱“CustomSyntheticData”,customSyntheticData)创建一个石灰对象使用pregenerated,定制合成预测数据集customSyntheticData。的石灰计算样本的预测函数customSyntheticData

    例子

    结果=石灰(___“QueryPoint”,queryPoint“NumImportantPredictors”,numImportantPredictors)还发现指定数量的重要预测因子,适合简单线性模型查询点queryPoint。您可以指定queryPointnumImportantPredictors除了任何输入参数组合在前面的语法。

    例子

    结果=石灰(___,名称,值)使用一个或多个名称参数指定附加选项。例如,“SimpleModelType”、“树”指定类型的简单的模型作为一个决策树模型。

    输入参数

    全部展开

    机器学习模型来解释,指定为一个完整紧凑的回归或分类模型对象或一个函数处理。

    预测数据,指定为一个数字矩阵或表。每一行的X对应于一个观察,每一列对应一个变量。

    X必须符合的预测数据训练吗黑箱,存储在blackbox.X。指定的值必须不包含一个响应变量。

    • X必须具有相同的数据类型作为预测变量(例如,trainX),训练黑箱。的变量的列X必须有相同的号码和订单trainX

      • 如果你训练黑箱使用一个数字矩阵,然后X必须是一个数字矩阵。

      • 如果你训练黑箱使用一个表,那么X必须是一个表。所有的预测变量X必须有相同的变量名和数据类型trainX

    • 石灰不支持一个稀疏矩阵。

    如果黑箱是一个模型对象,不包含预测数据或一个函数处理,您必须提供吗XcustomSyntheticData。如果黑箱是一个完整的机器学习模型对象,你指定这个参数,然后呢石灰不使用预测数据黑箱。只使用指定的预测数据。

    数据类型:||

    Pregenerated、定制合成预测数据集,指定为一个数字矩阵或表。

    如果你提供一个pregenerated数据集石灰使用提供的数据集,而不是生成一个新的合成预测数据集。

    customSyntheticData必须符合的预测数据训练吗黑箱,存储在blackbox.X。指定的值必须不包含一个响应变量。

    • customSyntheticData必须具有相同的数据类型作为预测变量(例如,trainX),训练黑箱。的变量的列customSyntheticData必须有相同的号码和订单trainX

      • 如果你训练黑箱使用一个数字矩阵,然后customSyntheticData必须是一个数字矩阵。

      • 如果你训练黑箱使用一个表,那么customSyntheticData必须是一个表。所有的预测变量customSyntheticData必须有相同的变量名和数据类型trainX

    • 石灰不支持一个稀疏矩阵。

    如果黑箱是一个模型对象,不包含预测数据或一个函数处理,您必须提供吗XcustomSyntheticData。如果黑箱是一个完整的机器学习模型对象,你指定这个参数,然后呢石灰不使用预测数据黑箱;只使用指定的预测数据。

    数据类型:||

    查询点石灰解释了一个预测,指定为一个行向量的数值或单列表。queryPoint必须具有相同的数据类型和数量的列X,customSyntheticData或预测数据黑箱

    如果您指定numImportantPredictorsqueryPoint,那么石灰当创建一个函数满足一个简单的模型石灰对象。

    queryPoint不能包含缺失值。

    例子::blackbox.X (1)指定查询点作为第一次观察到完整的预测数据的机器学习模型黑箱

    数据类型:||

    许多重要的预测使用的简单模型,指定为一个正整数标量值。

    • 如果“SimpleModelType”“线性”(默认),然后软件选择指定数量的重要预测因素,符合线性模型选择的预测。

    • 如果“SimpleModelType”“树”,那么软件指定的最大数量决定分裂(或分支节点)作为许多重要的决策树预测,以便安装使用最多指定数量的预测。

    如果您指定numImportantPredictorsqueryPoint,那么石灰当创建一个函数满足一个简单的模型石灰对象。

    数据类型:|

    名称-值参数

    指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

    R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

    例子:石灰(黑箱,“QueryPoint”问,“NumImportantPredictors”n“SimpleModelType”,“树”)指定查询点的重要预测因子用于简单的模型n,和简单的模型的类型作为一个决策树模型。石灰生成样本的综合预测的数据集,计算样本的预测,适合使用决策树模式查询点最多指定数量的预测。

    选择合成预测数据

    全部展开

    位置的数据生成的合成数据,指定为逗号分隔组成的“DataLocality”“全球”“本地”

    • “全球”——软件估计分布参数使用整个预测数据集(X或预测数据黑箱)。软件生成一个综合预测与估计的参数和使用数据集的数据集的任何查询点简单的模型拟合。

    • “本地”——软件估计分布参数使用k查询点最近的邻居,k“NumNeighbors”价值。软件生成一个新的合成预测数据集每一次它适合一个简单的模型指定查询点。

    更多细节,请参阅石灰

    例子:“DataLocality”,“当地”

    数据类型:字符|字符串

    的邻居查询点,指定为逗号分隔组成的“NumNeighbors”和一个正整数标量值。这个论点是有效的只有当“DataLocality”“本地”

    如果你指定一个值大于观测的数量预测数据集(X或预测数据黑箱),然后石灰使用所有的观察。

    例子:“NumNeighbors”, 2000年

    数据类型:|

    样本数为合成数据集,生成指定为逗号分隔组成的“NumSyntheticData”和一个正整数标量值。

    例子:“NumSyntheticData”, 2500年

    数据类型:|

    选择简单的模型

    全部展开

    内核的宽度平方指数(或高斯核函数),指定为逗号分隔组成的“KernelWidth”和数字标量值。

    石灰函数计算之间的距离查询点和综合预测的样本数据集,然后将距离权重采用平方指数核函数。如果你降低“KernelWidth”值,然后石灰使用重量,更关注查询附近的样本点。有关详细信息,请参见石灰

    例子:“KernelWidth”, 0.5

    数据类型:|

    类型的简单模型,指定为逗号分隔组成的“SimpleModelType”“线性”“树”

    • “线性”——软件符合线性模型通过使用fitrlinear回归或fitclinear的分类。

    • “树”——软件适合使用决策树模型fitrtree回归或fitctree的分类。

    例子:“SimpleModelType”、“树”

    数据类型:字符|字符串

    选择机器学习模型

    全部展开

    分类预测列表,指定为逗号分隔组成的“CategoricalPredictors”在这个表的一个值。

    价值 描述
    向量的正整数

    向量中的每个条目是一个索引值表明相应的预测分类。索引值介于1和p,在那里p预测的数量被用来训练模型。

    如果黑箱使用输入变量的子集作为预测因子,然后软件指标预测只使用子集。的“CategoricalPredictors”值不计数响应变量,观察体重变量,或任何其他变量,函数不使用。

    逻辑向量

    一个真正的意味着相应的预测分类条目。向量的长度p

    字符矩阵 矩阵的每一行是一个预测变量的名字。名称必须匹配的变量名的形式表预测数据。垫的名字与额外的空格字符矩阵的每一行有相同的长度。
    字符串数组或单元阵列的特征向量 数组中的每个元素是一个预测变量的名字。名称必须匹配的变量名的形式表预测数据。
    “所有” 所有预测都直言。

    • 如果您指定黑箱作为处理函数石灰识别分类预测的预测数据XcustomSyntheticData。如果预测的数据表中,石灰假设变量是直言如果它是一个逻辑向量,无序分类向量,字符数组,字符串数组或单元阵列特征向量。如果预测数据是一个矩阵,石灰假设所有的预测都是连续的。

    • 如果您指定黑箱作为回归或分类模型对象石灰通过使用的标识分类预测CategoricalPredictors模型对象的属性。

    石灰不支持有序分类预测。

    例子:“CategoricalPredictors”、“所有”

    数据类型:||逻辑|字符|字符串|细胞

    机器学习模型的类型,指定为逗号分隔组成的“类型”的回归“分类”

    你必须指定这个参数时指定黑箱作为处理函数。如果您指定黑箱作为回归或分类模型对象石灰决定了“类型”根据模型类型的值。

    例子:“类型”、“分类”

    数据类型:字符|字符串

    选择计算距离

    全部展开

    距离度量,指定为逗号分隔组成的“距离”和一个特征向量,字符串标量,或函数句柄。

    • 如果预测数据只包含连续变量,然后石灰支持这些距离度量。

      价值 描述
      “欧几里得”

      欧氏距离。

      “seuclidean”

      标准化的欧氏距离。每个坐标差异观察是通过除以相应的扩展元素的标准差,S =性病(PD omitnan),在那里PD是预测数据或合成预测数据。要指定不同的扩展,可以使用“规模”名称-值参数。

      “mahalanobis”

      而使用的样本协方差距离PD,C = x (PD omitrows)。改变协方差矩阵的值,使用“浸”名称-值参数。

      “cityblock”

      城市街区的距离。

      闵可夫斯基的

      闵可夫斯基距离。默认的指数是2。指定一个不同的指数,使用“P”名称-值参数。

      “chebychev”

      Chebychev距离(最大坐标差异)。

      的余弦

      1 -之间的夹角的余弦值点(视为向量)。

      “相关”

      1 -样本点之间的相关性(作为序列的值)。

      “枪兵”

      1 -样本之间的斯皮尔曼等级相关的观察(作为序列的值)。

      @distfun

      自定义距离函数处理。距离函数的形式

      函数ZJ D2 = distfun(子)%计算距离
      在哪里

      • 是一个1——- - - - - -t向量包含一个观察。

      • ZJ是一个年代——- - - - - -t包含多个观测矩阵。distfun必须接受一个矩阵ZJ与任意数量的观察。

      • D2是一个年代——- - - - - -1距离向量,D2 (k)是观察之间的距离ZJ (k,:)

      如果你的数据不是稀疏的,你可以通过使用一个内置的通常更快的计算距离的距离度量,而不是一个函数处理。

    • 如果预测数据包括连续和分类变量石灰支持这些距离度量。

      价值 描述
      “goodall3”

      修改古德距离

      海底钻井的

      发生频率的距离

    定义,请参阅距离度量

    默认值是“欧几里得”如果只包含连续变量的预测数据,或“goodall3”如果预测数据包括连续和分类变量。

    例子:“距离”、“海底钻井的

    数据类型:字符|字符串|function_handle

    协方差矩阵的Mahalanobis距离度量,指定为逗号分隔组成的“浸”和一个K——- - - - - -K正定矩阵,K预测的数量。

    这个论点是有效的前提“距离”“mahalanobis”

    默认的“浸”值是浸(PD omitrows),在那里PD是预测数据或合成预测数据。如果你不指定“浸”值,那么软件时使用不同的协方差矩阵计算距离的预测数据和合成预测数据。

    例子:“浸”,眼睛(3)

    数据类型:|

    闵可夫斯基距离度量指数,指定为逗号分隔组成的“P”和积极的标量。

    这个论点是有效的前提“距离”闵可夫斯基的

    例子:“P”3

    数据类型:|

    标准化的欧氏距离度量,尺度参数值指定为逗号分隔组成的“规模”和一个非负数字向量的长度K,在那里K预测的数量。

    这个论点是有效的前提“距离”“seuclidean”

    默认的“规模”值是性病(PD omitnan),在那里PD是预测数据或合成预测数据。如果你不指定“规模”值,然后使用不同的软件规模参数计算距离时的预测数据和合成预测数据。

    例子:“规模”,分位数(0.75 X)——分位数(0.25 X))

    数据类型:|

    属性

    全部展开

    指定的属性

    当创建一个您可以指定以下属性石灰对象。

    这个属性是只读的。

    机器学习模型来解释,指定为一个回归或分类模型对象或一个函数处理。

    黑箱参数设置这个属性。

    这个属性是只读的。

    分类预测指标,指定为一个向量的正整数。CategoricalPredictors包含索引值表明相应的预测分类。索引值介于1和p,在那里p预测的数量被用来训练模型。如果所有的预测都直言,那么这个属性是空的([])。

    • 如果您指定黑箱使用一个函数处理石灰识别分类预测的预测数据XcustomSyntheticData。如果你指定“CategoricalPredictors”名称-值参数,参数设置这个属性。

    • 如果您指定黑箱作为回归或分类模型对象石灰决定使用这个属性CategoricalPredictors模型对象的属性。

    石灰不支持有序分类预测。

    如果“SimpleModelType”“线性”(默认)石灰为每个标识创建虚变量分类预测。石灰将指定的类别查询点作为参考集团和哑变量创建一个低于类别的数量。更多细节,请参阅哑变量与参照组

    数据类型:|

    这个属性是只读的。

    位置的数据生成的合成数据,指定为“全球”“本地”

    “DataLocality”名称-值参数来设置这个属性。

    这个属性是只读的。

    许多重要的预测使用简单的模型(SimpleModel),指定为一个正整数标量值。

    numImportantPredictors的观点石灰或者是numImportantPredictors的观点适合设置此属性。

    数据类型:|

    这个属性是只读的。

    合成数据集的样本数量,指定为一个正整数标量值。

    数据类型:|

    这个属性是只读的。

    查询点石灰使用简单的模型解释了一个预测(SimpleModel),指定为一个行向量的数值或单列表。

    queryPoint的观点石灰或者是queryPoint的观点适合设置此属性。

    数据类型:||

    这个属性是只读的。

    类型的机器学习模型(BlackboxModel),指定为的回归“分类”

    • 如果您指定黑箱作为回归或分类模型对象石灰决定了这个属性根据模型类型。

    • 如果您指定黑箱使用一个函数处理,那么“类型”名称-值参数来设置这个属性。

    这个属性是只读的。

    预测数据,指定为一个数字矩阵或表。

    每一行的X对应于一个观察,每一列对应一个变量。

    • 如果你指定X参数,参数设置这个属性。

    • 如果你指定customSyntheticData参数,那么这个属性是空的。

    • 如果您指定黑箱作为一个完整的机器学习模型对象并没有指定XcustomSyntheticData,那么这个属性值预测数据用于训练黑箱

    石灰不使用含有缺失值的行,不存储行吗X

    数据类型:||

    计算属性

    软件计算以下属性。

    这个属性是只读的。

    预测查询点计算的机器学习模型(BlackboxModel),指定为一个标量。回归的预测是预测响应或分类的分类标签。

    数据类型:||分类|逻辑|字符|字符串|细胞

    这个属性是只读的。

    预测合成预测计算的数据机器学习模型(BlackboxModel),指定为一个向量。

    数据类型:||分类|逻辑|字符|字符串|细胞

    这个属性是只读的。

    重要的预测指标,指定为一个向量的正整数。ImportantPredictors包含的列对应的索引值预测中使用的简单的模型(SimpleModel)。

    数据类型:|

    这个属性是只读的。

    简单的模型,指定为一个RegressionLinear,RegressionTree,ClassificationLinear,或ClassificationTree模型对象。石灰决定了简单的模型对象的类型取决于类型的机器学习模型(类型)和简单的模型的类型(“SimpleModelType”)。

    这个属性是只读的。

    预测查询点计算的简单的模型(SimpleModel),指定为一个标量。

    如果SimpleModelClassificationLinear,那么SimpleModelFitted值为1或1。

    • SimpleModelFitted值为1,如果预测的简单的模型是一样的BlackboxFitted(从机器学习模型预测)。

    • SimpleModelFitted值为1,如果预测从简单的模型是不同的BlackboxFitted。如果BlackboxFitted值是一个,那么情节功能显示SimpleModelFitted值作为不是一个

    数据类型:||分类|逻辑|字符|字符串|细胞

    这个属性是只读的。

    合成预测数据,指定为一个数字矩阵或表。

    • 如果你指定customSyntheticData输入参数,参数设置这个属性。

    • 否则,石灰估计分布参数的预测数据X并生成一个合成预测数据集。

    数据类型:||

    对象的功能

    适合 适合当地可翻译的简单模型model-agnostic解释(石灰)
    情节 当地阴谋的结果可判断的model-agnostic解释(石灰)

    例子

    全部折叠

    训练一个分类模型,并创建一个石灰简单对象,使用决策树模型。当您创建一个石灰查询对象,指定一个点和一些重要的预测,以便软件生成样本的合成数据集和一个简单的模型查询点符合重要的预测因子。然后显示估计预测重要性的简单的模型通过使用目标函数情节

    加载CreditRating_Historical数据集,数据集包含客户id和他们的财务比率,行业标签,信用评级。

    台= readtable (“CreditRating_Historical.dat”);

    显示表的前三行。

    头(资源描述,3)
    ID WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业评级_____ _____ _____和______ _____ ________ ________ 62394 0.013 0.104 0.036 0.447 0.142 3 {“BB”} 48608 0.232 0.335 0.062 1.969 0.281 8 {A} 42444 0.311 0.367 0.074 1.935 0.366 1 {A}

    创建一个表的预测变量的列的客户id和评级资源描述

    tblX = removevars(资源描述,“ID”,“评级”]);

    火车的黑箱模型使用的信用评级fitcecoc函数。

    黑箱= fitcecoc (tblX tbl.Rating,“CategoricalPredictors”,“行业”);

    创建一个石灰对象,解释了过去观察使用决策树预测简单的模型。指定“NumImportantPredictors”六找到最多6个重要的预测因子。如果你指定“QueryPoint”“NumImportantPredictors”当您创建一个值石灰对象,然后合成的软件生成样本数据集,要符合一个简单的解释模型合成数据集。

    queryPoint = tblX(最终,:)
    queryPoint =1×6表WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业_____ _____ _________ ________ ________ 0.239 0.463 0.065 2.924 0.34 - 2
    rng (“默认”)%的再现性结果=石灰(黑盒,“QueryPoint”queryPoint,“NumImportantPredictors”6“SimpleModelType”,“树”)
    结果=石灰与属性:BlackboxModel: [1 x1 ClassificationECOC] DataLocality:“全球”CategoricalPredictors: 6类型:“分类”X: [3932 x6表]QueryPoint: [1 x6表]NumImportantPredictors: 6 NumSyntheticData: 5000 SyntheticData: [5000 x6表)安装:{5000}x1细胞SimpleModel: [1 x1 ClassificationTree] ImportantPredictors: [2 x1双]BlackboxFitted: {“AA”} SimpleModelFitted: {“AA”}

    画出石灰对象结果通过使用对象的功能情节。显示现有的强调在任何预测的名字,改变TickLabelInterpreter轴的价值“没有”

    f =情节(结果);f.CurrentAxes。TickLabelInterpreter =“没有”;

    图包含一个坐标轴对象。坐标轴对象与标题石灰与决策树模型包含一个类型的对象吧。

    查询的情节显示两个预测点,对应BlackboxFitted财产和SimpleModelFitted的属性结果

    重要性水平条形图显示了分类预测的值。石灰发现财务比率变量MVE_BVTDRE_TA查询点的重要预测因子。

    你可以阅读酒吧使用数据提示或长度栏属性。例如,您可以找到酒吧通过使用对象findobj功能和添加标签的结束酒吧使用文本函数。

    b = findobj (f,“类型”,“酒吧”);文本(b.YEndPoints + 0.001, b.XEndPoints字符串(b.YData))

    图包含一个坐标轴对象。坐标轴对象与决策树模型包含标题石灰3杆类型的对象,文本。

    或者,您可以显示表中的系数值与预测变量的名字。

    小鬼= b.YData;flipud (array2table(小鬼”,“RowNames”f.CurrentAxes.YTickLabel,“VariableNames”,{“预测的重要性”}))
    ans =2×1表预测重要性____________________ MVE_BVTD 0.088412 RE_TA 0.0018061

    训练一个回归模型,并创建一个石灰对象,使用一个线性的简单模型。当您创建一个石灰查询对象,如果不指定点和重要预测因子的数量,然后合成的软件生成样本数据集,但不适合一个简单的模型。使用目标函数适合为一个查询点适合一个简单的模型。然后显示拟合线性系数的简单模型通过使用目标函数情节

    加载carbig的数据集,其中包含测量汽车在1970年代末和1980年代初。

    负载carbig

    创建一个表包含预测变量加速度,气缸等等,以及响应变量英里/加仑

    台=表(加速度、汽缸、排量、马力、Model_Year重量,MPG);

    删除缺失值在一个训练集可以帮助减少内存消耗,加速训练fitrkernel函数。删除缺失值资源描述

    台= rmmissing(台);

    创建一个表的预测变量的反应变量资源描述

    tblX = removevars(资源描述,“英里”);

    火车的黑箱模型英里/加仑通过使用fitrkernel函数。

    rng (“默认”)%的再现性mdl = fitrkernel (tblX tbl.MPG,“CategoricalPredictors”[2 - 5]);

    创建一个石灰对象。指定一个数据集,因为预测指标mdl不包含预测数据。

    结果=石灰(mdl tblX)
    结果=石灰与属性:BlackboxModel: [1 x1 RegressionKernel] DataLocality:“全球”CategoricalPredictors:[2 5]类型:“回归”X: [392 x6表]QueryPoint: [] NumImportantPredictors: [] NumSyntheticData: 5000 SyntheticData: [5000 x6表)安装:x1双[5000]SimpleModel: [] ImportantPredictors: [] BlackboxFitted: [] SimpleModelFitted: []

    结果包含生成的合成数据集。SimpleModel属性是空的([])。

    适合第一次观察到的简单线性模型tblX。指定数量的重要预测因素找到3。

    :queryPoint = tblX (1)
    queryPoint =1×6表加速汽缸位移马力Model_Year重量_______ _____ _______ __________ __________ ______ 12 8 307 130 70 3504
    结果=适合(结果,queryPoint, 3);

    画出石灰对象结果通过使用对象的功能情节。显示现有的强调在任何预测的名字,改变TickLabelInterpreter轴的价值“没有”

    f =情节(结果);f.CurrentAxes。TickLabelInterpreter =“没有”;

    图包含一个坐标轴对象。坐标轴对象与标题石灰与线性模型包含一个对象类型的酒吧。

    查询的情节显示两个预测点,对应BlackboxFitted财产和SimpleModelFitted的属性结果

    水平条形图显示了简单的模型的系数值,按他们的绝对值。石灰发现马力,Model_Year,气缸查询点的重要预测因子。

    Model_Year气缸是有多个类别的分类预测。线性的简单模型,软件创建一个哑变量小于的数量为每个分类预测类别。条形图只显示最重要的哑变量。你可以检查其他的系数使用虚拟变量SimpleModel的属性结果。显示分类系数值,包括所有分类虚拟变量。

    [~,我]=排序(abs (results.SimpleModel.Beta),“下”);表(results.SimpleModel.ExpandedPredictorNames (I)”, results.SimpleModel.Beta(我),“VariableNames”,{“Exteded预测的名字”,“系数”})
    ans =17×2表Exteded预测名字系数__________________________ ___________ e-05 -3.4485{“马力”}{“Model_Year(74和70)的}-6.1279 e-07 {“Model_Year(80和70)的}-4.015 e-07 {“Model_Year(81和70)的}3.4176 e-07 {“Model_Year(82和70)的}-2.2483 e-07{的圆柱体(6和8)}-1.9024 e-07 {“Model_Year(76和70)的}1.8136 e-07{的圆柱体(5和8)}1.7461 e-07 {“Model_Year(71和70)的}1.558 e-07 {“Model_Year(75和70)的}1.5456 e-07 {“Model_Year(77和70)的}1.521 e-07 {“Model_Year(78和70)的}1.4272 e-07 {“Model_Year(72和70)的}6.7001 e-08 {“Model_Year(73和70)的}4.7214 e-08{的气缸(4和8)}4.5118 e-08 {“Model_Year(79和70)的}-2.2598 e-08⋮

    训练一个回归模型,并创建一个石灰使用一个函数处理的对象预测的函数模型。使用目标函数适合适合一个简单的模型指定查询点。然后显示拟合线性系数的简单模型通过使用目标函数情节

    加载carbig的数据集,其中包含测量汽车在1970年代末和1980年代初。

    负载carbig

    创建一个表包含预测变量加速度,气缸,等等。

    台=表(加速度、汽缸、排量、马力、Model_Year重量);

    火车的黑箱模型英里/加仑通过使用TreeBagger函数。

    rng (“默认”)%的再现性Mdl = TreeBagger(100台,英里/加仑,“方法”,“回归”,“CategoricalPredictors”[2 - 5]);

    石灰不支持TreeBagger直接对象,所以你不能指定第一个输入参数(黑箱模型)石灰作为一个TreeBagger对象。相反,您可以使用一个函数句柄预测函数。您还可以指定选项的预测函数使用名称-值参数的函数。

    创建函数句柄预测的函数TreeBagger对象Mdl。指定要使用的树索引数组1:50

    myPredict = @(台)预测(Mdl、台、“树”、1:50);

    创建一个石灰对象使用函数处理myPredict。当你指定一个黑箱模型作为处理函数,必须提供预测数据和指定“类型”名称-值参数。资源描述包括分类预测(油缸Model_Year)数据类型。默认情况下,石灰没有对变量数据类型分类预测。指定第二个(油缸)、五(Model_Year)作为分类预测变量。

    结果=石灰(myPredict、台、“类型”,“回归”,“CategoricalPredictors”[2 - 5]);

    适合第一次观察到的简单线性模型资源描述。显示现有的强调在任何预测的名字,改变TickLabelInterpreter轴的价值“没有”

    结果=适合(结果,台(1:),4);f =情节(结果);f.CurrentAxes。TickLabelInterpreter =“没有”;

    图包含一个坐标轴对象。坐标轴对象与标题石灰与线性模型包含一个对象类型的酒吧。

    石灰发现马力,位移,气缸,Model_Year作为重要的预测因子。

    更多关于

    全部展开

    算法

    全部展开

    引用

    [1]里贝罗,马可杜立欧,辛格(manmohan Singh)和c . Guestrin。“我为什么要相信你?:解释任何分类器的预测。”22日ACM SIGKDD国际研讨会论文集知识发现和数据挖掘,1135 - 44。旧金山,加利福尼亚州:ACM, 2016。

    [2]Świrszcz、Grzegorz Naoki安倍,Aurelie Lozano。“分组变量选择的正交匹配追踪和预测。”先进的神经信息处理系统(2009):1150 - 58。

    [3]Lozano, Aurelie C。,Grzegorz Świrszcz, and Naoki Abe. "Group Orthogonal Matching Pursuit for Logistic Regression."《第十四人工智能国际会议上和统计(2011):452 - 60。

    版本历史

    介绍了R2020b

    Baidu
    map