通用装箱资源管理器任务
的装箱的探险家App支持以下任务:
导入数据
装箱的探险家使您可以直接从MATLAB中存储的数据开始导入数据®表或通过加载现有的creditscorecard
对象。
从数据开始
直接从数据开始:
将信用记分卡数据放置在MATLAB工作空间中。数据必须在MATLAB表格中,其中每一列数据可以是以下数据类型之一:
数字
逻辑
字符向量的单元格数组
字符数组
分类
此外,表必须包含二进制响应变量。
开放装箱的探险家从MATLAB工具条:在应用程序选项卡,在计算金融,点击应用程序图标。
点击导入数据中的数据步骤1窗格中的“导入数据”窗口。
从步骤2窗格中,设置变量类型对于每个预测器,根据需要。如果输入MATLAB表中包含一列为
权重
,来自步骤2窗格中,使用变量类型列时,单击下拉菜单进行选择权重.如果数据包含缺失值,则从步骤2窗格中,设置Bin缺少数据:来是的.有关处理缺失数据的详细信息,请参见缺少值的信用记分卡建模.从步骤3窗格中,选择初始分箱算法,单击导入数据.箱子为每个预测器绘制并显示。的单个预测图概述窗格中,该预测器图的详细信息显示在主窗格中,附加信息显示在本信息而且预测信息窗格。
从已有的开始creditscorecard
对象
开始使用现有的creditscorecard
对象:
把
creditscorecard
对象。创建creditscorecard
对象,使用creditscorecard
或点击出口在装箱的探险家导出并保存creditscorecard
对象到MATLAB工作区。从MATLAB工具条打开分箱资源管理器:在应用程序选项卡,在计算金融,点击应用程序图标。
点击导入数据从步骤1窗格的“导入数据”窗口中,选择
creditscorecard
对象。从步骤3窗格中,选择分箱算法。当使用现有的
creditscorecard
对象时,建议选择没有装箱选择。单击,显示预测图导入数据.箱子为每个预测器绘制并显示。的单个预测图概述窗格中,预测器图显示在主窗格中,关联信息显示在本信息而且预测信息窗格。
从MATLAB命令行使用数据或现有数据creditscorecard
对象
开始装箱的探险家从MATLAB命令行:
放置现有的信用记分卡数据
creditscorecard
对象。在MATLAB命令提示符中:
输入
binningExplorer(数据)
或binningExplorer(数据、名称、值)
打开一个表在装箱的探险家通过指定表(数据
)作为输入。输入
binningExplorer (sc)
要打开现有的creditscorecard
对象中的装箱的探险家通过指定creditscorecard
对象(sc
)作为输入。
箱子为每个预测器绘制并显示。的单个预测图概述窗格中,该预测器图形的详细信息显示在主窗格中,关联的详细信息显示在本信息而且预测信息窗格。
变更预测器类型
在您导入数据或creditscorecard
对象进装箱的探险家,可以更改预测器类型。
点击任何预测图。所选预测器的名称显示在装箱的探险家将来发布下选择预测.
在装箱的探险家工具条下显示所选预测器的预测器类型预测类型.
要更改预测器类型,请单击预测类型选择:
数字
,分类
,或序数
.预测图已更新,详细信息见本信息而且预测信息窗格也会更新。
更改一个或多个预测器的分箱算法
在您导入数据或creditscorecard
对象进装箱的探险家,可以为单个预测器或多个预测器更改分箱算法。
中任意预测图概述窗格。所选预测图显示在主窗格中。
提示
当您选择一个预测图时,上面会出现一条状态消息本信息显示该预测器的最后一个装箱信息。使用此信息来确定哪个分类算法最近应用于单个预测图。
在装箱的探险家工具条,单击选择单调,分裂,合并,相等的频率,或平等的宽度.预测图随着算法的变化而更新。详情载于本信息而且预测信息窗格也会更新。
若要更改多个预测器的分箱算法,请通过使用多选多个预测器图Ctrl+点击或转变+单击以突出显示每个预测图与蓝色轮廓。
单击可选择单调,分裂,合并,相等的频率,或平等的宽度.所有选择的预测图都更新了算法的变化。
更改分箱算法的算法选项
在您导入数据或creditscorecard
对象进装箱的探险家,可以为单个预测器或多个预测器更改分箱算法选项。
中任意预测图概述窗格。预测器图显示为蓝色轮廓,并显示在主窗格中。
提示
当您选择带有蓝色轮廓的预测图时,上面会出现一条状态消息本信息显示该预测器的最后一个装箱信息。使用此信息来确定哪个分类算法最近应用于单个预测图。
在装箱的探险家将来发布,点击选项控件的选项列表单调,分裂,合并,相等的频率,平等的宽度算法。单击一个选项以打开关联的算法选项对话框。例如,点击单调的选择打开“单调”算法选项对话框.
在相关的算法选项对话框中:
单调
为趋势,选择以下其中一项:
汽车(默认)-自动判断WOE趋势是增加还是减少。
增加-预计悲哀趋势将会增加。
减少-寻找减少的悲哀趋势。
的价值趋势并不一定反映由此产生的WOE曲线。的趋势Option告诉算法寻找增加或减少的趋势,但结果可能不会显示所需的趋势。例如,当数据实际上有增加的WOE趋势时,算法无法找到减少的趋势。有关的更多信息趋势选项,看到单调.
为初始箱数,输入初始垃圾箱数量(默认为
10
).初始箱数必须为整数>2
.仅用于数值预测器。为类别排序,只用于分类预测,请选择以下其中一个:
概率(默认)-类别按增加的概率值排序,定义为给定类别的“好”与“坏”观察值的比率。
货物-类别按“好”值递增的顺序排序。
坏事-类别按“坏”值递增的顺序排序。
总数-类别按观察总数的增加值排序(“好”加“坏”)。
没有一个—没有排序。在应用算法之前,类别的现有顺序是不变的。
有关更多信息,请参见分类类别
分裂
为测量,选择以下其中一项:基尼(默认),Chi2,InfoValue,或熵.
为宽容,指定一个容差值,超过该容差值,信息值中的增益必须为接受分割。默认为
1的军医
.为意义,只供Chi2测量,为卡方统计量指定显著性水平阈值,超过该阈值就会发生分裂。值在区间内
[0, 1]
.默认是0.9
(90%显著性水平)。为本分布,为
MinBad—最小数目n(n> =
0
)每箱的坏数。默认值为1
,以避免纯垃圾箱。MaxBad—最大数量n(n> =
0
)每箱的坏数。默认值为正
.MinGood—最小数目n(n> =
0
)每箱货物的数量。默认值为1
,以避免纯垃圾箱。MaxGood—最大数量n(n> =
0
)每箱货物的数量。默认值为正
.MinCount—最小数目n(n> =
0
)每个bin的观测值。默认值为1
,以避免空箱。MaxCount—最大数量n(n> =
0
)每个bin的观测值。默认值为正
.MaxNumBins—最大数量n(n> =
2
)由分裂产生的箱。默认值为5
.
为初始数字箱,指定一个决定数字(n>0)预测器在分裂前最初被放入的垃圾箱。仅对数值预测器有效。默认是
50
.为类别排序,只用于分类预测器,选择一个值:
货物-类别按“好”值递增的顺序排序。
坏事-类别按“坏”值递增的顺序排序。
几率-(默认)类别按增加的赔率值排序,定义为给定类别的“好”与“坏”观察值的比率。
总数-类别按观察总数的递增值排序(“好”加“坏”)。
没有一个—没有排序。在应用算法之前,类别的现有顺序是不变的。类别的现有顺序可以在类别分组可选输出中看到
bininfo
.)
有关更多信息,请参见分类类别
合并
为测量,选择以下其中一项:Chi2(默认),基尼,InfoValue,或熵.
为宽容,指定信息值和熵统计发生合并的最小阈值。有效值在区间内
(0.1)
.默认是1 e - 3
.为意义,指定卡方统计量的显著性水平阈值,低于该阈值将发生合并。值在区间内
[0, 1]
.默认是0.9
(90%显著性水平)。为本分布,指定以下内容:
MinNumBins—最小数目n(n> =
2
)由合并产生的容器。默认值为2
.MaxNumBins—最大数量n(n> =
2
)由合并产生的容器。默认值为5
.
为初始箱数,指定一个决定数字(n>0)预测器在合并前最初被放入的容器。仅对数值预测器有效。默认是
50
.为类别排序,仅用于分类预测器。选择一个值:
货物-类别按“好”值递增的顺序排序。
坏事-类别按“坏”值递增的顺序排序。
几率-(默认)类别按增加的赔率值排序,定义为给定类别的“好”与“坏”观察值的比率。
总数-类别按观察总数的递增值排序(“好”加“坏”)。
没有一个—没有排序。在应用算法之前,类别的现有顺序是不变的。类别的现有顺序可以在类别分组可选输出中看到
bininfo
.)
有关更多信息,请参见分类类别
相等的频率
为箱数,输入箱数。默认为
5
,且箱数必须为正数。为类别排序,选择以下其中一项:
概率(默认)-类别按增加的概率值排序,定义为给定类别的“好”与“坏”观察值的比率。
货物-类别按“好”值递增的顺序排序。
坏事-类别按“坏”值递增的顺序排序。
总数-类别按观察总数的增加值排序(“好”加“坏”)。
没有一个—没有排序。在应用算法之前,类别的现有顺序是不变的。
请注意
你可以使用类别排序只使用分类预测器。
平等的宽度
为箱数,输入箱数。默认为
5
箱子的数量必须是正数。为类别排序,选择以下其中一项:
概率(默认)-类别按增加的概率值排序,定义为给定类别的“好”与“坏”观察值的比率。
货物-类别按“好”值递增的顺序排序。
坏事-类别按“坏”值递增的顺序排序。
总数-类别按观察总数的增加值排序(“好”加“坏”)。
没有一个—没有排序。在应用算法之前,类别的现有顺序是不变的。
请注意
你可以使用类别排序只使用分类预测器。
点击好吧.所选预测图随着算法选项的变化而更新。详情载于本信息而且预测信息窗格也会更新。此外,更新后的算法选项适用于该算法对中所述的其他预测器的任何后续应用更改一个或多个预测器的分箱算法.
若要更改多个预测器的分箱算法选项,请使用Ctrl+点击或转变+单击以突出显示每个预测图与蓝色轮廓。
在装箱的探险家将来发布,点击选项控件的选项列表单调,分裂,合并,相等的频率,平等的宽度算法。单击一个选项以打开关联的算法选项对话框。从相应的算法选项对话框中进行选择,然后单击好吧.所选的预测图随着算法的变化而更新。
拆分箱子的数字预测器
在您导入数据或creditscorecard
对象进装箱的探险家,您可以为数字预测器分割箱子。
中的任意数字预测图概述窗格。预测器图显示在主窗格中。
在装箱的探险家将来发布,分裂按钮已启用。在主窗格中,单击一个存储区以应用分裂操作。若要取消选择一个bin,请使用Ctrl+点击。
在装箱的探险家将来发布,边缘文本框显示所选箱子边缘的值。点击分裂,打开“分裂”对话框。
使用箱数控件将选定的栏位拆分为多个栏位。点击好吧完成拆分操作。
所选数字预测器的图将使用新的bin信息进行更新。详情载于本信息而且预测信息窗格也会更新。
分类预测器的分裂箱
在您导入数据或creditscorecard
对象进装箱的探险家,您可以为分类预测器分割箱子。
中的任意分类预测器图概述窗格。预测器图显示在主窗格中。
在主窗格中,单击一个bin以启用分裂按钮。若要取消选择一个bin,请使用Ctrl+点击。
在装箱的探险家将来发布,点击分裂打开所选bin的Split对话框。
请注意
的分裂按钮在选定的bin中有多个唯一类别时启用。
使用箱数控件将选定的栏位拆分为多个栏位。
使用“分割”对话框上的箭头控件,可以控制要将选定的数据仓分割到的每个数据仓的内容。
点击好吧完成拆分操作。
所选分类预测器的图将使用新的bin信息进行更新。详情载于本信息而且预测信息窗格也会更新。
手动分箱以合并数值或分类预测器的分箱
在您导入数据或creditscorecard
对象进装箱的探险家,您可以拆分或合并预测箱。
中任意预测图概述窗格。所选预测图显示在主窗格中。
在主窗格中,要合并容器,请使用选择两个或多个容器进行合并Ctrl+点击或转变+点击多选箱子显示蓝色轮廓。要更改选定的存储区,请使用Ctrl+单击取消选择bin。
请注意
的合并按钮仅当选择多个bin时才激活。对于数字或序数预测器,只能合并相邻的箱子。非相邻的箱子可以合并为分类预测器。
点击合并完成合并操作。所选预测器的图将使用新的bin信息进行更新。详情载于本信息而且预测信息窗格也会更新。
为单个预测器更改Bin边界
在您导入数据或creditscorecard
对象进装箱的探险家,您可以为单个预测器更改bin边界。
中的任意数字预测图概述窗格。所选预测图显示为蓝色轮廓,预测图显示在主窗格中。
在主窗格中,单击以选择要在其中更改容器尺寸的特定容器。所选的箱子显示为蓝色轮廓。
在装箱的探险家将来发布,边缘文本框显示所选箱子边缘的值。
属性中的值边缘文本框以更改所选数据箱的尺寸。
单击主窗格完成操作。预测器的图将使用更新后的容器的维度信息进行更新。详情载于本信息而且预测信息窗格也会更新。
更改多个预测器的Bin边界
在您导入数据或creditscorecard
对象进装箱的探险家,您可以更改应用于一个或多个预测器的算法,也可以重新定义箱子的数量。
从概述窗格中,单击任何预测图。预测器图显示为蓝色轮廓。
或者,通过使用选择两个或多个预测器Ctrl+点击或转变+单击以多选预测器显示蓝色轮廓。
在装箱的探险家将来发布,点击选项控件的选项列表单调,分裂,合并,相等的频率,平等的宽度算法。单击一个选项以打开关联的算法选项对话框。从相应的算法选项对话框中进行选择,然后单击好吧.所选预测图会因算法的更改而更新,所选预测图也会使用新的bin信息更新。详情载于本信息而且预测信息窗格也会更新。
设置显示选项
装箱的探险家有选项显示预测图和图选项和相关的表显示在本信息.
绘图选项
从装箱的探险家工具条项用于绘图选项,选择以下预测图选项:
没有标签(默认)
本计算
% Bin级别
%数据级别
总计数%
所选标签应用于所有预测图。
表选项
中显示的预测器信息,可以设置表格显示选项本信息.
从装箱的探险家工具条项用于表列,选择以下任何一项:
几率
有祸了
InfoValue
熵
基尼
Chi2
成员(选项为类别预测器启用)
选中后,这些选项将应用于中显示的信息的所有预测器本信息.
导出并保存Binning
装箱的探险家使您能够导出并保存您的信用记分卡分箱定义到creditscorecard
对象。
排除装箱故障
本主题展示了使用时的一些结果装箱的探险家与信用记分卡,需要排除故障。有关创建和发展信用记分卡的整体流程的详细信息,请参见宾宁资源管理器概述而且使用分类资源管理器创建信用记分卡.
数值预测器转换为分类预测器不能正确显示分割数据
当您将具有数百个值的数值预测器(例如,连续数据)转换为类别数据时,得到的数据具有数百个类别。下面的例子说明了这个场景。
负载CreditCardData
打开装箱的探险家然后选择数值预测器AMBalance从概述窗格。在“装箱资源管理器”工具栏中,将预测器类型更改为分类.
从装箱的探险家工具条,单击分裂.“分裂”对话框如下所示:
预测器的类别太多,无法正确显示。
解决方案:如果你有一个分类预测器,有大量的类别,使用算法的选择将该预测器的分箱算法更改为相等的频率,与箱数设置为One hundred.
(或另一个更小的值)。“分裂”对话框即可正常显示。
预测图出现扭曲
当使用装箱的探险家,如果您导入的数据以前没有被分类,并且您选择没有装箱从“导入数据”窗口,得到的图形可能会失真。例如,如果您将以下数据集加载到MATLAB工作空间中并使用装箱的探险家来导入数据没有装箱,下面的图显示为TmAtAddress预测。
负载CreditCardData
解决方案:当导入数据之前未被归档时,选择单调从导入数据窗口。下面的图显示TmAtAddress预测。