主要内容

通用装箱资源管理器任务

装箱的探险家App支持以下任务:

导入数据

装箱的探险家使您可以直接从MATLAB中存储的数据开始导入数据®表或通过加载现有的creditscorecard对象。

从数据开始

直接从数据开始:

  1. 将信用记分卡数据放置在MATLAB工作空间中。数据必须在MATLAB表格中,其中每一列数据可以是以下数据类型之一:

    • 数字

    • 逻辑

    • 字符向量的单元格数组

    • 字符数组

    • 分类

    此外,表必须包含二进制响应变量。

  2. 开放装箱的探险家从MATLAB工具条:在应用程序选项卡,在计算金融,点击应用程序图标。

  3. 点击导入数据中的数据步骤1窗格中的“导入数据”窗口。

  4. 步骤2窗格中,设置变量类型对于每个预测器,根据需要。如果输入MATLAB表中包含一列为权重,来自步骤2窗格中,使用变量类型列时,单击下拉菜单进行选择权重.如果数据包含缺失值,则从步骤2窗格中,设置Bin缺少数据:是的.有关处理缺失数据的详细信息,请参见缺少值的信用记分卡建模

  5. 步骤3窗格中,选择初始分箱算法,单击导入数据.箱子为每个预测器绘制并显示。的单个预测图概述窗格中,该预测器图的详细信息显示在主窗格中,附加信息显示在本信息而且预测信息窗格。

从已有的开始creditscorecard对象

开始使用现有的creditscorecard对象:

  1. creditscorecard对象。创建creditscorecard对象,使用creditscorecard或点击出口装箱的探险家导出并保存creditscorecard对象到MATLAB工作区。

  2. 从MATLAB工具条打开分箱资源管理器:在应用程序选项卡,在计算金融,点击应用程序图标。

  3. 点击导入数据步骤1窗格的“导入数据”窗口中,选择creditscorecard对象。

  4. 步骤3窗格中,选择分箱算法。当使用现有的creditscorecard对象时,建议选择没有装箱选择。单击,显示预测图导入数据

    箱子为每个预测器绘制并显示。的单个预测图概述窗格中,预测器图显示在主窗格中,关联信息显示在本信息而且预测信息窗格。

MATLAB命令行使用数据或现有数据creditscorecard对象

开始装箱的探险家从MATLAB命令行:

  1. 放置现有的信用记分卡数据creditscorecard对象。

  2. 在MATLAB命令提示符中:

    • 输入binningExplorer(数据)binningExplorer(数据、名称、值)打开一个表在装箱的探险家通过指定表(数据)作为输入。

    • 输入binningExplorer (sc)要打开现有的creditscorecard对象中的装箱的探险家通过指定creditscorecard对象(sc)作为输入。

    箱子为每个预测器绘制并显示。的单个预测图概述窗格中,该预测器图形的详细信息显示在主窗格中,关联的详细信息显示在本信息而且预测信息窗格。

变更预测器类型

在您导入数据或creditscorecard对象进装箱的探险家,可以更改预测器类型。

  1. 点击任何预测图。所选预测器的名称显示在装箱的探险家将来发布下选择预测

    装箱的探险家工具条下显示所选预测器的预测器类型预测类型

  2. 要更改预测器类型,请单击预测类型选择:数字分类,或序数.预测图已更新,详细信息见本信息而且预测信息窗格也会更新。

更改一个或多个预测器的分箱算法

在您导入数据或creditscorecard对象进装箱的探险家,可以为单个预测器或多个预测器更改分箱算法。

  1. 中任意预测图概述窗格。所选预测图显示在主窗格中。

    为ResStatus选择带有蓝色轮廓的绘图

    提示

    当您选择一个预测图时,上面会出现一条状态消息本信息显示该预测器的最后一个装箱信息。使用此信息来确定哪个分类算法最近应用于单个预测图。

  2. 装箱的探险家工具条,单击选择单调分裂合并相等的频率,或平等的宽度.预测图随着算法的变化而更新。详情载于本信息而且预测信息窗格也会更新。

  3. 若要更改多个预测器的分箱算法,请通过使用多选多个预测器图Ctrl+点击或转变+单击以突出显示每个预测图与蓝色轮廓。

    多重选择的地块每个都有一个蓝色的轮廓

  4. 单击可选择单调分裂合并相等的频率,或平等的宽度.所有选择的预测图都更新了算法的变化。

更改分箱算法的算法选项

在您导入数据或creditscorecard对象进装箱的探险家,可以为单个预测器或多个预测器更改分箱算法选项。

  1. 中任意预测图概述窗格。预测器图显示为蓝色轮廓,并显示在主窗格中。

    为ResStatus选择带有蓝色轮廓的绘图

    提示

    当您选择带有蓝色轮廓的预测图时,上面会出现一条状态消息本信息显示该预测器的最后一个装箱信息。使用此信息来确定哪个分类算法最近应用于单个预测图。

  2. 装箱的探险家将来发布,点击选项控件的选项列表单调分裂合并相等的频率,平等的宽度算法。单击一个选项以打开关联的算法选项对话框。例如,点击单调的选择打开“单调”算法选项对话框

    使用“算法选项”对话框选择选项

  3. 在相关的算法选项对话框中:

    • 单调

      • 趋势,选择以下其中一项:

        • 汽车(默认)-自动判断WOE趋势是增加还是减少。

        • 增加-预计悲哀趋势将会增加。

        • 减少-寻找减少的悲哀趋势。

        的价值趋势并不一定反映由此产生的WOE曲线。的趋势Option告诉算法寻找增加或减少的趋势,但结果可能不会显示所需的趋势。例如,当数据实际上有增加的WOE趋势时,算法无法找到减少的趋势。有关的更多信息趋势选项,看到单调

        • 初始箱数,输入初始垃圾箱数量(默认为10).初始箱数必须为整数>2.仅用于数值预测器。

        • 类别排序,只用于分类预测,请选择以下其中一个:

          • 概率(默认)-类别按增加的概率值排序,定义为给定类别的“好”与“坏”观察值的比率。

          • 货物-类别按“好”值递增的顺序排序。

          • 坏事-类别按“坏”值递增的顺序排序。

          • 总数-类别按观察总数的增加值排序(“好”加“坏”)。

          • 没有一个—没有排序。在应用算法之前,类别的现有顺序是不变的。

          有关更多信息,请参见分类类别

    • 分裂

      • 测量,选择以下其中一项:基尼(默认),Chi2InfoValue,或

      • 宽容,指定一个容差值,超过该容差值,信息值中的增益必须为接受分割。默认为1的军医

      • 意义,只供Chi2测量,为卡方统计量指定显著性水平阈值,超过该阈值就会发生分裂。值在区间内[0, 1].默认是0.9(90%显著性水平)。

      • 本分布,为

        • MinBad—最小数目nn> =0)每箱的坏数。默认值为1,以避免纯垃圾箱。

        • MaxBad—最大数量nn> =0)每箱的坏数。默认值为

        • MinGood—最小数目nn> =0)每箱货物的数量。默认值为1,以避免纯垃圾箱。

        • MaxGood—最大数量nn> =0)每箱货物的数量。默认值为

        • MinCount—最小数目nn> =0)每个bin的观测值。默认值为1,以避免空箱。

        • MaxCount—最大数量nn> =0)每个bin的观测值。默认值为

        • MaxNumBins—最大数量nn> =2)由分裂产生的箱。默认值为5

      • 初始数字箱,指定一个决定数字(n>0)预测器在分裂前最初被放入的垃圾箱。仅对数值预测器有效。默认是50

      • 类别排序,只用于分类预测器,选择一个值:

        • 货物-类别按“好”值递增的顺序排序。

        • 坏事-类别按“坏”值递增的顺序排序。

        • 几率-(默认)类别按增加的赔率值排序,定义为给定类别的“好”与“坏”观察值的比率。

        • 总数-类别按观察总数的递增值排序(“好”加“坏”)。

        • 没有一个—没有排序。在应用算法之前,类别的现有顺序是不变的。类别的现有顺序可以在类别分组可选输出中看到bininfo.)

        有关更多信息,请参见分类类别

    • 合并

      • 测量,选择以下其中一项:Chi2(默认),基尼InfoValue,或

      • 宽容,指定信息值和熵统计发生合并的最小阈值。有效值在区间内(0.1).默认是1 e - 3

      • 意义,指定卡方统计量的显著性水平阈值,低于该阈值将发生合并。值在区间内[0, 1].默认是0.9(90%显著性水平)。

      • 本分布,指定以下内容:

        • MinNumBins—最小数目nn> =2)由合并产生的容器。默认值为2

        • MaxNumBins—最大数量nn> =2)由合并产生的容器。默认值为5

      • 初始箱数,指定一个决定数字(n>0)预测器在合并前最初被放入的容器。仅对数值预测器有效。默认是50

      • 类别排序,仅用于分类预测器。选择一个值:

        • 货物-类别按“好”值递增的顺序排序。

        • 坏事-类别按“坏”值递增的顺序排序。

        • 几率-(默认)类别按增加的赔率值排序,定义为给定类别的“好”与“坏”观察值的比率。

        • 总数-类别按观察总数的递增值排序(“好”加“坏”)。

        • 没有一个—没有排序。在应用算法之前,类别的现有顺序是不变的。类别的现有顺序可以在类别分组可选输出中看到bininfo.)

        有关更多信息,请参见分类类别

    • 相等的频率

      • 箱数,输入箱数。默认为5,且箱数必须为正数。

      • 类别排序,选择以下其中一项:

        • 概率(默认)-类别按增加的概率值排序,定义为给定类别的“好”与“坏”观察值的比率。

        • 货物-类别按“好”值递增的顺序排序。

        • 坏事-类别按“坏”值递增的顺序排序。

        • 总数-类别按观察总数的增加值排序(“好”加“坏”)。

        • 没有一个—没有排序。在应用算法之前,类别的现有顺序是不变的。

        请注意

        你可以使用类别排序只使用分类预测器。

    • 平等的宽度

      • 箱数,输入箱数。默认为5箱子的数量必须是正数。

      • 类别排序,选择以下其中一项:

        • 概率(默认)-类别按增加的概率值排序,定义为给定类别的“好”与“坏”观察值的比率。

        • 货物-类别按“好”值递增的顺序排序。

        • 坏事-类别按“坏”值递增的顺序排序。

        • 总数-类别按观察总数的增加值排序(“好”加“坏”)。

        • 没有一个—没有排序。在应用算法之前,类别的现有顺序是不变的。

        请注意

        你可以使用类别排序只使用分类预测器。

    点击好吧.所选预测图随着算法选项的变化而更新。详情载于本信息而且预测信息窗格也会更新。此外,更新后的算法选项适用于该算法对中所述的其他预测器的任何后续应用更改一个或多个预测器的分箱算法

  4. 若要更改多个预测器的分箱算法选项,请使用Ctrl+点击或转变+单击以突出显示每个预测图与蓝色轮廓。

    多重选择的地块每个都有一个蓝色的轮廓

  5. 装箱的探险家将来发布,点击选项控件的选项列表单调分裂合并相等的频率,平等的宽度算法。单击一个选项以打开关联的算法选项对话框。从相应的算法选项对话框中进行选择,然后单击好吧.所选的预测图随着算法的变化而更新。

拆分箱子的数字预测器

在您导入数据或creditscorecard对象进装箱的探险家,您可以为数字预测器分割箱子。

  1. 中的任意数字预测图概述窗格。预测器图显示在主窗格中。

    为ResStatus选择带有蓝色轮廓的绘图

  2. 装箱的探险家将来发布,分裂按钮已启用。在主窗格中,单击一个存储区以应用分裂操作。若要取消选择一个bin,请使用Ctrl+点击。

    选择一个bin以启用Split按钮

  3. 装箱的探险家将来发布,边缘文本框显示所选箱子边缘的值。点击分裂,打开“分裂”对话框。

    使用“分割”对话框指定一个容器的边

  4. 使用箱数控件将选定的栏位拆分为多个栏位。点击好吧完成拆分操作。

    所选数字预测器的图将使用新的bin信息进行更新。详情载于本信息而且预测信息窗格也会更新。

分类预测器的分裂箱

在您导入数据或creditscorecard对象进装箱的探险家,您可以为分类预测器分割箱子。

  1. 中的任意分类预测器图概述窗格。预测器图显示在主窗格中。

    选择带有蓝色轮廓的EmpStatus图

  2. 在主窗格中,单击一个bin以启用分裂按钮。若要取消选择一个bin,请使用Ctrl+点击。

    选择EmpStatus bin显示蓝色轮廓

    装箱的探险家将来发布,点击分裂打开所选bin的Split对话框。

    请注意

    分裂按钮在选定的bin中有多个唯一类别时启用。

    使用“拆分”对话框指定对选定的bin进行拆分

    使用箱数控件将选定的栏位拆分为多个栏位。

    使用“分割”对话框上的箭头控件,可以控制要将选定的数据仓分割到的每个数据仓的内容。

  3. 点击好吧完成拆分操作。

    所选分类预测器的图将使用新的bin信息进行更新。详情载于本信息而且预测信息窗格也会更新。

手动分箱以合并数值或分类预测器的分箱

在您导入数据或creditscorecard对象进装箱的探险家,您可以拆分或合并预测箱。

  1. 中任意预测图概述窗格。所选预测图显示在主窗格中。

    为ResStatus选择带有蓝色轮廓的绘图

  2. 在主窗格中,要合并容器,请使用选择两个或多个容器进行合并Ctrl+点击或转变+点击多选箱子显示蓝色轮廓。要更改选定的存储区,请使用Ctrl+单击取消选择bin。

    请注意

    合并按钮仅当选择多个bin时才激活。对于数字或序数预测器,只能合并相邻的箱子。非相邻的箱子可以合并为分类预测器。

    选择两个或多个要合并的箱子

  3. 点击合并完成合并操作。所选预测器的图将使用新的bin信息进行更新。详情载于本信息而且预测信息窗格也会更新。

为单个预测器更改Bin边界

在您导入数据或creditscorecard对象进装箱的探险家,您可以为单个预测器更改bin边界。

  1. 中的任意数字预测图概述窗格。所选预测图显示为蓝色轮廓,预测图显示在主窗格中。

  2. 在主窗格中,单击以选择要在其中更改容器尺寸的特定容器。所选的箱子显示为蓝色轮廓。

    选择一个数据仓以使用手动数据仓来更改数据仓的尺寸

  3. 装箱的探险家将来发布,边缘文本框显示所选箱子边缘的值。

    指定所选bin的边

    属性中的值边缘文本框以更改所选数据箱的尺寸。

  4. 单击主窗格完成操作。预测器的图将使用更新后的容器的维度信息进行更新。详情载于本信息而且预测信息窗格也会更新。

更改多个预测器的Bin边界

在您导入数据或creditscorecard对象进装箱的探险家,您可以更改应用于一个或多个预测器的算法,也可以重新定义箱子的数量。

  1. 概述窗格中,单击任何预测图。预测器图显示为蓝色轮廓。

    为ResStatus选择带有蓝色轮廓的绘图

    或者,通过使用选择两个或多个预测器Ctrl+点击或转变+单击以多选预测器显示蓝色轮廓。

    使用CTRL +单击选择两个或多个预测图

  2. 装箱的探险家将来发布,点击选项控件的选项列表单调分裂合并相等的频率,平等的宽度算法。单击一个选项以打开关联的算法选项对话框。从相应的算法选项对话框中进行选择,然后单击好吧.所选预测图会因算法的更改而更新,所选预测图也会使用新的bin信息更新。详情载于本信息而且预测信息窗格也会更新。

设置显示选项

装箱的探险家有选项显示预测图和图选项和相关的表显示在本信息

绘图选项

  1. 装箱的探险家工具条项用于绘图选项,选择以下预测图选项:

    • 没有标签(默认)

    • 本计算

    • % Bin级别

    • %数据级别

    • 总计数%

  2. 所选标签应用于所有预测图。

表选项

中显示的预测器信息,可以设置表格显示选项本信息

  1. 装箱的探险家工具条项用于表列,选择以下任何一项:

    • 几率

    • 有祸了

    • InfoValue

    • 基尼

    • Chi2

    • 成员(选项为类别预测器启用)

  2. 选中后,这些选项将应用于中显示的信息的所有预测器本信息

导出并保存Binning

装箱的探险家使您能够导出并保存您的信用记分卡分箱定义到creditscorecard对象。

  1. 点击出口然后点击出口计分卡并提供creditscorecard对象名称。的creditscorecard对象保存到MATLAB工作区。

    请注意

    如果导出先前存在的creditscorecard对象适合(使用fitmodel),所有合适的设置creditscorecard对象丢失。你必须重新运行fitmodel关于更新creditscorecard对象。

  2. 重新打开先前保存的文件creditscorecard对象,单击导入数据并选择creditscorecard对象的步骤1窗格中的“导入数据”窗口。

排除装箱故障

本主题展示了使用时的一些结果装箱的探险家与信用记分卡,需要排除故障。有关创建和发展信用记分卡的整体流程的详细信息,请参见宾宁资源管理器概述而且使用分类资源管理器创建信用记分卡

数值预测器转换为分类预测器不能正确显示分割数据

当您将具有数百个值的数值预测器(例如,连续数据)转换为类别数据时,得到的数据具有数百个类别。下面的例子说明了这个场景。

负载CreditCardData

打开装箱的探险家然后选择数值预测器AMBalance概述窗格。在“装箱资源管理器”工具栏中,将预测器类型更改为分类

装箱的探险家工具条,单击分裂.“分裂”对话框如下所示:

拆分对话框的数字预测器AMBalance与太多的箱子

预测器的类别太多,无法正确显示。

解决方案:如果你有一个分类预测器,有大量的类别,使用算法的选择将该预测器的分箱算法更改为相等的频率,与箱数设置为One hundred.(或另一个更小的值)。“分裂”对话框即可正常显示。

AMBalance的分裂对话框,箱子的数量设置为100

预测图出现扭曲

当使用装箱的探险家,如果您导入的数据以前没有被分类,并且您选择没有装箱从“导入数据”窗口,得到的图形可能会失真。例如,如果您将以下数据集加载到MATLAB工作空间中并使用装箱的探险家来导入数据没有装箱,下面的图显示为TmAtAddress预测。

负载CreditCardData

没有被丢弃的TmAtAddress的图

解决方案:当导入数据之前未被归档时,选择单调从导入数据窗口。下面的图显示TmAtAddress预测。

使用单调分箱算法分箱后的TmAtAddress图

另请参阅

应用程序

相关的例子

更多关于

外部网站

Baidu
map