主要内容

groupcounts

描述

表数据

例子

G= groupcounts (Tgroupvars返回表或时间表的唯一分组变量组合T,每个组的成员数量,以及每个组所代表的数据在[0,100]范围内的百分比。中的变量行定义组groupvars它们有着相同的独特价值组合。输出表的每一行对应一个组。例如,G = groupcounts(T,"HealthStatus")返回一个表,其中包含变量中每个组的计数和百分比HealthStatus

例子

G= groupcounts (Tgroupvarsgroupbins指定bin行groupvars根据装箱方案groupbins分组之前。例如,G = groupcounts(T,"SaleDate","year")返回中所有销售的组计数和组百分比T每年按分组变量SaleDate

例子

G= groupcounts (___名称,值使用任何先前语法的一个或多个名称-值参数指定其他分组属性。例如,G = groupcounts(T,"Category1","IncludeMissingGroups",false)排除由缺少类型的数据组成的组分类所示<定义>Category1

数组的数据

B= groupcounts (一个返回向量、矩阵或单元格数组中每个组的成员数一个.中的列向量中的行定义组一个它们有着相同的独特价值组合。每一行B包含一个组的计数。

B= groupcounts (一个groupbins指定根据分组方案对数据进行分组groupbins分组之前。

B= groupcounts (___名称,值使用输入数组的前一种语法的一个或多个名称-值参数指定其他分组属性。

例子

BBG英国石油公司= groupcounts(一个___返回附加的组信息。BG唯一的分组向量组合是否对应于中的行B英国石油公司每组数据的百分比算在内吗B代表。百分比在[0,100]的范围内。

例子

全部折叠

根据表数据计算每一组的元素数量。

创建一个表T其中包含8个人的信息。

健康状态=类别([“穷”“好”“公平”“公平”“穷”“优秀”“好”“优秀”]);吸烟者=合乎逻辑的([1;0;0;1;1;0;0;1);权重= [176; 153; 131; 133; 119; 120; 140; 129]; T = table(HealthStatus,Smoker,Weight)
T =8×3表健康状况吸烟者体重____________ ____________差真176好假153中等假131中等真133差真119极好假120好假140极好真129

按健康状况将个体分组,并返回每组中的个体数量和百分比。

G1 = groupcounts(T,“HealthStatus”
G1 =4×3表健康状态组计数百分比____________ __________ _______优秀2 25一般2 25良好2 25贫穷2 25

根据健康状况和吸烟者状况将个体分组,并返回每组的个体数量和百分比。默认情况下,groupcounts抑制没有元素的组,因此不返回组变量值的某些惟一组合。

G2 = groupcounts(T,[“HealthStatus”“抽烟”])
G2 =6×4表健康状况吸烟者分组计数百分比____________ ______ __________ _______优秀假1 12.5优秀真1 12.5一般假1 12.5一般真1 12.5良好假2 25较差真2 25

要为每个组(包括那些没有元素的组)返回一行,请指定IncludeEmptyGroups作为真正的

G3 = groupcounts(T,[“HealthStatus”“抽烟”),“IncludeEmptyGroups”,真正的)
G3 =8×4表健康状态吸烟者分组计数百分比____________ ______ __________ _______优秀假1 12.5优秀真1 12.5一般假1 12.5一般真1 12.5良好假2 25良好真0 0差假0 0差真2 25

将数据按指定的箱子分组。

创建一个包含一个月内的销售信息的时间表。

TimeStamps = datetime([2017 3 4;2017 3 2;2017 3 15;2017 3 10;...2017 3 14;2017 3 31;2017 3 25;...2017 3 29;2017 3 21;2017 3 18]);利润= [2032 3071 1185 2587 1998 2899 3112 909 2619 3085]';ItemsSold = [14 13 8 5 10 16 8 6 7 11]';时间表(时间戳,利润,售出物品)
TT =10×2时间表时间戳利润项目出售___________ ______ _________ 04- 3 -2017 2032 14 02- 3 -2017 3071 13 15- 3 -2017 1185 8 10- 3 -2017 2587 5 14- 3 -2017 1998 10 31- 3 -2017 2899 16 25- 3 -2017 3112 8 29- 3 -2017 909 6 21- 2017 2619 7 18- 3 -2017 3085 11

根据销售的总商品计算组计数,将组分成商品编号的间隔。

G = groupcounts(TT,“ItemsSold”,[0 4 8 12 16])
G =3×3表disc_ItemsSold GroupCount百分比  ______________ __________ _______ [ 4, 8) 3 30[8、12)4 30 40(12、16)3

计算分组计数按天分类。

G = groupcounts(TT,“时间戳”“dayname”
G =5×3表dayname_TimeStamps GroupCount Percent __________________ _________________星期二2 20星期三2 20星期四1 10星期五2 20星期六3 30

确定向量中哪些元素出现多次。

创建一个值在1到5之间的列向量。

A = [1 1 2 2 3 5 3 3 1 4]';

确定向量中唯一的组并计数组成员。

[B,BG] = groupcounts(A)
B =5×13 2 3 1 1
BG =5×11 2 3 4 5

通过为计数大于1的组创建逻辑索引,确定向量中哪些元素出现多次。索引到组中以返回重复的向量元素。

副本= BG(B > 1)
重复的=3×11 2 3

计算根据健康状况和吸烟状况分组的一组人的分组计数。

将关于八个个体的信息存储为三个不同类型的向量。

健康状态=类别([“穷”“好”“公平”“公平”“穷”“优秀”“好”“优秀”]);吸烟者=合乎逻辑的([1;0;0;1;1;0;0;1);权重= [176; 153; 131; 133; 119; 120; 140; 129];

按健康状况和吸烟者状况分组,计算分组计数。指定三个输出也返回组BG群体计数百分比英国石油公司

BG是包含两个向量的单元格数组,它们在按行查看组的元素时描述组。例如,第一行BG {1}表示第一组中的个人具有健康状态优秀的的第一行BG {2}表示他们不吸烟。最后,英国石油公司包含每个组中对应组的成员的百分比BG

[B,BG,BP] = groupcounts({健康状态,吸烟者},“IncludeEmptyGroups”,真正的);B
B =8×11 1 1 1 2 0 0 2
BG {1}
ans =8 x1分类好,好,好,好,好,可怜,可怜
BG {2}
ans =8x1逻辑阵列0 1 0 1 0 1 1
英国石油公司
英国石油(BP) =8×112.5000 12.5000 12.5000 12.5000 25.0000 00 25.0000

输入参数

全部折叠

输入表格,指定为表格或时间表。

输入数组,指定为列向量、存储为矩阵的列向量组、列向量、字符行向量或矩阵的单元格数组。

对变量或向量进行分组,指定为该表中的选项之一。对于表或时间表输入数据,groupvars指示要使用哪些变量来计算数据中的组。未指定的其他变量groupvars不被操作,也不传递到输出。

选项 描述 例子
变量名

指定单个表变量名的字符向量或字符串标量

“Var1”

“Var1”

变量名的向量

字符向量或字符串数组的单元格数组,其中每个元素都是表变量名

{“Var1”“Var2”}

[" Var1”“Var2”)

可变指标的标量或向量

表变量索引的标量或向量

1

[1 3 5]

逻辑向量

一个逻辑向量,其每个元素都对应一个表变量,其中真正的包括相应的变量和不包括它

[真假真]

函数处理

接受表变量作为输入并返回逻辑标量的函数句柄

@isnumeric

vartype下标

方法生成的表下标vartype函数

vartype(数字)

例子:groupcounts (T,“Var3”)

bin方案,指定为以下选项之一:

  • “没有”,表示没有装箱

  • 二进制边的列表,指定为数值向量或datetime向量为datetime对变量或向量进行分组

  • 多个容器,指定为正整数标量

  • 时间持续时间,指定为类型的标量持续时间calendarDuration指示料仓宽度(用于datetime持续时间仅对变量或向量进行分组)

  • 列出每个分组变量或向量的分组方法的单元格数组

  • 时间箱datetime而且持续时间仅对变量或向量进行分组,指定为这些字符串之一。

    价值 描述 数据类型
    “第二”

    每个箱子是1秒。

    datetime而且持续时间
    “一分钟”

    每箱1分钟。

    datetime而且持续时间
    “小时”

    每箱1小时。

    datetime而且持续时间
    “天”

    每个垃圾桶是1个日历日。该值用于日光节约时间的转换。

    datetime而且持续时间
    “周” 每个垃圾桶是一个日历周。 datetime只有
    “月” 每个垃圾桶是一个日历月。 datetime只有
    “季” 每个垃圾箱是一个日历季度。 datetime只有
    “年”

    每个垃圾箱是一个日历年。这个值表示闰日。

    datetime而且持续时间
    “十年” 每个垃圾箱是10年(10个日历年)。 datetime只有
    “世纪” 每个箱子代表一个世纪(100历年)。 datetime只有
    “secondofminute”

    垃圾箱是0到59秒。

    datetime只有
    “minuteofhour”

    垃圾箱是从0到59分。

    datetime只有
    “hourofday”

    垃圾箱的时间是从0点到23点。

    datetime只有
    “dayofweek”

    垃圾箱是从1日到7日。一周的第一天是星期天。

    datetime只有
    “dayname” 箱子是完整的日名,比如“星期天” datetime只有
    “dayofmonth” 垃圾箱的天数是从1日到31日。 datetime只有
    “dayofyear” 垃圾箱的天数是从1到366。 datetime只有
    “weekofmonth” 垃圾箱是从1到6周。 datetime只有
    “weekofyear” 垃圾箱是从1周到54周。 datetime只有
    “monthname” 箱子是完整的月份名称,例如“1月” datetime只有
    “monthofyear”

    垃圾箱是从1到12个月。

    datetime只有
    “quarterofyear” 垃圾箱是1到4的四分之一。 datetime只有

当指定多个分组变量或向量时,可以提供应用于所有分组变量或向量的单个分组方法,或者提供包含每个分组变量或向量的分组方法的单元格数组,例如{"none",[0 2 4 Inf]}

名称-值参数

指定可选参数对为Name1 = Value1,…,以=家,在那里的名字参数名称和价值对应的值。名-值参数必须出现在其他参数之后,但对的顺序并不重要。

例子:G = groupcounts(T,groupvars,groupbins, includedge ="right")

在R2021a之前,名称和值之间用逗号隔开,并括起来的名字在报价。

例子:G = groupcounts(T,groupvars,groupbins," includedge ","right")

包含bin边,指定为任意“左”“正确”,表示包含bin间隔的哪一端。

此名称-值参数仅在groupbins,该值应用于所有分组变量或向量的所有分组方案。

丢失组指示符,指定为数字或逻辑1真正的)或0).的值IncludeMissingGroups真正的groupcounts显示由缺失值组成的组,例如.的值IncludeMissingGroupsgroupcounts不显示缺失的值组。

空组指示符,指定为数字或逻辑0)或1真正的).的值IncludeEmptyGroupsgroupcounts不显示包含零元素的组。的值IncludeEmptyGroups真正的groupcounts显示空组。

输出参数

全部折叠

输出表用于表或时间表输入数据,作为表返回。G包含计算的组、每个组中的元素数量以及由每个组计数表示的百分比。类返回的顺序对单个分组变量进行排序独特的函数“排序”选择。

组计数数组输入数据,作为列向量返回。B包含每个组中元素的数量。

组用于数组输入数据,作为列向量或列向量的单元格数组返回。类返回的顺序对单个分组向量进行排序独特的函数“排序”选择。

对于多个输入向量,BG包含长度相等的列向量的单元格数组。中所有向量的一行元素中包含每个组的信息BG.每个组映射到输出数组的对应行B

数组输入数据的组计数百分比,作为列向量返回。英国石油公司包含范围内的百分比[0, 100)对于每一组B

提示

  • 打了很多电话groupcounts,考虑将分组变量转换为类型分类逻辑在可能的情况下提高性能。例如,如果您有一个字符串数组分组变量(例如HealthStatus与元素“穷”“公平”“好”,“优秀”),您可以使用该命令将其转换为分类变量分类(HealthStatus)

扩展功能

版本历史

在R2019a中引入

全部展开

Baidu
map