containsNgrams

检查n-gram是否是文档的成员

在页面中全部折叠

语法

tf = containsNgrams(文档、ngrams)

tf = containsNgrams(文档、ngrams IgnoreCase =国旗)

描述

例子

特遣部队= containsNgrams (文档,ngrams)返回1哪里有n-gram的文档匹配ngrams并返回0否则。

tf = containsNgrams (文档,ngramsIgnoreCase =国旗)还指定在检查n-grams时是否忽略字母大小写。

例子

全部折叠

检查N-Gram是否是Document的成员

打开生活的脚本

创建一个标记化文档数组。

文件= tokenizedDocument ([“一个短句的例子”“第二句短句”]);

检查包含n-gram的文档(“a”“短”)。

tf = containsNgrams(文档,“一个”“短”])

tf =2 x1逻辑阵列1 0

输入参数

全部折叠

`文档`- - - - - -输入文档
`tokenizedDocument`数组

输入文档，指定为tokenizedDocument数组中。

`ngrams`- - - - - -字格来检查
字符串数组|特征向量|字符向量的单元格数组|`模式`数组

n克检查，指定为以下值之一:

字符串数组
特征向量
字符向量的单元格数组
模式数组

如果ngrams是字符串数组，单元格数组，还是模式数组，那么它就有了大小numNgrams——- - - - - -maxN,在那里numNgramsn-g的个数和maxN是最大n-gram的长度。如果ngrams是字符向量，则表示单个单词(unigram)。

的价值ngrams (i, j)对应于j的Th字我语法。如果单词的数量我n-gram小于maxN，那么剩下的条目我th排ngrams必须是空的。

如果ngrams包含多个n-grams或模式，则函数返回1在相应文档中出现n-grams的地方。

例子:[" " "”;“榜样”;“例子”“”)

数据类型:字符串|字符|细胞

`国旗`- - - - - -选项忽略大小写
`0`(`假`)(默认)|`1`(`真正的`)

选项忽略大小写，指定为以下值之一:

0(假) -将仅字母大小写不同的候选匹配视为不匹配。
1(真正的-将仅字母大小写不同的候选匹配视为匹配。

数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64|逻辑

版本历史

介绍了R2022a

另请参阅