主要内容

containsNgrams

检查n-gram是否是文档的成员

    描述

    例子

    特遣部队= containsNgrams (文档,ngrams)返回1哪里有n-gram的文档匹配ngrams并返回0否则。

    tf = containsNgrams (文档,ngramsIgnoreCase =国旗)还指定在检查n-grams时是否忽略字母大小写。

    例子

    全部折叠

    创建一个标记化文档数组。

    文件= tokenizedDocument ([“一个短句的例子”“第二句短句”]);

    检查包含n-gram的文档(“a”“短”)

    tf = containsNgrams(文档,“一个”“短”])
    tf =2 x1逻辑阵列1 0

    输入参数

    全部折叠

    输入文档,指定为tokenizedDocument数组中。

    n克检查,指定为以下值之一:

    • 字符串数组

    • 特征向量

    • 字符向量的单元格数组

    • 模式数组

    如果ngrams是字符串数组,单元格数组,还是模式数组,那么它就有了大小numNgrams——- - - - - -maxN,在那里numNgramsn-g的个数和maxN是最大n-gram的长度。如果ngrams是字符向量,则表示单个单词(unigram)。

    的价值ngrams (i, j)对应于j的Th字语法。如果单词的数量n-gram小于maxN,那么剩下的条目th排ngrams必须是空的。

    如果ngrams包含多个n-grams或模式,则函数返回1在相应文档中出现n-grams的地方。

    例子:[" " "”;“榜样”;“例子”“”)

    数据类型:字符串|字符|细胞

    选项忽略大小写,指定为以下值之一:

    • 0() -将仅字母大小写不同的候选匹配视为不匹配。

    • 1(真正的-将仅字母大小写不同的候选匹配视为匹配。

    数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64|逻辑

    版本历史

    介绍了R2022a

    Baidu
    map