帮助中心帮助中心
检查n-gram是否是文档的成员
tf = containsNgrams(文档、ngrams)
tf = containsNgrams(文档、ngrams IgnoreCase =国旗)
例子
特遣部队= containsNgrams (文档,ngrams)返回1哪里有n-gram的文档匹配ngrams并返回0否则。
特遣部队= containsNgrams (文档,ngrams)
特遣部队
文档
ngrams
1
0
tf = containsNgrams (文档,ngramsIgnoreCase =国旗)还指定在检查n-grams时是否忽略字母大小写。
tf = containsNgrams (文档,ngramsIgnoreCase =国旗)
国旗
全部折叠
创建一个标记化文档数组。
文件= tokenizedDocument ([“一个短句的例子”“第二句短句”]);
检查包含n-gram的文档(“a”“短”)。
(“a”“短”)
tf = containsNgrams(文档,“一个”“短”])
tf =2 x1逻辑阵列1 0
tokenizedDocument
输入文档,指定为tokenizedDocument数组中。
模式
n克检查,指定为以下值之一:
字符串数组
特征向量
字符向量的单元格数组
模式数组
如果ngrams是字符串数组,单元格数组,还是模式数组,那么它就有了大小numNgrams——- - - - - -maxN,在那里numNgramsn-g的个数和maxN是最大n-gram的长度。如果ngrams是字符向量,则表示单个单词(unigram)。
numNgrams
maxN
的价值ngrams (i, j)对应于j的Th字我语法。如果单词的数量我n-gram小于maxN,那么剩下的条目我th排ngrams必须是空的。
ngrams (i, j)
j
我
如果ngrams包含多个n-grams或模式,则函数返回1在相应文档中出现n-grams的地方。
例子:[" " "”;“榜样”;“例子”“”)
[" " "”;“榜样”;“例子”“”)
数据类型:字符串|字符|细胞
字符串
字符
细胞
假
真正的
选项忽略大小写,指定为以下值之一:
0(假) -将仅字母大小写不同的候选匹配视为不匹配。
1(真正的-将仅字母大小写不同的候选匹配视为匹配。
数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64|逻辑
单
双
int8
int16
int32
int64
uint8
uint16
uint32
uint64
逻辑
介绍了R2022a
包含|containsWords|tokenizedDocument|removeNgrams|replaceNgrams|上下文|bagOfNgrams
包含
containsWords
removeNgrams
replaceNgrams
上下文
bagOfNgrams
你有了这个例子的修改版本。您想用您的编辑打开这个示例吗?
你点击了对应这个MATLAB命令的链接:
在MATLAB命令窗口中输入命令即可运行该命令。Web浏览器不支持MATLAB命令。
选择一个网站,在可用的地方获得翻译的内容,并查看当地的活动和优惠。根据您的位置,我们建议您选择:。
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳的网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
联系当地办事处