主要内容

removeLongWords

从文档或单词袋模型中删除长单词

描述

例子

newDocuments= removeLongWords (文档len删除长度的单词len或更大文档

例子

newBag= removeLongWords (len删除长度的单词len或者更大bagOfWords对象

例子

全部折叠

从文档中删除七个或七个以上字符的单词。

文档= tokenizedDocument (“一个短句的例子”);newDocument = removeLongWords(文档,7)
newDocument = tokenizedDocument: 4个token:一个短的

从单词袋模型中删除具有七个或七个以上字符的单词。

文件= tokenizedDocument ([...一个短句的例子“第二句短句”]);袋= bagOfWords(文件);newBag = removeLongWords(包,7)
newBag = bagOfWords有属性:计数:[2x5 double]词汇:[an" of" a" "short" "second"] NumWords: 5 NumDocuments: 2

输入参数

全部折叠

输入文档,指定为tokenizedDocument数组中。

输入单词袋模型,指定为bagOfWords对象。

要删除的最小单词长度,指定为正整数。函数删除带有的单词len或更大的字符。

输出参数

全部折叠

输出文档,作为tokenizedDocument数组中。

输出字袋模型,返回为bagOfWords对象。

版本历史

介绍了R2017b

Baidu
map