主要内容

removeShortWords

从文档或单词袋模型中删除短单词

描述

例子

newDocuments= removeShortWords (文档len删除长度的单词len或更少文档

例子

newBag= removeShortWords (len删除长度的单词len或者更少bagOfWords对象

例子

全部折叠

从文档中删除两个或两个以下字符的单词。

文档= tokenizedDocument (“一个短句的例子”);newDocument = removeShortWords(文档(2)
newDocument = tokenizedDocument: 3个token:示例短句

从单词包模型中删除具有两个或更少字符的单词。

文件= tokenizedDocument ([...一个短句的例子“第二句短句”]);袋= bagOfWords(文件);newBag = removeShortWords(袋、2)
newBag = bagOfWords有属性:计数:[2x4 double]词汇:["example" "short" "sentence" "second"] NumWords: 4 NumDocuments: 2

输入参数

全部折叠

输入文档,指定为tokenizedDocument数组中。

输入单词袋模型,指定为bagOfWords对象。

要删除的最大单词长度,指定为正整数。函数删除带有的单词len或更少的字符。

输出参数

全部折叠

输出文档,作为tokenizedDocument数组中。

输出字袋模型,返回为bagOfWords对象。

版本历史

介绍了R2017b

Baidu
map