帮助中心帮助中心
从文档或单词袋模型中删除短单词
newDocuments = removeShortWords(文档、兰)
newBag = removeShortWords(袋、兰)
例子
newDocuments= removeShortWords (文档,len)删除长度的单词len或更少文档.
newDocuments= removeShortWords (文档,len)
newDocuments
文档
len
newBag= removeShortWords (袋,len)删除长度的单词len或者更少bagOfWords对象袋.
newBag= removeShortWords (袋,len)
newBag
袋
bagOfWords
全部折叠
从文档中删除两个或两个以下字符的单词。
文档= tokenizedDocument (“一个短句的例子”);newDocument = removeShortWords(文档(2)
newDocument = tokenizedDocument: 3个token:示例短句
从单词包模型中删除具有两个或更少字符的单词。
文件= tokenizedDocument ([...一个短句的例子“第二句短句”]);袋= bagOfWords(文件);newBag = removeShortWords(袋、2)
newBag = bagOfWords有属性:计数:[2x4 double]词汇:["example" "short" "sentence" "second"] NumWords: 4 NumDocuments: 2
tokenizedDocument
输入文档,指定为tokenizedDocument数组中。
输入单词袋模型,指定为bagOfWords对象。
要删除的最大单词长度,指定为正整数。函数删除带有的单词len或更少的字符。
输出文档,作为tokenizedDocument数组中。
输出字袋模型,返回为bagOfWords对象。
介绍了R2017b
removeWords|stopWords|removeLongWords|normalizeWords|tokenizedDocument|bagOfWords|bagOfNgrams
removeWords
stopWords
removeLongWords
normalizeWords
bagOfNgrams
您有了这个示例的修改版本。您想用您的编辑打开这个示例吗?
你点击了一个对应于这个MATLAB命令的链接:
在MATLAB命令窗口中输入命令来运行该命令。Web浏览器不支持MATLAB命令。
选择一个网站,在可用的地方获得翻译的内容,并查看当地的活动和优惠。根据您的地理位置,我们建议您选择:.
您也可以从以下列表中选择网站:
选择中国网站(中文或英文)以获得最佳的网站表现。其他MathWorks国家网站没有针对从您的位置访问进行优化。
联系当地办事处