removeStopWords
从文档中删除停止词
描述
像“a”、“and”、“to”和“the”(被称为停止词)这样的单词会给数据添加噪音。使用此函数可以在分析前去除停止词。
该功能支持英语、日语、德语和韩语文本。学习如何使用removeStopWords
其他语言请参见语言的注意事项。
的停止词中删除newDocuments
= removeStopWords (文档
)tokenizedDocument
数组文档
。函数在默认情况下使用stopWords
功能根据语言细节的文档
和不区分大小写。
要删除自定义单词列表,请使用removeWords
函数。
方法给出的停止词列表,删除大小写匹配的停止词newDocuments
= removeStopWords (文档
、“IgnoreCase”错误)stopWords
函数。
提示
使用removeStopWords
在使用之前normalizeWords
函数作为removeStopWords
使用被此函数删除的信息。
例子
输入参数
输出参数
更多关于
算法
版本历史
介绍了R2018b