主要内容

wordCloudCounts

计算单词云创建的单词数

描述

例子

T= wordCloudCounts (str中的文本进行标记和预处理str用于字云创建并返回一个表T单词和频率的计数。支持英文、日文、德文、韩文文本。

例子

全部折叠

从中提取文本sonnets.txt使用extractFileText

str = extractFileText(“sonnets.txt”);

查看第一首十四行诗。

I = strfind(str,“我”);Ii = strfind(str,“二世”);Start = i(1);Fin = ii(1);extractBetween (str,开始,fin-1)
我们希望从最美丽的生灵身上得到更多,这样,美的玫瑰永远不会凋谢,而成熟的人随着时间的流逝,他温柔的继承者可以继承他的记忆:但你,你自己的明亮的眼睛,用自我的燃料喂养你光明的火焰,把富足的地方变成饥荒,把你自己当作敌人,把你可爱的自己当作太残酷的敌人:你现在是世界上的新鲜装饰品,是华丽春天的唯一传令者,在你自己的花蕾里埋藏你的财宝,温柔的野蛮人在吝啬中虚度光阴:可怜这个世界吧,否则这个贪吃的人,就会以坟墓和你来吃掉这个世界应得的东西。”

标记和预处理十四行诗文本,并创建一个词频计数表。

T = wordCloudCounts(str);头(T)
字数______ _____ "你的" 281 "你的" 235 "爱" 188 "你的" 162 "眼睛" 90 " 88 "使" 63 "我的" 63

输入参数

全部折叠

输入文本,指定为字符串数组、字符向量或字符向量的单元格数组。

对于字符串输入,wordcloud而且wordCloudCounts函数使用英语、日语、德语和韩语标记化、停止单词删除和单词规范化。

例子:["一个短文件的例子";"第二个短文件"]

数据类型:字符串|字符|细胞

输出参数

全部折叠

单词计数表按重要性排序。表格有以下列:

字的字符串标量。
单词在文档中出现的次数。函数将仅因格而异或根据词干有共同词干的单词计数分组normalizeWords.例如,函数将计数分组为“walk”、“Walking”、“Walking”和“walks”。

更多关于

全部折叠

语言的注意事项

对于字符串输入,wordcloud而且wordCloudCounts函数使用英语、日语、德语和韩语标记化、停止单词删除和单词规范化。

版本历史

在R2017b中引入

Baidu
map