从文本数据中获得见解
文本挖掘是指使用数据分析技术搜索文本数据中的模式,包括导入、探索、可视化以及对文本数据应用统计和机器学习算法。
人工阅读和分类大量文本对人类来说是无法完成的;MATLAB®可以有效且高效地将流程自动化,让您与数据交互并可视化数据,以识别其他方法无法发现的模式、趋势和复杂关系。
- 计算文档中单词或短语的出现频率:(见bag-of-words,语法,tfidf)
- 基于情绪自动分类评论,无论是积极的还是消极的
- 根据传感器和文本日志数据制定预测性设备维护计划
要了解有关使用文本挖掘从文本数据中获得洞察力的更多信息,请参见文本分析工具箱™而且统计和机器学习工具箱™.