基于MATLAB的文本挖掘

从文本数据中获得见解

文本挖掘是指使用数据分析技术搜索文本数据中的模式,包括导入、探索、可视化以及对文本数据应用统计和机器学习算法。

人工阅读和分类大量文本对人类来说是无法完成的;MATLAB®可以有效且高效地将流程自动化,让您与数据交互并可视化数据,以识别其他方法无法发现的模式、趋势和复杂关系。

采用文本挖掘的方法进行推导定量统计对大型非结构化文本集、主题在文档中的使用主题建模,定性推理与情绪分析,以及其他有价值的信息。文本挖掘用于金融、制造业、信息技术和许多其他行业。应用程序包括:

  • 计算文档中单词或短语的出现频率:(见bag-of-words语法tfidf
  • 基于情绪自动分类评论,无论是积极的还是消极的
  • 根据传感器和文本日志数据制定预测性设备维护计划

要了解有关使用文本挖掘从文本数据中获得洞察力的更多信息,请参见文本分析工具箱™而且统计和机器学习工具箱™

参见:数据科学机器学习统计和机器学习工具箱自然语言处理情绪分析长短时记忆(LSTM)网络语法

Baidu
map