建模和预测
使用主题模型和单词嵌入开发预测模型
要查找集群并从高维文本数据集中提取特征,可以使用机器学习技术和模型,如LSA、LDA和单词嵌入。您可以将使用文本分析工具箱™创建的功能与来自其他数据源的功能结合起来。通过这些特性,您可以构建利用文本、数字和其他类型数据的机器学习模型。
功能
主题
分类和建模
- 创建简单预处理函数
这个例子展示了如何创建一个函数来清理和预处理文本数据以供分析。 - 创建简单的文本分类模型
这个例子展示了如何使用单词袋模型训练一个简单的文本分类器的词频计数。 - 使用文档嵌入对文档进行分类
这个例子展示了如何通过使用单词嵌入将文档转换为特征向量来训练文档分类器。 - 使用多词短语分析文本数据
此示例演示如何使用n-gram频率计数分析文本。 - 使用主题模型分析文本数据
这个例子展示了如何使用潜狄利克雷分配(LDA)主题模型来分析文本数据。 - 选择LDA模型的主题数量
这个例子展示了如何为潜在狄利克雷分配(LDA)模型决定一个合适的主题数量。 - 比较LDA解决者
这个例子展示了如何通过比较拟合优度和拟合模型所花费的时间来比较潜在的狄利克雷分配(LDA)求解器。 - 使用LDA模型可视化文档集群
这个例子展示了如何使用潜狄利克雷分配(Latent Dirichlet Allocation, LDA)主题模型和t-SNE图可视化文档的聚类。 - 可视化LDA主题相关性
这个例子展示了如何在潜狄利克雷分配(LDA)主题模型中分析主题之间的相关性。 - 可视化LDA主题和文档标签之间的相关性
这个示例展示了如何拟合潜狄利克雷分配(Latent Dirichlet Allocation, LDA)主题模型并可视化LDA主题与文档标签之间的相关性。 - 创建共生网络
此示例演示如何使用单词袋模型创建共现网络。
情感分析与关键词提取
- 分析文本中的情感
这个例子展示了如何使用价感字典和情感推理器(VADER)算法进行情感分析。 - 生成特定领域的情感词汇
这个例子展示了如何使用10-K和10-Q财务报告生成情绪分析的词汇库。 - 训练一个情感分类器
这个例子展示了如何使用一个带有注释的积极和消极情绪单词列表和一个预先训练的单词嵌入来训练一个用于情感分析的分类器。 - 使用RAKE从文本数据中提取关键字
这个例子展示了如何使用快速自动关键字提取(RAKE)从文本数据中提取关键字。 - 使用TextRank从文本数据中提取关键字
这个例子展示了如何使用TextRank从文本数据中提取关键字。
深度学习
- 使用深度学习对文本数据进行分类
这个例子展示了如何使用深度学习长短期记忆(LSTM)网络对文本数据进行分类。 - 用卷积神经网络对文本数据进行分类
这个例子展示了如何使用卷积神经网络对文本数据进行分类。 - 使用深度学习对内存不足的文本数据进行分类
这个例子展示了如何用深度学习网络使用转换后的数据存储对内存不足的文本数据进行分类。 - 利用注意的顺序对顺序的翻译
这个例子展示了如何使用循环序列到序列的编码器-解码器模型将十进制字符串转换为罗马数字。 - 基于深度学习的多标签文本分类
此示例演示如何对具有多个独立标签的文本数据进行分类。 - 使用深度学习生成文本(深度学习工具箱)
这个例子展示了如何训练深度学习长短期记忆(LSTM)网络来生成文本。 - 傲慢与偏见和MATLAB
这个例子展示了如何训练一个深度学习LSTM网络来使用字符嵌入生成文本。 - 使用深度学习逐字生成文本
这个例子展示了如何训练一个深度学习LSTM网络来逐字生成文本。 - 使用自定义训练循环分类文本数据
这个例子展示了如何使用深度学习双向长短时记忆(BiLSTM)网络和自定义训练循环对文本数据进行分类。 - 使用自动编码器生成文本
这个例子展示了如何使用自动编码器生成文本数据。 - 定义文本编码器模型函数
这个例子展示了如何定义文本编码器模型函数。 - 定义文本解码器模型函数
这个例子展示了如何定义一个文本解码器模型函数。 - 基于深度学习的语言翻译
这个例子展示了如何使用循环序列-序列编码器-解码器模型训练德语-英语翻译。