文本数据准备
导入文本数据到MATLAB中®并对其进行预处理以进行分析
功能
主题
进口
- 从文件中提取文本数据
这个例子展示了如何从文本、HTML、Microsoft®Word、PDF、CSV和Microsoft Excel®文件中提取文本数据,并将其导入MATLAB®中进行分析。 - 解析HTML和提取文本内容
这个例子展示了如何解析HTML代码并从特定元素中提取文本内容。 - 用于文本分析的数据集
发现用于各种文本分析任务的数据集。
预处理
- 为分析准备文本数据
这个例子展示了如何创建一个函数来清理和预处理文本数据以供分析。 - 分析包含表情符号的文本数据
这个例子展示了如何分析包含表情符号的文本数据。 - 文档中的正确拼写
这个例子展示了如何使用Hunspell来纠正文档中的拼写。 - 创建扩展字典的拼写纠正
这个例子展示了如何创建一个用于拼写纠正的Hunspell扩展字典。 - 使用编辑距离搜索器创建自定义拼写校正功能
这个例子展示了如何使用编辑距离搜索器和已知单词的词汇表来纠正拼写。 - 使用语法依赖分析分析句子结构
这个例子展示了如何使用语法依赖分析从句子中提取信息。