主要内容

addLemmaDetails

向文档添加令牌的引理形式

描述

使用addLemmaDetails向文档添加引理表单。

支持英文、日文、韩文文本。

例子

updatedDocuments= addLemmaDetails (文档添加引理细节文档并更新令牌详细信息。来获取引理细节updatedDocuments,使用tokenDetails

例子

updatedDocuments= addLemmaDetails (文档“DiscardKnownValues”,真的)丢弃以前计算的细节并重新计算它们。

提示

使用addLemmaDetails在使用之前较低的,normalizeWords函数作为addLemmaDetails使用被这些函数删除的信息。

例子

全部折叠

创建一个标记文档数组。

str = [...“狗在追猫。”“我在盖房子。”];文件= tokenizedDocument (str);

向文档添加引理细节addLemmaDetails.该函数将文本引理化,并将每个标记的引理形式添加到返回的表中tokenDetails.查看前几个令牌的更新令牌详细信息。

= addLemmaDetails文件(文档);tdetails = tokenDetails(文件);头(tdetails)
Token DocumentNumber LineNumber类型语言Lemma _______ ______________ __________ ___________ ________ _______ "The" 1 1个字母en "The" dogs" 1 1个字母en "dog" "ran" 1 1个字母en "run"在" 1 "后面1个字母en "在"The" 1 1个字母en "The" cat" 1 1个字母en " "cat" "。"1标点符号en "。""I" 2个字母en "I"

输入参数

全部折叠

输入文档,指定为tokenizedDocument数组中。

输出参数

全部折叠

更新的文件,作为一个返回tokenizedDocument数组中。获取令牌详细信息updatedDocuments,使用tokenDetails

版本历史

介绍了R2018b

Baidu
map