阻止

Reducción de palabras a su raíz

起源于una técnica de normalización de texto en el自然的过程阙减拉斯帕拉布拉斯阿苏raíz。La técnica palabras的词根和词根,palabras的词根válidas。Por ejemplo, luego de aplicar, las palabras " pensando ", " pensado " y " pensamiento " se reducirán a " pensa "。

Por lo general, se emplea en:

  • Búsqueda de información,简单的方法raíz se usage zan como sinónimos para ampliar los criterios de búsqueda
  • 应用程序ingeniería对量纲计算的简化,donde stem ayuda一个简化的悬臂式计算的方法rastrearán y utilizarán在机器学习的算法模型

波特公式métodos词干公式más词干公式inglés我们的基本规则heurísticas简单。Este método es rápido, pero no siempre preciso。这是我的想法,这是我的想法,这是我的想法,我的想法,这是我的想法。

Otro método relacionado con, pero más sofisticado, es lalematizacion.En comparación con stem, la lematización:

  • 使用词汇análisis morfológico, mientras que使用reglas heurísticas简单
  • 天堂天堂,天堂天堂,天堂天堂,天堂天堂válidas

Las differencias entre lematización y stem se indican a continuación。

Palabra Lematizacion 阻止
Pensando 思考 Pensa
Pensado 思考 Pensa
Pensamiento Pensamiento Pensa

Para obtener más información清醒词干cómo crear modelos con datos de texto, consulte文本分析工具箱

También puede consultar estos temas:自然的过程Análisis情感word2vecn-gramaminería de textos con MATLAB数据科学深度学习深度学习工具箱™统计和机器学习工具箱™

Baidu
map