Reducción de palabras a su raíz
起源于una técnica de normalización de texto en el自然的过程阙减拉斯帕拉布拉斯阿苏raíz。La técnica palabras的词根和词根,palabras的词根válidas。Por ejemplo, luego de aplicar, las palabras " pensando ", " pensado " y " pensamiento " se reducirán a " pensa "。
Por lo general, se emplea en:
- Búsqueda de información,简单的方法raíz se usage zan como sinónimos para ampliar los criterios de búsqueda
- 应用程序ingeniería对量纲计算的简化,donde stem ayuda一个简化的悬臂式计算的方法rastrearán y utilizarán在机器学习的算法模型
波特公式métodos词干公式más词干公式inglés我们的基本规则heurísticas简单。Este método es rápido, pero no siempre preciso。这是我的想法,这是我的想法,这是我的想法,我的想法,这是我的想法。
Otro método relacionado con, pero más sofisticado, es lalematizacion.En comparación con stem, la lematización:
- 使用词汇análisis morfológico, mientras que使用reglas heurísticas简单
- 天堂天堂,天堂天堂,天堂天堂,天堂天堂válidas
Las differencias entre lematización y stem se indican a continuación。
Palabra | Lematizacion | 阻止 |
---|---|---|
Pensando | 思考 | Pensa |
Pensado | 思考 | Pensa |
Pensamiento | Pensamiento | Pensa |
Para obtener más información清醒词干cómo crear modelos con datos de texto, consulte文本分析工具箱.
解雇程序
软件参考
También puede consultar estos temas:自然的过程,Análisis情感,word2vec,n-grama,minería de textos con MATLAB,数据科学,深度学习,深度学习工具箱™,统计和机器学习工具箱™