Análisis de emociones en textos en español mediante traducción Automática y modelos BERT Multilingües

Análisis de emociones en textos en español

Autores/as

DOI:

https://doi.org/10.5281/zenodo.17525359

Palabras clave:

Análisis de emociones, Procesamiento de lenguaje natural (PLN), Modelos preentrenados (BERT)

Resumen

El análisis de emociones en textos escritos mediante técnicas de procesamiento de lenguaje natural (PLN) representa un área de investigación en crecimiento con aplicaciones clave en sectores como la salud mental, marketing, educación y sistemas de recomendación. Este artículo propone un enfoque sistemático basado en un pipeline de programación en lenguaje natural que permite analizar textos en español mediante modelos de clasificación emocional originalmente entrenados en inglés. Dado que los modelos más avanzados para la detección de emociones, como BERT (Bidirectional Encoder Representations from Transformers), han sido desarrollados principalmente en inglés, se implementa una solución basada en la traducción automática de los textos desde el español al inglés utilizando el modelo Helsinki-NLP/opus-mt-es-en. Una vez traducidos, los textos se procesan con el modelo DistilRoBERTa ajustado para clasificación emocional (j-hartmann/emotion-english-distilroberta-base) que evalúa la probabilidad de pertenencia a categorías emocionales como alegría, tristeza, ira, miedo, amor y sorpresa. El pipeline se implementa en Python, utilizando librerías especializadas como Hugging Face Transformers para la traducción y clasificación, y Scikit-learn para la evaluación estadística del desempeño del modelo. Las predicciones se comparan con etiquetas reales, y se utilizan métricas como la matriz de confusión, precisión, sensibilidad, especificidad, exactitud (accuracy), y F1-score (macro y ponderado) para validar la efectividad del sistema.

Los resultados muestran una tasa de exactitud del 81%, lo que confirma que, a pesar de las limitaciones idiomáticas, el uso de traducción automática junto con modelos robustos permite obtener resultados confiables y replicables en el análisis de emociones en textos en español. Este estudio demuestra el potencial de integrar herramientas de PLN multilingües en soluciones prácticas que requieren análisis afectivo en múltiples lenguas

Biografía del autor/a

Abraham Jorge Jiménez Alfaro, TECNM/TES Ecatepec

Profesor Investigador

Griselda Cortes Barrera, Tecnológico Nacional de México/TES Ecatepec

Laboratorio Nacional

Norma Karen Valencia Vázquez , TECNM/TESCHI

Norma-Karen Valencia-Vázquez

https://orcid.org/0000-0002-6000-5925

Jhacer-Kharen Ruiz-Garduño , TECNM/ITZ

Jhacer-Kharen Ruiz-Garduño 

https://orcid.org/0000-0002-3003-8072

Claudia-Teresa González-Ramírez , TECNM/ITZ

Claudia-Teresa González-Ramírez 

https://orcid.org/0000-0002-1159-0769

Citas

Cañete, J., Chaperon, G., Fuentes, R., Ho, J.-H., Kang, H., & Pérez, J. (2020). Spanish pre-trained BERT model and evaluation data. Proceedings of the Practical ML for Developing Countries Workshop at ICLR 2020.

Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019, 4171–4186.

Dos Santos, C. N., & Gatti, M. (2014). Deep Convolutional Neural Networks for Sentiment Analysis of Short Texts. Proceedings of the 25th International Conference on Computational Linguistics (COLING 2014), 69–78.

Hartmann, J. (2022). j-hartmann/emotion-english-distilroberta-base. Hugging Face.

Descargas

Publicado

06-11-2025

Cómo citar

Jiménez Alfaro, A. J., Cortes Barrera, G., Valencia Vázquez , N. K., Ruiz-Garduño , J.-K., & González-Ramírez , C.-T. (2025). Análisis de emociones en textos en español mediante traducción Automática y modelos BERT Multilingües: Análisis de emociones en textos en español . RICT Revista De Investigación Científica, Tecnológica E Innovación, 3(6), 1–7. https://doi.org/10.5281/zenodo.17525359

Artículos más leídos del mismo autor/a