Redes Neuronales Recurrentes para la detección de noticias falsas cuentas Bot en Twitter

Sandra Paulina Castillo Cárdenas; Francisco Jacob Ávila Camacho

doi:10.5281/zenodo.14194198

Autores/as

Sandra Paulina Castillo Cárdenas Universidad Da Vinci https://orcid.org/0009-0008-5834-6043
Francisco Jacob Ávila Camacho Tecnológico Nacional de México / TESE Ecatepec https://orcid.org/0000-0002-0086-5827

DOI:

https://doi.org/10.5281/zenodo.14194198

Palabras clave:

noticias falsas, bots, twitter, redes sociales

Resumen

Este artículo presenta el desarrollo e implementación de un modelo de Inteligencia Artificial (IA) para la detección de cuentas bot y noticias falsas en Twitter (ahora X). El modelo combina técnicas de Análisis de Sentimiento (AS), Procesamiento de Lenguaje Natural (PLN), Redes Neuronales Simples (RNS) y Redes Neuronales Recurrentes (RNR), diseñadas para identificar bots a nivel de tweet y diferenciar entre noticias verdaderas y falsas. El objetivo principal es proporcionar un sistema capaz de detectar cuentas operadas por bots de manera rápida y eficiente, al mismo tiempo que genera un repositorio y un catálogo de medios que diseminan información falsa. El proyecto fue desarrollado en la plataforma Google Colab, utilizando bibliotecas especializadas para el análisis de datos y el procesamiento de texto en Python, como NLTK, TextBlob y spaCy. El modelo también integra la herramienta Botometer, un algoritmo basado en IA que facilita la identificación de bots mediante el análisis de patrones de comportamiento y contenido en cuentas sospechosas. El sistema emplea algoritmos de aprendizaje automático para procesar grandes volúmenes de tweets, y su implementación permite la detección automatizada de bots en tiempo real. Los resultados obtenidos muestran una precisión del 75.96% en la detección de bots, validando la eficacia de las Redes Neuronales Recurrentes utilizadas en el modelo. Adicionalmente, se analizaron métricas como retweets y likes, lo que evidencia la funcionalidad y viabilidad del enfoque propuesto para combatir la desinformación en redes sociales

Biografía del autor/a

Sandra Paulina Castillo Cárdenas, Universidad Da Vinci

Ingeniera en Sistemas Computacionales con Maestría en Ingeniería en Sistemas Computacionales ambas del Tecnológico de Estudios Superiores de Ecatepec, realizando estudios de Doctorado en Sistemas Computacionales en la Universidad Da Vinci. Se ha desempeñado en las áreas de reconocimiento de patrones, con los proyectos de investigación en relación a la detección de noticias falsas y cuentas tipo bot.

Francisco Jacob Ávila Camacho, Tecnológico Nacional de México / TESE Ecatepec

Ingeniero en electrónica y sistemas digitales egresado de la Universidad Autónoma Metropolitana Unidad Azcapotzalco, tiene el grado de maestría en ingeniería en sistemas computacionales por parte del Tecnológico de Estudios Superiores de Ecatepec, cuenta con una maestría en ciencias en administración de negocios de la Escuela Superior de Comercio y Administración del IPN y el doctorado en sistemas computacionales por la Universidad Da Vinci, actualmente se desempeña como profesor investigador en el Tecnológico de Estudios Superiores de Ecatepec, ha impartido ponencias en congresos nacionales e internacionales y publicado en revistas y memorias de congresos, actualmente es responsable y líder de varios proyectos de investigación y desarrollo tecnológico con y sin financiamiento, Coordinador del Centro de Cooperación Academia Industria del TESE. Sus principales líneas de investigación se centran en inteligencia artificial, reconocimiento de patrones, minería de datos y sistemas embebidos, modelos y algoritmos de navegación autónoma, visión por computadora, entre otras.

Citas

Angel Rosales Quiroga, M., Vilariño Ayala, D., Pinto, D., Tovar, M., & Beltrán, B. (2016). Análisis de sentimientos basado en aspectos: un modelo para identificar la polaridad de críticas de usuario Aspect Based Sentiment Analysis: A Model for Identification of User Reviews Polarity. In Research in Computing Science (Vol. 115). Retrieved from http://www.lke.buap.mx/

Antonio, J., Ortiz, P., Por, D., Forcada, M. L., & Rubio, J. C. (2002a). MODELOS PREDICTIVOS BASADOSEN REDES NEURONALES RECURRENTESDE TIEMPO DISCRETO.

Antonio, J., Ortiz, P., Por, D., Forcada, M. L., & Rubio, J. C. (2002b). MODELOS PREDICTIVOS BASADOSEN REDES NEURONALES RECURRENTESDE TIEMPO DISCRETO.

Banks, D., Jordan, M., Kannan, R., Ré, C., Tibshirani, R. J., & Wasserman, L. (n.d.). Springer Series in the Data Sciences Series Editors. Retrieved from http://www.springer.com/series/13852

Bonet Cruz, I., Salazar Martinez, S., Abed, A. R., Abalo, G., & Lorenzo, M. M. G. (2007). Redes neuronales recurrentes para el análisis de secuencias. Revista Cubana de Ciencias Informáticas , 48–57.

Burgos Gonzalo, P. (2021). Análisis y detección de bots en Twitter. Retrieved from www.uam.es

Cao, D. (n.d.). Cloud Computing Based Plant Classifiers and Their Real-Life Research Applications. Retrieved from www.slayte.com

Carlos, J., & Sande, S. (n.d.). Análisis de sentimientos en Twitter.

Chu, Z., Gianvecchio, S., Wang, H., & Jajodia, S. (2012). Detecting automation of Twitter accounts: Are you a human, bot, or cyborg? IEEE Transactions on Dependable and Secure Computing, 9(6), 811–824. https://doi.org/10.1109/TDSC.2012.75

Cresci, S., di Pietro, R., Petrocchi, M., Spognardi, A., & Tesconi, M. (2015). Fama en venta: detección eficiente de seguidores falsos en Twitter. https://doi.org/10.1016/j.dss.2015.09.003

Cresci, S., Spognardi, A., Petrocchi, M., Tesconi, M., & Pietro, R. di. (2017). The paradigm-shift of social spambots: Evidence, theories, and tools for the arms race. 26th International World Wide Web Conference 2017, WWW 2017 Companion, 963–972. International World Wide Web Conferences Steering Committee. https://doi.org/10.1145/3041021.3055135

de Lucio, J. (2021). Estimación adelantada del crecimiento regional mediante redes neuronales LSTM. Investigaciones Regionales, 2021(49), 45–64. https://doi.org/10.38191/iirr-jorr.21.007

de Trabajo, D., & Arana, C. (2021a). REDES NEURONALES RECURRENTES: ANÁLISIS DE LOSMODELOS ESPECIALIZADOS EN DATOS SECUENCIALES. Retrieved from www.cema.edu.ar/publicaciones/doc_trabajo.html

de Trabajo, D., & Arana, C. (2021b). UNIVERSIDAD DEL CEMA Buenos Aires Argentina Serie. Retrieved from www.cema.edu.ar/publicaciones/doc_trabajo.html

Deng, L., & Yu, D. (2013). Deep learning Methods and applications. Foundations and Trends in Signal Processing, Vol. 7, pp. 197–387. Now Publishers Inc. https://doi.org/10.1561/2000000039

Dickerson, J. P., Kagan, V., & Subrahmanian, V. S. (2014). Using Sentiment to Detect Bots on Twitter: Are Humans more Opinionated than Bots? https://doi.org/10.1109/ASONAM.2014.6921650

Efthimion1, F. G., Payne1, S., & Profers2, N. (2018). Técnicas supervisadas de detección de bots de aprendizaje automático para identificar bots de redes sociales en Twitter. Retrieved from https://scholar.smu.edu/datasciencereview/vol1/iss2/5

Ernesto del Valle Martín, L. U. I. de la R. (UNIR),Luis de la F. V. P. U. I. de la R. (n.d.). Sentiment analysis methods for politics and hate.

Esther, M., & Martínez, R. (n.d.). Distinción de bots y humanos en Twitter con Inteligencia Artificial.

Feng, S., Tan, Z., Wan, H., Wang, N., Chen, Z., Zhang, B., … Luo, M. (n.d.). TwiBot-22: Towards Graph-Based Twitter Bot Detection. Retrieved from https://twibot22.github.io/.

Ferrara, E., Varol, O., Davis, C., Menczer, F., & Flammini, A. (2016). The rise of social bots. Communications of the ACM, 59(7), 96–104. https://doi.org/10.1145/2818717

Garcia-Moreno, V. E., Nacional, U., Marcos, S., & Alvarez-Caicedo, C. R. (2021). Análisis de sentimientos en la predicción de resultados de elecciones presidenciales. https://doi.org/10.15381/risi.v14i1.21866

Géron, A. (2017). Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. Retrieved from http://oreilly.com/safari

Grau, I., Nápoles, G., Bonet, I., & García, M. M. (2013). Backpropagation through Time Algorithm for Training Recurrent Neural Networks using Variable Length Instances. 17(1), 15–24.

Henríquez, C., Ferran, P., Hurtado, L.-F., & Guzmán, J. (2017). Análisis de sentimientos a nivel de aspecto usando ontologías y aprendizaje automático. 49–56. Retrieved from http://www.redalyc.org/articulo.oa?id=515754427005

Juan Lulián Cea Morán. (2020). Redes neuronales recurrentes para la generación automática de música.

Khan, M. T., Durrani, M., Ali, A., Inayat, I., Khalid, S., & Khan, K. H. (2016, December 1). Análisis de sentimientos y el lenguaje natural complejo. Complex Adaptive Systems Modeling, Vol. 4. Springer. https://doi.org/10.1186/s40294-016-0016-9

Kumar D, Mr. G. (2020). Spam Detection in Twitter. International Journal for Research in Applied Science and Engineering Technology, 8(7), 783–787. https://doi.org/10.22214/ijraset.2020.30337

Latin, I., & Transactions, A. (2022). Sentiment Analysis of Tweets Related to SUS Before and During COVID-19 Pandemic (Vol. 20).

Liu, X. (2019). A big data approach to examining social bots on Twitter. Journal of Services Marketing, 33(4), 369–379. https://doi.org/10.1108/JSM-02-2018-0049

Makridakis, S., Spiliotis, E., & Assimakopoulos, V. (2018). Statistical and Machine Learning forecasting methods: Concerns and ways forward. PLoS ONE, 13(3). https://doi.org/10.1371/journal.pone.0194889

Maqueda Bojorquez, D. E. (n.d.). DE REDES NEURONALES RECURRENTES A MODELOS DE LENGUAJE: LA EVOLUCIÓN DEL PLN EN LA GENERACIÓN DE TEXTOS. Retrieved from https://www.ties.unam.mx/

Mckinney, W. (2010). Data Structures for Statistical Computing in Python.

Minnich, A., Chavoshi, N., Koutra, D., & Mueen, A. (2017). BotWalk: exploración adaptativa eficiente de las redes de bots de Twitter. Proceedings of the 2017 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining, ASONAM 2017, 467–474. Association for Computing Machinery, Inc. https://doi.org/10.1145/3110025.3110163

Montañés, R., Aznar, R., & del Hoyo, R. (2018). Aplicación de un modelo híbrido de aprendizaje profundo para el Análisis de Sentimiento en Twitter. 51–56.

Nasukawa, T., & Yi, J. (2003). Análisis de sentimiento: captura de la favorabilidad mediante el procesamiento del lenguaje natural. Proceedings of the 2nd International Conference on Knowledge Capture, K-CAP 2003, 70–77. Association for Computing Machinery, Inc. https://doi.org/10.1145/945645.945658

Navarro, L. F. S. (2022). APROBACIÓN DEL PRESIDENTE DE PERÚ BASADO EN ANÁLISIS DESENTIMIENTOS EN TWITTER. TECHNO Review. International Technology, Science and Society Review / Revista Internacional de Tecnología, Ciencia y Sociedad, 11. https://doi.org/10.37467/revtechno.v11.4396

Olabe, X. B. (n.d.). Redes neuronales artificiales y sus aplicaciones (p. 4). p. 4. Bilbao.

Parselis, M. (2014). Función e innovación social: el caso Twitter Social function and social innovation: the Twitter case. In Revista CTS, no (Vol. 25). Retrieved from http://www.lanacion.com.ar/

Paul J. Werbos. (1990). Backpropagation Througt Time: What It Does and How to Do It. Proceedings of the IEEE, 78, 1550–1560.

Pereira-Kohatsu, J. C., Quijano-Sánchez, L., Liberatore, F., & Camacho-Collados, M. (2019). Detecting and monitoring hate speech in twitter. Sensors (Switzerland), 19(21). https://doi.org/10.3390/s19214654

Pérez Guerrero Sevilla, J., de, J., por, T., & Pino Mejías, R. (n.d.). REDES RECURRENTES.

Rafael Sabino Parmezan, A., A Souza, V. M., & A P A Batista, G. E. (2019). Supplementary Material for Evaluation of Statistical and Machine Learning Models for Time Series Prediction: Identifying the State-of-the-art and the Best Conditions for the Use of Each Model.

Sepp Hochreiter. (n.d.). Long Short-Term Memory.

Sezer, O. B., Gudelek, M. U., & Ozbayoglu, A. M. (2020). Financial time series forecasting with deep learning: A systematic literature review: 2005–2019. Applied Soft Computing Journal, 90. https://doi.org/10.1016/j.asoc.2020.106181

Sharma, S., & Kumar Sharma, V. (2020). Análisis de Delitos Cibernéticos en Redes Sociales. BSSS Journal of Computer. https://doi.org/10.51767/jc1104

Subrahmanian, V. (2016). El DESAFÍO DEL BOT DE TWITTER DE DARPA. 49(6), 38–46. https://doi.org/10.1109/MC.2016.183

Subrahmanian, V., Azaria, A., Durst, S., Kagan, V., Galstyan, A., Lerman, K., … Menczer, F. (2016). THE DARPA TWITTER BOT CHALLENGE. Pacific Social. https://doi.org/10.1109/MC.2016.183

Udge, G., Mohite, M., Bendre, S., Birnagal, Y., & Wankhede, D. (2019). Statistical Analysis for Twitter Spam Detection. International Journal of Scientific Research in Science, Engineering and Technology, 624–629. https://doi.org/10.32628/ijsrset1962170

Van Der Walt, E., & Eloff, J. (2018). Using Machine Learning to Detect Fake Identities: Bots vs Humans. IEEE Access, 6, 6540–6549. https://doi.org/10.1109/ACCESS.2018.2796018

van der Walt, E., & Eloff, J. (2018). Uso del aprendizaje automático para detectar identidades falsas: bots vs humanos. IEEE Access, 6, 6540–6549. https://doi.org/10.1109/ACCESS.2018.2796018

Yang, C., Harkreader, R. C., & Gu, G. (2013). Die Free or Live Hard? Empirical Evaluation and New Design for Fighting Evolving Twitter Spammers. Retrieved from https://doi.org/10.1007/978-3-642-23644-0_17

Yang, K. C., Ferrara, E., & Menczer, F. (2022). Botometer 101: práctica de bots sociales para científicos sociales. Journal of Computational Social Science, 5(2), 1511–1528. https://doi.org/10.1007/s42001-022-00177-5