Redes Neuronales Recurrentes para la detección de noticias falsas cuentas Bot en Twitter
DOI:
https://doi.org/10.5281/zenodo.14194198Palabras clave:
noticias falsas, bots, twitter, redes socialesResumen
Este artículo presenta el desarrollo e implementación de un modelo de Inteligencia Artificial (IA) para la detección de cuentas bot y noticias falsas en Twitter (ahora X). El modelo combina técnicas de Análisis de Sentimiento (AS), Procesamiento de Lenguaje Natural (PLN), Redes Neuronales Simples (RNS) y Redes Neuronales Recurrentes (RNR), diseñadas para identificar bots a nivel de tweet y diferenciar entre noticias verdaderas y falsas. El objetivo principal es proporcionar un sistema capaz de detectar cuentas operadas por bots de manera rápida y eficiente, al mismo tiempo que genera un repositorio y un catálogo de medios que diseminan información falsa. El proyecto fue desarrollado en la plataforma Google Colab, utilizando bibliotecas especializadas para el análisis de datos y el procesamiento de texto en Python, como NLTK, TextBlob y spaCy. El modelo también integra la herramienta Botometer, un algoritmo basado en IA que facilita la identificación de bots mediante el análisis de patrones de comportamiento y contenido en cuentas sospechosas. El sistema emplea algoritmos de aprendizaje automático para procesar grandes volúmenes de tweets, y su implementación permite la detección automatizada de bots en tiempo real. Los resultados obtenidos muestran una precisión del 75.96% en la detección de bots, validando la eficacia de las Redes Neuronales Recurrentes utilizadas en el modelo. Adicionalmente, se analizaron métricas como retweets y likes, lo que evidencia la funcionalidad y viabilidad del enfoque propuesto para combatir la desinformación en redes sociales
Citas
Angel Rosales Quiroga, M., Vilariño Ayala, D., Pinto, D., Tovar, M., & Beltrán, B. (2016). Análisis de sentimientos basado en aspectos: un modelo para identificar la polaridad de críticas de usuario Aspect Based Sentiment Analysis: A Model for Identification of User Reviews Polarity. In Research in Computing Science (Vol. 115). Retrieved from http://www.lke.buap.mx/
Antonio, J., Ortiz, P., Por, D., Forcada, M. L., & Rubio, J. C. (2002a). MODELOS PREDICTIVOS BASADOSEN REDES NEURONALES RECURRENTESDE TIEMPO DISCRETO.
Antonio, J., Ortiz, P., Por, D., Forcada, M. L., & Rubio, J. C. (2002b). MODELOS PREDICTIVOS BASADOSEN REDES NEURONALES RECURRENTESDE TIEMPO DISCRETO.
Banks, D., Jordan, M., Kannan, R., Ré, C., Tibshirani, R. J., & Wasserman, L. (n.d.). Springer Series in the Data Sciences Series Editors. Retrieved from http://www.springer.com/series/13852
Bonet Cruz, I., Salazar Martinez, S., Abed, A. R., Abalo, G., & Lorenzo, M. M. G. (2007). Redes neuronales recurrentes para el análisis de secuencias. Revista Cubana de Ciencias Informáticas , 48–57.
Burgos Gonzalo, P. (2021). Análisis y detección de bots en Twitter. Retrieved from www.uam.es
Cao, D. (n.d.). Cloud Computing Based Plant Classifiers and Their Real-Life Research Applications. Retrieved from www.slayte.com
Carlos, J., & Sande, S. (n.d.). Análisis de sentimientos en Twitter.
Chu, Z., Gianvecchio, S., Wang, H., & Jajodia, S. (2012). Detecting automation of Twitter accounts: Are you a human, bot, or cyborg? IEEE Transactions on Dependable and Secure Computing, 9(6), 811–824. https://doi.org/10.1109/TDSC.2012.75
Cresci, S., di Pietro, R., Petrocchi, M., Spognardi, A., & Tesconi, M. (2015). Fama en venta: detección eficiente de seguidores falsos en Twitter. https://doi.org/10.1016/j.dss.2015.09.003
Cresci, S., Spognardi, A., Petrocchi, M., Tesconi, M., & Pietro, R. di. (2017). The paradigm-shift of social spambots: Evidence, theories, and tools for the arms race. 26th International World Wide Web Conference 2017, WWW 2017 Companion, 963–972. International World Wide Web Conferences Steering Committee. https://doi.org/10.1145/3041021.3055135
de Lucio, J. (2021). Estimación adelantada del crecimiento regional mediante redes neuronales LSTM. Investigaciones Regionales, 2021(49), 45–64. https://doi.org/10.38191/iirr-jorr.21.007
de Trabajo, D., & Arana, C. (2021a). REDES NEURONALES RECURRENTES: ANÁLISIS DE LOSMODELOS ESPECIALIZADOS EN DATOS SECUENCIALES. Retrieved from www.cema.edu.ar/publicaciones/doc_trabajo.html
de Trabajo, D., & Arana, C. (2021b). UNIVERSIDAD DEL CEMA Buenos Aires Argentina Serie. Retrieved from www.cema.edu.ar/publicaciones/doc_trabajo.html
Deng, L., & Yu, D. (2013). Deep learning Methods and applications. Foundations and Trends in Signal Processing, Vol. 7, pp. 197–387. Now Publishers Inc. https://doi.org/10.1561/2000000039
Dickerson, J. P., Kagan, V., & Subrahmanian, V. S. (2014). Using Sentiment to Detect Bots on Twitter: Are Humans more Opinionated than Bots? https://doi.org/10.1109/ASONAM.2014.6921650
Efthimion1, F. G., Payne1, S., & Profers2, N. (2018). Técnicas supervisadas de detección de bots de aprendizaje automático para identificar bots de redes sociales en Twitter. Retrieved from https://scholar.smu.edu/datasciencereview/vol1/iss2/5
Ernesto del Valle Martín, L. U. I. de la R. (UNIR),Luis de la F. V. P. U. I. de la R. (n.d.). Sentiment analysis methods for politics and hate.
Esther, M., & Martínez, R. (n.d.). Distinción de bots y humanos en Twitter con Inteligencia Artificial.
Feng, S., Tan, Z., Wan, H., Wang, N., Chen, Z., Zhang, B., … Luo, M. (n.d.). TwiBot-22: Towards Graph-Based Twitter Bot Detection. Retrieved from https://twibot22.github.io/.
Ferrara, E., Varol, O., Davis, C., Menczer, F., & Flammini, A. (2016). The rise of social bots. Communications of the ACM, 59(7), 96–104. https://doi.org/10.1145/2818717
Garcia-Moreno, V. E., Nacional, U., Marcos, S., & Alvarez-Caicedo, C. R. (2021). Análisis de sentimientos en la predicción de resultados de elecciones presidenciales. https://doi.org/10.15381/risi.v14i1.21866
Géron, A. (2017). Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. Retrieved from http://oreilly.com/safari
Grau, I., Nápoles, G., Bonet, I., & García, M. M. (2013). Backpropagation through Time Algorithm for Training Recurrent Neural Networks using Variable Length Instances. 17(1), 15–24.
Henríquez, C., Ferran, P., Hurtado, L.-F., & Guzmán, J. (2017). Análisis de sentimientos a nivel de aspecto usando ontologías y aprendizaje automático. 49–56. Retrieved from http://www.redalyc.org/articulo.oa?id=515754427005
Juan Lulián Cea Morán. (2020). Redes neuronales recurrentes para la generación automática de música.
Khan, M. T., Durrani, M., Ali, A., Inayat, I., Khalid, S., & Khan, K. H. (2016, December 1). Análisis de sentimientos y el lenguaje natural complejo. Complex Adaptive Systems Modeling, Vol. 4. Springer. https://doi.org/10.1186/s40294-016-0016-9
Kumar D, Mr. G. (2020). Spam Detection in Twitter. International Journal for Research in Applied Science and Engineering Technology, 8(7), 783–787. https://doi.org/10.22214/ijraset.2020.30337
Latin, I., & Transactions, A. (2022). Sentiment Analysis of Tweets Related to SUS Before and During COVID-19 Pandemic (Vol. 20).
Liu, X. (2019). A big data approach to examining social bots on Twitter. Journal of Services Marketing, 33(4), 369–379. https://doi.org/10.1108/JSM-02-2018-0049
Makridakis, S., Spiliotis, E., & Assimakopoulos, V. (2018). Statistical and Machine Learning forecasting methods: Concerns and ways forward. PLoS ONE, 13(3). https://doi.org/10.1371/journal.pone.0194889
Maqueda Bojorquez, D. E. (n.d.). DE REDES NEURONALES RECURRENTES A MODELOS DE LENGUAJE: LA EVOLUCIÓN DEL PLN EN LA GENERACIÓN DE TEXTOS. Retrieved from https://www.ties.unam.mx/
Mckinney, W. (2010). Data Structures for Statistical Computing in Python.
Minnich, A., Chavoshi, N., Koutra, D., & Mueen, A. (2017). BotWalk: exploración adaptativa eficiente de las redes de bots de Twitter. Proceedings of the 2017 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining, ASONAM 2017, 467–474. Association for Computing Machinery, Inc. https://doi.org/10.1145/3110025.3110163
Montañés, R., Aznar, R., & del Hoyo, R. (2018). Aplicación de un modelo híbrido de aprendizaje profundo para el Análisis de Sentimiento en Twitter. 51–56.
Nasukawa, T., & Yi, J. (2003). Análisis de sentimiento: captura de la favorabilidad mediante el procesamiento del lenguaje natural. Proceedings of the 2nd International Conference on Knowledge Capture, K-CAP 2003, 70–77. Association for Computing Machinery, Inc. https://doi.org/10.1145/945645.945658
Navarro, L. F. S. (2022). APROBACIÓN DEL PRESIDENTE DE PERÚ BASADO EN ANÁLISIS DESENTIMIENTOS EN TWITTER. TECHNO Review. International Technology, Science and Society Review / Revista Internacional de Tecnología, Ciencia y Sociedad, 11. https://doi.org/10.37467/revtechno.v11.4396
Olabe, X. B. (n.d.). Redes neuronales artificiales y sus aplicaciones (p. 4). p. 4. Bilbao.
Parselis, M. (2014). Función e innovación social: el caso Twitter Social function and social innovation: the Twitter case. In Revista CTS, no (Vol. 25). Retrieved from http://www.lanacion.com.ar/
Paul J. Werbos. (1990). Backpropagation Througt Time: What It Does and How to Do It. Proceedings of the IEEE, 78, 1550–1560.
Pereira-Kohatsu, J. C., Quijano-Sánchez, L., Liberatore, F., & Camacho-Collados, M. (2019). Detecting and monitoring hate speech in twitter. Sensors (Switzerland), 19(21). https://doi.org/10.3390/s19214654
Pérez Guerrero Sevilla, J., de, J., por, T., & Pino Mejías, R. (n.d.). REDES RECURRENTES.
Rafael Sabino Parmezan, A., A Souza, V. M., & A P A Batista, G. E. (2019). Supplementary Material for Evaluation of Statistical and Machine Learning Models for Time Series Prediction: Identifying the State-of-the-art and the Best Conditions for the Use of Each Model.
Sepp Hochreiter. (n.d.). Long Short-Term Memory.
Sezer, O. B., Gudelek, M. U., & Ozbayoglu, A. M. (2020). Financial time series forecasting with deep learning: A systematic literature review: 2005–2019. Applied Soft Computing Journal, 90. https://doi.org/10.1016/j.asoc.2020.106181
Sharma, S., & Kumar Sharma, V. (2020). Análisis de Delitos Cibernéticos en Redes Sociales. BSSS Journal of Computer. https://doi.org/10.51767/jc1104
Subrahmanian, V. (2016). El DESAFÍO DEL BOT DE TWITTER DE DARPA. 49(6), 38–46. https://doi.org/10.1109/MC.2016.183
Subrahmanian, V., Azaria, A., Durst, S., Kagan, V., Galstyan, A., Lerman, K., … Menczer, F. (2016). THE DARPA TWITTER BOT CHALLENGE. Pacific Social. https://doi.org/10.1109/MC.2016.183
Udge, G., Mohite, M., Bendre, S., Birnagal, Y., & Wankhede, D. (2019). Statistical Analysis for Twitter Spam Detection. International Journal of Scientific Research in Science, Engineering and Technology, 624–629. https://doi.org/10.32628/ijsrset1962170
Van Der Walt, E., & Eloff, J. (2018). Using Machine Learning to Detect Fake Identities: Bots vs Humans. IEEE Access, 6, 6540–6549. https://doi.org/10.1109/ACCESS.2018.2796018
van der Walt, E., & Eloff, J. (2018). Uso del aprendizaje automático para detectar identidades falsas: bots vs humanos. IEEE Access, 6, 6540–6549. https://doi.org/10.1109/ACCESS.2018.2796018
Yang, C., Harkreader, R. C., & Gu, G. (2013). Die Free or Live Hard? Empirical Evaluation and New Design for Fighting Evolving Twitter Spammers. Retrieved from https://doi.org/10.1007/978-3-642-23644-0_17
Yang, K. C., Ferrara, E., & Menczer, F. (2022). Botometer 101: práctica de bots sociales para científicos sociales. Journal of Computational Social Science, 5(2), 1511–1528. https://doi.org/10.1007/s42001-022-00177-5
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2024 Sandra Paulina Castillo Cárdenas, Francisco Jacob Ávila Camacho
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.