Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado
dc.contributor.advisor | Pabón, María Constanza | |
dc.contributor.author | Pizarro Rivera, Francisco | |
dc.date.accessioned | 2024-06-08T21:01:44Z | |
dc.date.available | 2024-06-08T21:01:44Z | |
dc.date.issued | 2024 | |
dc.description.abstract | El análisis de polaridad u orientación semántica es una de las ramas del Natural Language Processing que ha tenido más crecimiento en el última década, con amplias aplicaciones a nivel académico y comercial. En este proyecto de grado se realizó una exploración sobre la aplicación de modelos de Machine Learning de carácter Auto Supervisado y No Supervisado para realizar el análisis de polaridad en tweets escritos por los usuarios de la red social X específicamente escritos sobre el contexto político colombiano. Se exploró el uso de un enfoque con modelos híbridos, en los cuales se hace un preproceso de pseudo etiquetado por medio de un modelo basado en lexicones (modelo VADER) para luego entrenar modelos supervisados como SVM, Logistic Regression y Multinomial Naive Bayes. El segundo enfoque constó de usar el modelo No Supervisado de K-Means, obteniendo un performance superior en la ejecución del modelo hibrido. Este trabajo tiene también por output la exportación a modo de prototipo del modelo con mejor performance y su vectorizador entrenado con el vocabulario de los 4.830 tweets recolectados de manera manual para ser desplegado en posibles ambientes de producción para el desarrollo de herramientas de análisis de orientación semántica aplicada a textos de redes sociales, pero en específico a tweets relacionados con el contexto político colombiano. | |
dc.format.extent | 120 p. | |
dc.format.mimetype | application/pdf | |
dc.identifier.uri | https://vitela.javerianacali.edu.co/handle/11522/2079 | |
dc.language.iso | spa | |
dc.publisher | Pontificia Universidad Javeriana Cali | |
dc.rights.accessrights | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.creativecommons | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-sa/4.0/ | |
dc.subject | Tweets | |
dc.subject | No supervisado | |
dc.subject | NLP | |
dc.subject | Tf-idf | |
dc.subject | Orientación semántica | |
dc.subject | Machine learning | |
dc.subject | VADER | |
dc.thesis.discipline | Facultad de Ingeniería y Ciencias. Maestría en Ciencia de Datos | |
dc.thesis.grantor | Pontificia Universidad Javeriana Cali | |
dc.thesis.level | Maestría | |
dc.title | Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Maestría | |
dc.type.redcol | https://purl.org/redcol/resource_type/TM |
Files
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed to upon submission
- Description: