Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado

dc.contributor.advisorPabón, María Constanza
dc.contributor.authorPizarro Rivera, Francisco
dc.date.accessioned2024-06-08T21:01:44Z
dc.date.available2024-06-08T21:01:44Z
dc.date.issued2024
dc.description.abstractEl análisis de polaridad u orientación semántica es una de las ramas del Natural Language Processing que ha tenido más crecimiento en el última década, con amplias aplicaciones a nivel académico y comercial. En este proyecto de grado se realizó una exploración sobre la aplicación de modelos de Machine Learning de carácter Auto Supervisado y No Supervisado para realizar el análisis de polaridad en tweets escritos por los usuarios de la red social X específicamente escritos sobre el contexto político colombiano. Se exploró el uso de un enfoque con modelos híbridos, en los cuales se hace un preproceso de pseudo etiquetado por medio de un modelo basado en lexicones (modelo VADER) para luego entrenar modelos supervisados como SVM, Logistic Regression y Multinomial Naive Bayes. El segundo enfoque constó de usar el modelo No Supervisado de K-Means, obteniendo un performance superior en la ejecución del modelo hibrido. Este trabajo tiene también por output la exportación a modo de prototipo del modelo con mejor performance y su vectorizador entrenado con el vocabulario de los 4.830 tweets recolectados de manera manual para ser desplegado en posibles ambientes de producción para el desarrollo de herramientas de análisis de orientación semántica aplicada a textos de redes sociales, pero en específico a tweets relacionados con el contexto político colombiano.
dc.format.extent120 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://vitela.javerianacali.edu.co/handle/11522/2079
dc.language.isospa
dc.publisherPontificia Universidad Javeriana Cali
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subjectTweets
dc.subjectNo supervisado
dc.subjectNLP
dc.subjectTf-idf
dc.subjectOrientación semántica
dc.subjectMachine learning
dc.subjectVADER
dc.thesis.disciplineFacultad de Ingeniería y Ciencias. Maestría en Ciencia de Datos
dc.thesis.grantorPontificia Universidad Javeriana Cali
dc.thesis.levelMaestría
dc.titleAnálisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisadospa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.localTesis/Trabajo de grado - Monografía - Maestría
dc.type.redcolhttps://purl.org/redcol/resource_type/TM
Files
Original bundle
Now showing 1 - 2 of 2
No Thumbnail Available
Name:
4.LICENCIA DE USO - TG.pdf
Size:
205.09 KB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
240418_DocumentoGradoFranciscoPizarro.pdf
Size:
4.79 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: