Desarrollo de modelo para identificación de características positivas/negativas de producto en comentarios en plataforma e-commerce usando aprendizaje automático
| dc.contributor.advisor | Álvarez Vargas, Gloria Inés | |
| dc.contributor.advisor | Linares Ospina, Diego Luis | |
| dc.contributor.author | Villa Ramos, Jhilbran | |
| dc.contributor.author | Ibarra Enríquez, Santiago | |
| dc.date.accessioned | 2025-11-04T21:09:51Z | |
| dc.date.available | 2025-11-04T21:09:51Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Este proyecto busca desarrollar una herramienta de análisis de sentimientos automatizada para evaluar comentarios en plataformas de comercio electrónico mediante técnicas de Machine Learning. El objetivo principal es identificar características positivas y negativas en las reseñas de los usuarios, permitiendo a las empresas mejorar su reputación, abordar rápidamente comentarios negativos, optimizar productos y servicios, y diseñar estrategias de marketing más efectivas. La metodología del proyecto se divide en dos etapas principales: preparación de datos e implementación del modelo. En la primera etapa, se realiza la adquisición de datos a partir de comentarios de usuarios, seguida de un proceso de limpieza y transformación del texto para eliminar ruido y normalizar los datos. Posteriormente, se aplican técnicas de incrustación de palabras como Word2Vec y GloVe, junto con métodos léxicos tradicionales (Bag-of-Words, TFIDF, One-Hot Encoding) para convertir el texto en representaciones vectoriales adecuadas para el análisis. En la fase de implementación, se entrenan y comparan distintos modelos de clasificación, utilizando los embeddings generados. Adicionalmente, se aplica modelado de temas (LDA) para identificar patrones en los comentarios. Finalmente, se generan visualizaciones interactivas que permiten una comprensión clara de los resultados. | spa |
| dc.description.abstract | This project aims to develop an automated sentiment analysis tool to evaluate comments on e-commerce platforms using machine learning techniques. The main objective is to identify positive and negative features in user reviews, enabling companies to improve their reputation, quickly address negative feedback, optimize products and services, and design more effective marketing strategies. The project methodology is divided into two main stages: data preparation and model implementation. In the first stage, data is acquired from user comments, followed by a text cleaning and transformation process to remove noise and normalize the data. Word embedding techniques such as Word2Vec and GloVe are then applied, along with traditional lexical methods (Bag-of-Words, TFIDF, One-Hot Encoding) to convert the text into vector representations suitable for analysis. In the implementation phase, various classification models are trained and compared using the generated embeddings. Additionally, topic modeling (LDA) is applied to identify patterns in the comments. Finally, interactive visualizations are generated to provide a clear understanding of the results. | eng |
| dc.description.degreelevel | Maestría | |
| dc.description.degreename | Magíster en Ciencia de Datos | |
| dc.format.extent | 62 p. | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.uri | http://hdl.handle.net/11522/5049 | |
| dc.language.iso | spa | |
| dc.publisher | Pontificia Universidad Javeriana Cali | |
| dc.publisher.department | Facultad de Ingeniería y Ciencias | |
| dc.publisher.program | Maestría en Ciencia de Datos | |
| dc.rights.accessrights | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.creativecommons | https://creativecommons.org/licenses/by-nc-sa/4.0/ | |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-sa/4.0/ | |
| dc.subject | Aprendizaje automático | spa |
| dc.subject | Modelado de temas | spa |
| dc.subject | Análisis de sentimiento | spa |
| dc.subject | Comercio digital | spa |
| dc.subject | Ciencia de datos | spa |
| dc.subject | Machine learning | spa |
| dc.subject | Sentiment analysis | eng |
| dc.subject | E-commerce | eng |
| dc.subject | Data science | eng |
| dc.subject | Topic modeling | eng |
| dc.title | Desarrollo de modelo para identificación de características positivas/negativas de producto en comentarios en plataforma e-commerce usando aprendizaje automático | spa |
| dc.type | master thesis | |
| dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Maestría | |
| dc.type.redcol | https://purl.org/redcol/resource_type/TM |
Files
Original bundle
1 - 2 of 2
Loading...
- Name:
- Proyecto de Grado Final - Jhilbran Alberto Villa Ramos,Santiago Ibarra Enríquez,.pdf
- Size:
- 60.54 MB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Licencia de Uso - Jhilbran Alberto Villa Ramos,Santiago Ibarra Enríquez,.pdf
- Size:
- 286.92 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed to upon submission
- Description: