Browsing by Subject "Sentiment analysis"
Now showing 1 - 8 of 8
Results Per Page
Sort Options
Item Análisis comparativo de la percepción mediática de la reforma a la salud en Colombia usando técnicas NLP(Pontificia Universidad Javeriana Cali, 2025) Hernández Moreno, Bryan Steven; Coronado Cobos, Samuel Andrés; González Ipuz, José Luis; Álvarez Bustos, Abel; Ramírez Ovalle, Carlos ErnestoEste estudio aplicó técnicas de ciencia de datos y procesamiento de lenguaje natural (NLP) para analizar la percepción mediática sobre la reforma a la salud en Colombia (2022-2024), abordando una brecha en la literatura al examinar diferencias regionales en la cobertura periodística. Partiendo del rol del periodismo en la formación de opinión pública especialmente en temas críticos como la salud, se recolectaron 1.401 noticias mediante web scraping de fuentes confiables (SCImago) en las regiones Andina, Caribe y Pacífica, siguiendo criterios de inclusión rigurosos (periodo 2022-2024, idioma español, relevancia temática). Los datos se preprocesaron con técnicas de NLP (tokenización, lematización, eliminación de stopwords y publicidad) y se depuraron mediante análisis estadístico (excluyendo 39 noticias atípicas por IQR). Para el análisis, se implementaron modelos de similitud (TF-IDF, Doc2Vec, MPNet) y clasificación de sentimientos (BETO, RoBERTa y ChatGPT-4o), este último como contraste. Los modelos fine tuned (BETO: 91.29% accuracy; RoBERTa: 89.18%) superaron significativamente a ChatGPT-4o (67.29%), demostrando la importancia del ajuste especializado para contextos periodísticos en español. El etiquetado manual (26.43% del corpus) permitió validar los resultados, destacando tendencias regionales: neutralidad en la cobertura Andina (asociada a enfoques institucionales), mayor positividad en el Caribe y predominio de narrativas negativas en el Pacífico (vinculadas a críticas locales). Los hallazgos confirman que: Las diferencias geopolíticas y socioculturales moldean narrativas mediáticas, pese a cierta homogeneidad discursiva intrarregional (validada por métricas de similitud). El fine-tuning de modelos de NLP es crucial para análisis de sentimientos en dominios especializados, siendo BETO óptimo para español. La metodología propuesta integrando web scraping, NLP y visualización interactiva (Power BI) ofrece un marco replicable para estudios de percepción mediática en políticas públicas.Item Análisis de sentimiento de las llamadas del Call Center de la Universidad Javeriana de Cali mediante el uso de Ciencia de Datos(Pontificia Universidad Javeriana Cali, 2025) Semma Álvarez, Luis Miguel; Quiza Vargas, Iván Felipe; Agreda Villota, Nelson Andrés; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEl presente proyecto se enfocó en el análisis de sentimiento de las llamadas del Call Center de la Universidad Javeriana de Cali mediante técnicas de ciencia de datos. Su finalidad fue desarrollar una herramienta que permita analizar el sentimiento expresado en cada llamada y clasificar las interacciones según su contenido emocional, contribuyendo a mejorar la calidad del servicio y apoyar la toma de decisiones informadas. Para ello, se emplearon técnicas como GCP Speech-to-Text para la transcripción de audios, modelos de clasificación supervisada como SVM y RNN y clasificación no supervisada con NMF. Los resultados muestran un buen desempeño, destacando la utilidad del modelo SVM-TFIDF con métricas de F1 y AUC positivas. Está solución representa un avance significativo en la gestión de la información y atención al cliente en el entorno educativo.Item Análisis de sentimiento para determinar patrones predictivos de problemas de crisis reputacional en hoteles de Bogotá(Pontificia Universidad Javeriana Cali, 2025) Silva López, Juan Manuel; Mora Cardona, Mario JuliánEste proyecto se centró en el análisis de reseñas de hoteles en Bogotá con el objetivo de identificar patrones textuales y temporales asociados a posibles crisis de reputación empresarial. Mediante el uso de herramientas de ciencia de datos como Python, Jupyter Notebook y bibliotecas especializadas como Pandas, Scikit-learn y NLTK, se procesaron miles de opiniones de usuarios para construir un modelo predictivo basado en sentimientos negativos. Se realizó un análisis de series de tiempo sobre reseñas negativas, identificando patrones estacionales y periodos críticos que pueden servir como alertas tempranas. Este componente permitió incorporar una dimensión temporal valiosa para la toma de decisiones estratégicas. Se aplicaron técnicas de procesamiento de lenguaje natural (NLP), incluyendo lematización y vectorización, para transformar el texto en variables cuantificables. A partir de una función de clasificación que distinguía entre estados de crisis y no crisis, se entrenaron cuatro algoritmos de aprendizaje supervisado: Regresión Logística, Random Forest, Support Vector Machine (SVM) y MLPClassifier. Cada modelo fue evaluado antes y después del ajuste de hiperparámetros mediante GridSearchCV, siendo el SVM y el MLP los que lograron mejores métricas de precisión y recall en la predicción de crisis. En conjunto, el proyecto demuestra la viabilidad de utilizar análisis de sentimientos y aprendizaje automático para fortalecer la gestión reputacional en el sector hotelero, con potencial de escalabilidad a otras industrias dependientes de plataformas de opinión digital.Item Análisis de sentimientos en llamadas en centros de atención al cliente(Pontificia Universidad Javeriana Cali, 2025) Andrea, Arias Gómez; Rincón Loaiza, Daniel; Rojas Tavera, Jhon Alexander; Torres Valencia, Cristian AlejandroEn el contexto de los centros de contacto, la calidad de las interacciones entre agentes telefónicos y clientes es esencial para garantizar la satisfacción del cliente y promover el crecimiento empresarial. La ausencia de herramientas para identificar los factores que influyen en el rendimiento de los servicios puede impactar negativamente la reputación y eficiencia operativa. En este contexto, se desarrolló un proyecto de análisis de sentimientos aplicado a transcripciones de llamadas en español, específicamente en el call center de la Universidad Pontificia Javeriana de Cali. El objetivo principal fue analizar y clasificar las emociones expresadas en estas interacciones para identificar patrones emocionales, mejorar la comprensión de las necesidades de los usuarios y optimizar la experiencia del cliente en un entorno educativo. El proyecto integra técnicas avanzadas de aprendizaje automático y procesamiento de lenguaje natural (PLN), incluyendo reconocimiento automático del habla y diarización, para segmentar y analizar las conversaciones. El trabajo abarcó desde la construcción de un corpus representativo y el preprocesamiento avanzado de texto, hasta la configuración y adaptación de modelos de aprendizaje profundo. Además, se diseñó una interfaz con AppScript, que facilita la carga de datos y la visualización de resultados, asegurando una experiencia de usuario eficiente y accesible. La evaluación de los modelos de clasificación se realizó mediante métricas como precisión, recall y F1-score, dentro de un marco metodológico robusto que combina CRISP-DM y Scrum, garantizando un proceso estructurado y ágil. Este enfoque permite a las empresas del sector BPO en Colombia anticipar problemas, optimizar operaciones y mantener una reputación positiva en un mercado altamente competitivo.Item Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático(Pontificia Universidad Javeriana Cali, 2023) Londoño Cárdenas, Jhon Sebastián; Ortiz Morales, Luis Alberto; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésEl mercado de acciones es uno que cuenta con cierta antigüedad, es por esto que se han desarrollado y probado una gran variedad técnicas para intentar predecir el comportamiento del valor del precio de las acciones. Sin embargo, para estas predicciones se tienen en cuenta, en mayor medida, variables como el histórico del precio, dejando de lado otro tipo de información como el análisis de sentimientos. En este proyecto se quiso contribuir a la investigación sobre el aporte que puede hacer este tipo de variable menos usada en la predicción del precio de las acciones, por este motivo, se llevó a cabo una integración entre dos técnicas con diferente grado de exploración. Para la parte del análisis de sentimientos se usó un dataset de tweets de la empresa Apple al cual se le aplicó técnicas de Procesamiento de Lenguaje Natural para el preprocesa miento, 2 algoritmos de aprendizaje semi-supervisado para ayudar a etiquetar los sentimientos de todos los tweets y 3 modelos de aprendizaje automático para que pudieran etiquetar tweets nuevos, siendo este la Máquina de Soporte Vectorial. Para la parte del histórico del precio se usó un dataset de diferentes valores de las acciones de la empresa Apple, gracias al cual se en traron 3 modelos de aprendizaje automático de los cuales la LSTM tuvo los mejores resultados. Posteriormente, se integraron los sentimientos obtenidos al histórico del precio, obteniendo que el mejor modelo era el Random Forest, sin embargo, no conseguía superar al mejor modelo que únicamente usaba el histórico del precio. Con dicho modelo de Random Forest se realizaron pruebas en un mercado simulado, determinando que el uso tanto del histórico del precio como del análisis de sentimientos es posible y tiene resultados aceptables, no obstante, la estrategia de compra y venta debe examinarse con mayor rigurosidad para darle un uso a estos modelos en el mundo real.Item Aplicación de técnicas de inteligencia artificial para el análisis de los comentarios del cliente del segmento personas en Bancalibre(Pontificia Universidad Javeriana Cali, 2025) Arias Vergara, Juliana Andrea; Salcedo Vaca, Carlos Andrés; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésActualmente, se capturan y almacenan grandes cantidades de datos en formato texto, lo cual representa un reto significativo para su procesamiento. El análisis manual de estos datos consume demasiado tiempo y es poco práctico, por lo que es necesario desarrollar estrategias para mejorar estos procesos y obtener los resultados con mayor rapidez. En este trabajo se implementan técnicas avanzadas de ciencia de datos para analizar los comentarios escritos de los clientes del segmento de Personas de BancaLibre. La importancia de este estudio radica en la creciente necesidad de las entidades financieras de escuchar y analizar las opiniones de sus clientes para mejorar su experiencia, fidelización y satisfacción. Se aplican técnicas como el análisis de sentimientos, enfocado en el NPS Relacional para conocer la satisfacción del cliente con la empresa en general, y la inteligencia artificial (IA), para identificar en detalle los temas de mejora más recurrentes. El proceso comienza con la preparación del conjunto de datos, la selección e implementación de la técnica de IA adecuada, la evaluación del desempeño del modelo y finaliza con el desarrollo de una interfaz para la visualización de resultados. Se espera obtener un modelo que permita analizar de manera eficiente los comentarios de los clientes, identificar temas recurrentes y proporcionar una herramienta útil para apoyar la toma de decisiones orientadas a mejorar la experiencia del cliente. Las posibles aplicaciones de este trabajo incluyen áreas de la organización como Mercadeo, Estrategia comercial y Servicio al Cliente, que ven en esta información un beneficio para aplicar en sus procesos y su alcance en la escalabilidad con otros tipos de retroalimentación de clientes, ampliando así su impacto y utilidad.Item Desarrollo de modelo para identificación de características positivas/negativas de producto en comentarios en plataforma e-commerce usando aprendizaje automático(Pontificia Universidad Javeriana Cali, 2025) Villa Ramos, Jhilbran; Ibarra Enríquez, Santiago; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEste proyecto busca desarrollar una herramienta de análisis de sentimientos automatizada para evaluar comentarios en plataformas de comercio electrónico mediante técnicas de Machine Learning. El objetivo principal es identificar características positivas y negativas en las reseñas de los usuarios, permitiendo a las empresas mejorar su reputación, abordar rápidamente comentarios negativos, optimizar productos y servicios, y diseñar estrategias de marketing más efectivas. La metodología del proyecto se divide en dos etapas principales: preparación de datos e implementación del modelo. En la primera etapa, se realiza la adquisición de datos a partir de comentarios de usuarios, seguida de un proceso de limpieza y transformación del texto para eliminar ruido y normalizar los datos. Posteriormente, se aplican técnicas de incrustación de palabras como Word2Vec y GloVe, junto con métodos léxicos tradicionales (Bag-of-Words, TFIDF, One-Hot Encoding) para convertir el texto en representaciones vectoriales adecuadas para el análisis. En la fase de implementación, se entrenan y comparan distintos modelos de clasificación, utilizando los embeddings generados. Adicionalmente, se aplica modelado de temas (LDA) para identificar patrones en los comentarios. Finalmente, se generan visualizaciones interactivas que permiten una comprensión clara de los resultados.Item “Efectos de las noticias financieras sobre las tasas de los títulos de deuda pública en el mercado del MILA”(Pontificia Universidad Javariana Cali, 2025) Osorio Morales, Andrés Felipe; Arango Londoño, DavidEste trabajo de investigación explora cómo las noticias financieras y económicas influyen en la volatilidad de las tasas de los títulos de deuda pública en los mercados del Mercado Integrado Latinoamericano (MILA), que incluye Colombia, Chile, Perú y México. Dada la importancia de las noticias financieras en la formación de precios y la toma de decisiones de inversión, entender su impacto sobre la volatilidad es crucial para inversores, reguladores y otros actores del mercado. El análisis se centra en determinar si las noticias actúan como un factor causal relevante de volatilidad, permitiendo a los participantes del mercado anticipar cambios en los rendimientos y ajustar sus estrategias de inversión. La metodología adoptada combina técnicas de análisis de contenido y modelos econométricos. Se utiliza procesamiento de lenguaje natural para analizar el contenido emocional y el impacto de las noticias financieras obtenidas de plataformas como Twitter, clasificándolas en un índice de sentimientos. Posteriormente, se aplican modelos GARCH para evaluar cómo estas noticias afectan la volatilidad de los rendimientos de los Títulos de Tesorería de Colombia a 10 años y regresión ARIMAX para establecer si existe algún impacto de las noticias en el rendimiento de los bonos, teniendo en cuenta variables como la inflación y la tasa interbancaria. Los resultados del estudio indican que las noticias financieras no tienen un efecto significativo sobre la volatilidad de las tasas. El mayor impacto viene dado por los datos históricos de rendimiento, confirmando la hipótesis débil de la eficiencia del mercado. Esta investigación aporta a la literatura existente ofreciendo nuevas perspectivas sobre la interacción entre noticias financieras y dinámicas de mercado en un contexto de mercados financieros integrados en América Latina. Este trabajo no solo destaca la relevancia práctica de comprender la volatilidad de los mercados en respuesta a las noticias y otros factores, sino que también sugiere la adopción de políticas y estrategias de inversión informadas para enfrentar y aprovechar las dinámicas de mercado inducidas por información financiera.