Browsing by Author "Linares Ospina, Diego Luis"
Now showing 1 - 20 of 32
Results Per Page
Sort Options
Item Análisis de sentimiento de las llamadas del Call Center de la Universidad Javeriana de Cali mediante el uso de Ciencia de Datos(Pontificia Universidad Javeriana Cali, 2025) Semma Álvarez, Luis Miguel; Quiza Vargas, Iván Felipe; Agreda Villota, Nelson Andrés; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEl presente proyecto se enfocó en el análisis de sentimiento de las llamadas del Call Center de la Universidad Javeriana de Cali mediante técnicas de ciencia de datos. Su finalidad fue desarrollar una herramienta que permita analizar el sentimiento expresado en cada llamada y clasificar las interacciones según su contenido emocional, contribuyendo a mejorar la calidad del servicio y apoyar la toma de decisiones informadas. Para ello, se emplearon técnicas como GCP Speech-to-Text para la transcripción de audios, modelos de clasificación supervisada como SVM y RNN y clasificación no supervisada con NMF. Los resultados muestran un buen desempeño, destacando la utilidad del modelo SVM-TFIDF con métricas de F1 y AUC positivas. Está solución representa un avance significativo en la gestión de la información y atención al cliente en el entorno educativo.Item Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático(Pontificia Universidad Javeriana Cali, 2023) Londoño Cárdenas, Jhon Sebastián; Ortiz Morales, Luis Alberto; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésEl mercado de acciones es uno que cuenta con cierta antigüedad, es por esto que se han desarrollado y probado una gran variedad técnicas para intentar predecir el comportamiento del valor del precio de las acciones. Sin embargo, para estas predicciones se tienen en cuenta, en mayor medida, variables como el histórico del precio, dejando de lado otro tipo de información como el análisis de sentimientos. En este proyecto se quiso contribuir a la investigación sobre el aporte que puede hacer este tipo de variable menos usada en la predicción del precio de las acciones, por este motivo, se llevó a cabo una integración entre dos técnicas con diferente grado de exploración. Para la parte del análisis de sentimientos se usó un dataset de tweets de la empresa Apple al cual se le aplicó técnicas de Procesamiento de Lenguaje Natural para el preprocesa miento, 2 algoritmos de aprendizaje semi-supervisado para ayudar a etiquetar los sentimientos de todos los tweets y 3 modelos de aprendizaje automático para que pudieran etiquetar tweets nuevos, siendo este la Máquina de Soporte Vectorial. Para la parte del histórico del precio se usó un dataset de diferentes valores de las acciones de la empresa Apple, gracias al cual se en traron 3 modelos de aprendizaje automático de los cuales la LSTM tuvo los mejores resultados. Posteriormente, se integraron los sentimientos obtenidos al histórico del precio, obteniendo que el mejor modelo era el Random Forest, sin embargo, no conseguía superar al mejor modelo que únicamente usaba el histórico del precio. Con dicho modelo de Random Forest se realizaron pruebas en un mercado simulado, determinando que el uso tanto del histórico del precio como del análisis de sentimientos es posible y tiene resultados aceptables, no obstante, la estrategia de compra y venta debe examinarse con mayor rigurosidad para darle un uso a estos modelos en el mundo real.Item Aplicación de técnicas de inteligencia artificial para el análisis de los comentarios del cliente del segmento personas en Bancalibre(Pontificia Universidad Javeriana Cali, 2025) Arias Vergara, Juliana Andrea; Salcedo Vaca, Carlos Andrés; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésActualmente, se capturan y almacenan grandes cantidades de datos en formato texto, lo cual representa un reto significativo para su procesamiento. El análisis manual de estos datos consume demasiado tiempo y es poco práctico, por lo que es necesario desarrollar estrategias para mejorar estos procesos y obtener los resultados con mayor rapidez. En este trabajo se implementan técnicas avanzadas de ciencia de datos para analizar los comentarios escritos de los clientes del segmento de Personas de BancaLibre. La importancia de este estudio radica en la creciente necesidad de las entidades financieras de escuchar y analizar las opiniones de sus clientes para mejorar su experiencia, fidelización y satisfacción. Se aplican técnicas como el análisis de sentimientos, enfocado en el NPS Relacional para conocer la satisfacción del cliente con la empresa en general, y la inteligencia artificial (IA), para identificar en detalle los temas de mejora más recurrentes. El proceso comienza con la preparación del conjunto de datos, la selección e implementación de la técnica de IA adecuada, la evaluación del desempeño del modelo y finaliza con el desarrollo de una interfaz para la visualización de resultados. Se espera obtener un modelo que permita analizar de manera eficiente los comentarios de los clientes, identificar temas recurrentes y proporcionar una herramienta útil para apoyar la toma de decisiones orientadas a mejorar la experiencia del cliente. Las posibles aplicaciones de este trabajo incluyen áreas de la organización como Mercadeo, Estrategia comercial y Servicio al Cliente, que ven en esta información un beneficio para aplicar en sus procesos y su alcance en la escalabilidad con otros tipos de retroalimentación de clientes, ampliando así su impacto y utilidad.Item Aplicar el agente inteligente basado en aprendizaje por refuerzo RELOAD para realizar pruebas de carga autónomas(Pontificia Universidad Javeriana Cali, 2024) López Fuentes, Juan David; Linares Ospina, Diego LuisEl presente proyecto tiene como objetivo aplicar el prototipo de agente inteligente basado en aprendizaje por refuerzo, llamado RELOAD, que permita realizar pruebas de carga autónomas, para lo que se realizará una investigación con metodología cuantitativa de tipo experimental, donde se hará uso de un agente de prueba de carga impulsado por el aprendizaje por refuerzo propuesto que identifica los efectos de diferentes transacciones involucradas en la carga de trabajo y aprende cómo ajustar las transacciones para cumplir con el objetivo de la prueba. De esta manera, los resultados esperados implican utilizar un agente de pruebas de carga autónomo impulsado por el aprendizaje por refuerzo.Item Apoyo en la compra y venta de acciones de la bolsa de valores estadounidense utilizando técnicas de aprendizaje por refuerzo(Pontificia Universidad Javeriana Cali, 2023) Narváez Paz, Elkin Jadier; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésEste proyecto de investigación se adentró en el desarrollo de un agente de trading basado en aprendizaje por refuerzo, con el objetivo de evaluar su desempeño en comparación con la estrategia buy-and-hold en el dinámico entorno de los mercados financieros. El problema central de esta investigación era evaluar si un agente entrenado mediante técnicas de aprendizaje por refuerzo podía navegar eficazmente por las complejidades de la compra y venta de activos, marcadas por la volatilidad del mercado, tendencias cambiantes e incertidumbres financieras. Nuestro enfoque implicó una progresión deliberada e iterativa de experimentos, comenzando con fases preliminares diseñadas para extraer información cualitativa e identificar tendencias. Estos primeros experimentos estaban limitados en términos de recursos computacionales y duración del entrenamiento, pero fueron fundamentales para dirigirnos hacia hiperparámetros óptimos y configuraciones de entrenamiento para el último experimento. Este último experimento, caracterizado por un período de entrenamiento extenso, se destaca como el punto central de nuestros hallazgos, exhibiendo la culminación de nuestros esfuerzos. Dentro de este entrenamiento extendido, el agente demostró una notable capacidad para adaptarse a las dinámicas cambiantes del mercado, lo que se tradujo en un desempeño que compite favorablemente con la estrategia buy-and-hold. Estos resultados destacan la adaptabilidad y las capacidades de aprendizaje del agente en el contexto de compra y venta de activos, revelando su potencial para su aplicación práctica en los mercados financieros reales. En conclusión, esta investigación arroja luz sobre la promesa del aprendizaje por refuerzo en el trading, enfatizando la importancia de un enfoque sistemático para la experimentación y dejando el camino para futuros refinamientos destinados a mejorar la robustez del modelo para aplicaciones financieras del mundo real.Item Aprendizaje automático aplicado al diagnóstico de la ocurrencia de la leishmaniasis a través de imágenes de lesiones cutáneas(Pontificia Universidad Javeriana Cali, 2023) Castro Duarte, Camilo; Linares Ospina, Diego Luis; Gómez, María AdelaidaEste proyecto buscó aplicar técnicas de aprendizaje automático específicamente Redes Neuronales Convolucionales, para predecir si una lesión de tipo cutánea corresponde o no a la enfermedad de la Leishmaniasis, evaluación que no resulta tan simple mediante observación debido a la similitud con otros tipos de lesiones, para ello, se entrenaron modelos predictivos mediante una base de datos con 885 imágenes de lesiones cutáneas (407 correspondientes a Leishmaniasis y 478 correspondientes a otras lesiones cutáneas), las imágenes de Leishmaniasis fueron suministradas por el CIDEIM (Centro Internacional de Entrenamiento e Investigaciones Médicas). Durante el desarrollo del proyecto se trabajaron diferentes etapas como es el caso de la limpieza y adecuación de la base de datos de imágenes, selección y entrenamiento de los modelos, contraste de resultados y la identificación del modelo más adecuado. Los resultados arrojados por los diferentes experimentos y sus respectivas métricas permitieron establecer cuál es el modelo más adecuado para hacer la predicción, de esta forma es posible hacer un diagnóstico previo de la lesión del paciente sin siquiera estar este de cuerpo presente, también permite ayudar a personal de la salud que no tiene tanta experiencia en este tipo de lesiones a despejar dudas y tomar medidas. De esta forma se le da paso a diferentes posibilidades de aplicación del algoritmo desarrollado dentro del campo médico, como es el caso de integraciones futuras con aplicativos móviles o desarrollos web, esto puede facilitar el análisis de las lesiones de los pacientes de manera remota y de una forma ágil.Item Clasificación de emociones complejas en audio de conversaciones de Call Center de la Universidad Javeriana Cali mediante modelos semi supervisados de Machine Learning(Pontificia Universidad Javariana Cali, 2024) Ospina Cuesta, Julián Andrés; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEste proyecto tuvo como objetivo identificar las expresiones emocionales complejas predominantes en llamadas del centro de contacto, para ofrecer una herramienta de medición en la satisfacción de clientes o evaluación de desempeño en la relación empleado-cliente. La problemática abordada se centró en ¿Cómo podría desarrollarse un modelo basado en técnicas de machine learning para la clasificación automática de emociones complejas en grabaciones de llamadas de un centro de contacto universitario, con el propósito de evaluar la satisfacción del cliente? El objetivo principal del proyecto fue desarrollar un modelo semi supervisado de machine learning para la clasificación automática de emociones en grabaciones de llamadas del call center de la Universidad Javeriana Cali, utilizando características acústicas. El alcance se limitó al análisis y clasificación de las emociones complejas predominantes identificadas en estas grabaciones, basándose en definiciones de emociones ajustadas a los objetivos del negocio. Los resultados de este proyecto incluyen: un conjunto de audios procesados y etiquetados de forma semi supervisada en las 'No llamadas', mientras que las 'Llamadas' fueron de manera supervisada; un modelo de clasificación automática de emociones que fue entrenado y validado, logrando una precisión del 95% en 'No llamadas' y del 41% en 'Llamadas'; y, por último, un prototipo de software diseñado como interfaz para cargar audios y clasificar las emociones según los modelos generados.Item Clasificación de emociones en audios de call center utilizando ciencia de datos(Pontificia Universidad Javeriana Cali, 2025) Marulanda Almanza, Johan Sebastian; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEste proyecto se desarrolló con el objetivo de clasificar emociones en llamadas de call center utilizando transcripciones de audio y técnicas de machine learning, tomando como caso de estudio el centro de contacto de una Universidad de Cali. La investigación se enmarca dentro de una iniciativa más amplia en la que se exploraron un enfoque de análisis de transcripciones textuales, el presente trabajo se centró exclusivamente en la información textual derivada de los audios, evaluando la efectividad de diferentes modelos de clasificación. El principal desafío fue desarrollar un clasificador capaz de identificar emociones de manera automatizada y eficiente a partir de datos textuales. Para ello, se realizó una limpieza y normalización de datos, seguida de un entrenamiento supervisado con modelos como Logistic Regression, Random Forest y Multi-Layer Perceptron (MLP). Se aplicó un ajuste de hiperparámetros utilizando Grid Search, optimizando el rendimiento de los modelos.Item Clasificación de pacientes con Leishmaniasis basado en mutaciones genéticas por polimorfismo de nucleótido único (SNP) usando técnicas de Machine Learning(Pontificia Universidad Javeriana de Cali, 2023) Gómez Vasco, Carlos Andrés; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisLa leishmaniasis es una enfermedad tropical transmitida mediante la picadura de insectos que son los vectores de la enfermedad. Se considera una endemia en más de 88 países de diferentes geografías. Las tasas reales de incidencia son sustancialmente altas y con una alta prevalencia en países de América Latina. Aunque existen diferentes tratamientos terapéuticos, son muy complicados para los pacientes y suelen ser bastante tóxicos para otros órganos del cuerpo, y, en general, tienen altos índices porcentuales de fallo, es decir, cumplido el tratamiento los pacientes no se recuperan. Actualmente no existe una herramienta clínica que le permita a un médico tratante determinar la probabilidad a priori de que un tratamiento sea efectivo. Por el contrario, de manera indiscriminada se aplica a los pacientes las terapias bajo la premisa del ensayo y error. En este proyecto aplicado, se realiza un estudio basado en mutaciones genéticas producidas por polimorfismo de nucleótido único (SNP) a un conjunto de setenta y dos (72) pacientes tratados con las técnicas terapéuticas existentes. A estos pacientes se les realizó una secuenciación genética consiguiendo 618,872 SNPs para cada uno y la información clínica del grupo étnico, así como la respuesta al tratamiento después de aplicado, etiquetado como cura o falla. Esta información es suficiente para generar un dataset que fue analizado mediante GWAS (Estudio de asociación de genoma completo) consiguiendo tres datasets denominados COMPLETO, AFRODESCENDIENTES y NO-AFRODESCENDIENTES con 41, 14 y 36 SNPs correspondientemente. Mediante técnicas de reducción de dimensionalidad, como el análisis de componentes principales (PCA), eliminación recursiva de características y regresión LASSO, se reduce el número de variables a aquellas mutaciones genéticas más relevantes para la respuesta inmune al tratamiento consiguiendo 69 subconjuntos de características. Mediante técnicas de aprendizaje automático se construyen 483 clasificadores basados en algoritmos de Regresión Lineal (RL), Stochastic Gradient Descent (SGD), Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), Boosting (BT) y Gradient Boosting (GB) de los 69 subconjuntos, para clasificar con precisión las mutaciones genéticas relacionadas con la respuesta inmune al tratamiento terapéutico contra la leishmaniasis. Se utilizaron métricas de evaluación, como accuracy, precision, recall y F1 score para medir el rendimiento de los clasificadores. Estas métricas proporcionaron una visión detallada de la capacidad de los modelos para identificar correctamente las mutaciones relevantes. Después de la evaluación inicial de los 683 experimentos, se realizó la optimización de los hiperparámetros de los modelos mediante una búsqueda por cuadrícula explorando diferentes combinaciones y configuraciones, lo que permitió refinar los modelos y nuevamente estimar su desempeño permitiendo evaluar y comparar los resultados antes y después de la optimización, confirmando la mejora significativa en la capacidad de los clasificadores para identificar con precisión las mutaciones genéticas relacionadas con la respuesta inmune al tratamiento terapéutico contra la leishmaniasis. Al final, se consiguió una selección de 22 SNPs ubicados en genes con funciones biológicas altamente relacionadas con movimiento, transcripción, estructura y transporte celular, así como el transporte de metales, respuesta inmune y cicatrización. Evidenciando que las técnicas aplicadas son eficientes en la identificación de biomarcadores asociados con la respuesta al tratamiento contra la leishmaniasis.Item ClientMinds – Optimización de la experiencia del cliente utilizando modelos de procesamiento de lenguaje natural (PLN)(Pontificia Universidad Javeriana Cali, 2025) Potes Blandón, Jonathan; García Quiroz, Obed; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésEn el contexto empresarial actual, la gestión de las relaciones con los clientes (CRM, por sus siglas en inglés) es crucial para el éxito organizacional. Muchas empresas enfrentan dificultades para comprender y mejorar la satisfacción del cliente, pese a disponer de abundantes datos en sus sistemas de CRM, lo que limita la optimización de estas relaciones. Dada la problemática anterior y la oportunidad que tienen las organizaciones con los datos almacenados, este proyecto tuvo como objetivo desarrollar un sistema de Procesamiento del Lenguaje Natural (PNL) basado en un modelo de lenguaje a gran escala (LLM) para mejorar la comprensión y satisfacción del cliente. Este modelo no solo permite interpretar y responder a las solicitudes de los clientes de manera personalizada, sino que también analiza los sentimientos expresados en las interacciones y responden en consecuencia. Las estrategias implementadas incluyen la limpieza y exploración de datos textuales, el ajuste fino de los LLM preentrenados y la creación de un chatbot que integra estas capacidades. Este chatbot no solo interactúa eficazmente con los clientes, sino que también deja registro de dichas interacciones con el propósito de generar insights valiosos, los cuales permiten hacer seguimiento a la satisfacción del cliente y tomar decisiones estratégicas basadas en su comportamiento. En conclusión, este sistema basado en PLN se perfila como una herramienta innovadora para mejorar la experiencia del cliente y fortalecer las relaciones cliente-empresa, lo anterior, gracias a la capacidad de LLM para identificar emociones, ofrecer respuestas precisas y generar información valiosa, facilitando asi la implementación de acciones efectivas orientadas a la mejora continua de la relación con los clientes. Esto no solo eleva la calidad del servicio, sino que también impulsa la fidelización y posiciona a las organizaciones como referentes en el uso de inteligencia artificial para la gestión de sus relaciones con los clientes.Item Desarrollo de modelo para identificación de características positivas/negativas de producto en comentarios en plataforma e-commerce usando aprendizaje automático(Pontificia Universidad Javeriana Cali, 2025) Villa Ramos, Jhilbran; Ibarra Enríquez, Santiago; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEste proyecto busca desarrollar una herramienta de análisis de sentimientos automatizada para evaluar comentarios en plataformas de comercio electrónico mediante técnicas de Machine Learning. El objetivo principal es identificar características positivas y negativas en las reseñas de los usuarios, permitiendo a las empresas mejorar su reputación, abordar rápidamente comentarios negativos, optimizar productos y servicios, y diseñar estrategias de marketing más efectivas. La metodología del proyecto se divide en dos etapas principales: preparación de datos e implementación del modelo. En la primera etapa, se realiza la adquisición de datos a partir de comentarios de usuarios, seguida de un proceso de limpieza y transformación del texto para eliminar ruido y normalizar los datos. Posteriormente, se aplican técnicas de incrustación de palabras como Word2Vec y GloVe, junto con métodos léxicos tradicionales (Bag-of-Words, TFIDF, One-Hot Encoding) para convertir el texto en representaciones vectoriales adecuadas para el análisis. En la fase de implementación, se entrenan y comparan distintos modelos de clasificación, utilizando los embeddings generados. Adicionalmente, se aplica modelado de temas (LDA) para identificar patrones en los comentarios. Finalmente, se generan visualizaciones interactivas que permiten una comprensión clara de los resultados.Item Desarrollo de un modelo de aprendizaje automático no supervisado para seleccionar noticias relevantes(Pontificia Universidad Javeriana Cali, 2024) Hernández Saavedra, Juan Camilo; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésLa forma en que las personas se informan ha evolucionado constantemente con la proliferación de la tecnología. La mayoría de todos los medios de comunicación han abandonado parcialmente sus formatos físicos para adaptarse al mundo digital, más precisamente al entorno web. Este cambio ha llevado a un gran aumento en el número de lectores, generando beneficios tanto a los noticieros como a los lectores. Uno de los tantos beneficios que podemos encontrar es la facilidad y la rapidez con la que la información es llevada a los lectores, permitiéndoles acceder a las noticias en el lugar y momento que quieran con solo hacer un par de clics. Aunque inicialmente los beneficios eran evidentes, con el tiempo surgieron desafíos que han afectado a los medios de comunicación que publican noticias en formato web. Entre los problemas más comunes podemos encontrar la combinación de noticias irrelevantes con noticias relevantes para el lector, lo cual puede influir en el pensamiento e interés que ellos reciben durante sucesos importantes, teniendo en cuenta que las noticias, al tener una gran influencia en la percepción y toma de decisiones en la población, son una parte fundamental de la sociedad. En este trabajo se presentó una solución haciendo uso de modelos de aprendizaje automático no supervisado, representación de textos haciendo uso de técnicas del procesamiento del lenguaje natural, junto con una estrategia que consiste en obtener noticias de varios portales web de noticias. Si una noticia aparece dentro de varios portales, es considerada relevante. Esto se logra gracias a los modelos de representación de textos que permiten extraer el sentido y contexto de un titular, para posteriormente ser agrupados haciendo uso de modelos de clustering. Por último, estos modelos de clustering son ajustados haciendo uso de búsqueda de hiperparámetros, permitiendo obtener su mayor precisión posible. Finalmente, se logró construir dos modelos de clustering que, haciendo uso de modelos, representación de texto, técnicas de procesamiento del lenguaje natural y búsqueda de hiperparámetros para ajustar al máximo su precisión, son capaces de discernir qué noticias son relevantes de un grupo de noticias. Para demostrar el funcionamiento, se diseñó un pequeño prototipo de portal web de noticias, que contiene estos modelos de clustering en funcionamiento.Item Desarrollo de un sistema de recomendaciones personalizadas en la plataforma LMS KME360(Pontificia Universidad Javeriana Cali, 2025) Samacá Romero, Carolina; Peña Fajardo, Enrique José; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEste proyecto propone el desarrollo de un sistema de recomendación de contenidos y cursos personalizado para la plataforma LMS kme360. El sistema se diseñará de manera modular y escalable, con la capacidad de adaptarse a las necesidades de cada cliente futuro y a la configuración específica de sus instancias. La implementación de este sistema permitirá que la plataforma pueda ofrecer una experiencia de aprendizaje más personalizada y efectiva a sus usuarios, lo que se traducirá en una mayor satisfacción del cliente, un mejor aprovechamiento de los recursos disponibles y un potencial aumento en la tasa de finalización de los cursos. El proyecto se desarrollará siguiendo la metodología CRISP-DM, que establece seis etapas: comprensión del negocio, comprensión de los datos, preparación de los datos, modelado, evaluación y despliegue. Como resultado principal del proyecto, se obtendrá un modelo de recomendación que responderá a las características puntuales del cliente seleccionado. Se espera que este resultado impacte positivamente en la experiencia de aprendizaje de los usuarios de kme360, aumentando su satisfacción y compromiso con la plataforma.Item Develop of prototype system for people recognition based on ear biometrics(Pontificia Universidad Javeriana Cali, 2023) Córdoba Bravo, Juan Camilo; Torres Ordoñez, José Iván; Linares Ospina, Diego LuisItem “Diseminación selectiva de la información usando ciencia de datos: recomendación de libros y lecturas en las bibliotecas Comfama”(Pontificia Universidad Javariana Cali, 2024) Bedoya Henao, Edwin José; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEste proyecto se enfoca en el desarrollo de un sistema de recomendación de libros para las Bibliotecas Comfama, con el objetivo de mejorar la experiencia de los usuarios al proporcionar sugerencias personalizadas basadas en sus preferencias de lectura y comportamiento histórico. La relevancia del proyecto radica en abordar el problema de la infoxicación, o sobrecarga de información, en un entorno donde la vasta cantidad de materiales disponibles dificulta la selección de lecturas adecuadas para cada usuario. El sistema de recomendación se construyó utilizando técnicas avanzadas de ciencia de datos, como modelos de agrupación (K-Means) y representaciones vectoriales de libros mediante Word2Vec, lo que permite identificar patrones de lectura y preferencias individuales. A partir de esta estructura, se generaron recomendaciones altamente precisas y personalizadas que optimizan el servicio de préstamo de las Bibliotecas Comfama, aumentando así la satisfacción de los usuarios. El sistema se fundamenta en una estructura de datos que integra tanto características demográficas como el historial de préstamos y consultas de cada usuario, lo que facilita la identificación de perfiles de lectores y la agrupación de usuarios con intereses similares. Como resultado, el proyecto ofrece un sistema innovador que promueve el uso más frecuente y eficiente de los servicios bibliotecarios, fortaleciendo el papel de las bibliotecas en la promoción de la cultura y el conocimiento. Este enfoque tiene aplicaciones potenciales más allá del ámbito bibliotecario, con posibilidades de implementación en sectores como el comercio electrónico o la selección de contenido digital, aprovechando las capacidades de la ciencia de datos para anticipar y satisfacer las preferencias individuales de los usuarios.Item Generación de noticias a partir de conjuntos de datos económicos utilizando técnicas de inteligencia artificial y aprendizaje automático(Pontificia Universidad Javeriana Cali, 2025) López Gómez, David Leonardo; Bejarano Bejarano, Luis Vidal; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésEn el contexto actual de rápida generación de datos económicos, surge el desafío de transformar conjuntos de datos complejos en información accesible y comprensible. Esta investigación aborda esta problemática mediante el uso de técnicas de inteligencia artificial (IA) y aprendizaje automático (AA) para la generación automatizada de noticias basadas en procesamiento de lenguaje natural (PLN). Aquí, el problema radica en la ineficiencia de los métodos tradicionales de análisis de datos frente al volumen y la complejidad de la información económica contemporánea. Además, los medios de comunicación enfrentan una creciente demanda de entrega rápida y precisa de contenidos, lo que presenta desafíos significativos en términos de costos y operatividad. Para abordar estos retos, se desarrolló un sistema basado en los modelos T5 y GPT-2, ambos con arquitecturas de tipo transformer. Los datos económicos fueron preprocesados, limpiados y estructurados para entrenar los modelos. Se realizaron ajustes utilizando hiperparámetros optimizados y métricas de evaluación como BLEU, BERTScore y perplejidad, con el objetivo de medir la calidad de los textos generados. Los resultados mostraron que el modelo T5 superó al GPT-2 en precisión, coherencia y fluidez del texto generado, logrando un BLEU de 0.14, un BERTScore promedio (F1) de 0.83 y una perplejidad de 1.11 tras la optimización. En comparación, el GPT-2 alcanzó un BLEU de 0.15, un BERTScore promedio (F1) de 0.70 y una perplejidad de 12.75. Estas métricas indican que el T5 es más adecuado para generar textos complejos y altamente estructurados, mientras que el GPT-2 destaca en tareas donde se requiere mayor creatividad y generación de contenido más diversificado. El resultado de esta investigación, aporta un avance en la transformación de datos económicos en contenido informativo, reduciendo costos y tiempos asociados a los procesos tradicionales. La solución propuesta se presenta como una herramienta prometedora para democratizar el acceso a información económica y apoyar la toma de decisiones en entornos dinámicos.Item Machine learning with data augmentation to predict glucantime effectiveness against cutaneous leishmaniasis(Pontificia Universidad Javeriana Cali, 2021) Hoyos Urcué, Juan José; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEnfrentar problemas de análisis de datos en pequeños conjuntos de datos es un problema común en la investigación médica; asimismo, es un problema que dificulta mucho la aplicación y el éxito de los algoritmos clásicos de aprendizaje automático. Muchas técnicas han abordado el problema de un pequeño conjunto de datos, principalmente para los campos de visión artificial y procesamiento de imágenes. Sin embargo, para los datos tabulares, se ha difundido muy poco. En este trabajo de grado se propone el uso de técnicas de aumento de datos tabulares para introducir instancias sintéticas bastante similares a las reales, particularmente en el contexto de un problema médico/social de predecir la efectividad de Glucantime como tratamiento contra la Leishmaniasis cutánea. Los experimentos muestran que el uso de estos algoritmos de aumento de datos mejora las características del conjunto de datos inicial y el rendimiento de los modelos de aprendizaje automático. El conjunto de datos utilizado en esta investigación tiene diez atributos y 18 registros.Item Modelado para la recomendación personalizada de noticias basado en técnicas de aprendizaje automático(Pontificia Universidad Javariana Cali, 2024) Buesaco Vela, José Miguel; Lozano Hernández, Nydia Natalia; Bolaños Vidal, Jamith; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisLa digitalización ha generado que los usuarios se encuentren ante una sobreexposición de información, lo cual hace que tanto los usuarios como los medios de comunicación tradicionales y digitales se vean afectados. Para abarcar esta problemática, la ciencia de datos propone modelos de recomendación de noticias, los cuales tienen como objetivo analizar los gustos de los usuarios y, en función de estos generar filtros para proporcionarle al usuario una experiencia que ofrezca noticias de su interés. Con este proyecto buscamos desarrollar un modelo basado técnicas de aprendizaje automático para la recomendación personalizada de noticias. Para lograr el objetivo de este proyecto se realizan distintas fases como la preparación de los datos, modelado, entrenamiento, validación y finalmente se desarrolla un prototipo para la recomendación personalizada de noticias. Se aplican dos enfoques para las recomendaciones: el filtrado basado en contenido y el filtrado colaborativo, por la estructura de los datos utilizados, este último enfoque genera mejores recomendaciones. Los resultados muestran que el modelo denominado Descomposición en Valores Singulares (SVD) presenta el mejor desempeño en las predicciones determinado por la raíz del error cuadrático medio (RMSE) de 0,2461 y un F1-Score de 0,8118 en las listas personalizadas de recomendación de noticias.Item Modelo de red neuronal convolucional para la traducción de gestos en lenguaje de señas colombiano a texto enfocado en el sector hotelero colombiano(Pontificia Universidad Javeriana Cali, 2023) Naranjo Astaiza, Nicolle Dayana; Suárez Peña, María José; Linares Ospina, Diego Luis ; Álvarez Vargas, Gloria InésEl objetivo principal de este proyecto es apoyar a las personas con discapacidad sensorial auditiva, permitiéndoles llevar a cabo acciones básicas en entornos donde el personal no está debidamente capacitado para ofrecer una atención totalmente adecuada, como suele ser en el sector hotelero colombiano. Por lo tanto, es cada vez más necesario el desarrollo de una herramienta computacional capaz de reconocer y traducir gestos manuales del lenguaje de señas colombiano (LSC) a texto. Esta herramienta no solo busca cubrir una necesidad real en la sociedad, sino que también permitirá una atención inclusiva y una experiencia positiva para todos los involucrados. Los resultados obtenidos de este proyecto demuestran de manera concluyente la funcionalidad de la herramienta desarrollada. La identificación de los datos es efectiva, y la traducción a texto es precisa. La herramienta es capaz de reconocer los gestos manuales del LSC de acuerdo con el corpus utilizado.Item Modelo para la orientación sobre trámites al ciudadano en el Distrito de Santiago de Cali(Pontificia Universidad Javeriana Cali, 2025) Sánchez Soto, Giovanni; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésEste proyecto aplicado aborda la problemática de la atención a consultas de orientación sobre trámites al ciudadano en el Distrito de Santiago de Cali, explorando soluciones a partir del ajuste fino de Modelos de Lenguaje Grande (LLMs) para automatizar la generación de respuestas, se entrenaron modelos cuantizados Llama 3.2 3B Instruct y Phi 3.5 Mini Instruct con conjuntos de datos extraídos de plataformas oficiales del Distrito, tambien se implementó un sistema de Generación Aumentada por Recuperación (RAG), utilizando el modelo Llama 3.2 para la generación de respuestas. Los resultados de la evaluación demostraron que, si bien los modelos ajustados mostraron un buen desempeño semántico, presentaron problemas de factualidad mientras el enfoque basado en RAG obtuvo los mejores resultados en ambos casos.