Browsing by Subject "Machine Learning (ML)"
Now showing 1 - 3 of 3
Results Per Page
Sort Options
Item Generación automática de resúmenes de documentos financieros usando técnicas basadas en grafos(Pontificia Universidad Javeriana Cali, 2024) Hernández Giraldo, Andrés Felipe; Rocha Fernández, Cristian David; Montes Estrada, Juan Carlos; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisLa generación automática de resúmenes es un área de creciente interés que busca facilitar la comprensión eficiente de grandes volúmenes de información textual. Este proyecto aborda el problema combinando técnicas extractivas y abstractivas mediante un enfoque mixto y el uso de algoritmos de grafos. El sistema automatizado desarrollado incluye la preparación y limpieza de textos financieros, vectorización con TF-IDF y modelos de embeddings como Cohere y Jina AI, cálculo de similitud coseno, creación de grafos, y selección de oraciones relevantes mediante el algoritmo MMR. El código fuente del proyecto, desarrollado en Python, está disponible en un repositorio con instrucciones de instalación y ejecución.Item Generación de noticias a partir de conjuntos de datos económicos utilizando técnicas de inteligencia artificial y aprendizaje automático(Pontificia Universidad Javeriana Cali, 2025) López Gómez, David Leonardo; Bejarano Bejarano, Luis Vidal; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésEn el contexto actual de rápida generación de datos económicos, surge el desafío de transformar conjuntos de datos complejos en información accesible y comprensible. Esta investigación aborda esta problemática mediante el uso de técnicas de inteligencia artificial (IA) y aprendizaje automático (AA) para la generación automatizada de noticias basadas en procesamiento de lenguaje natural (PLN). Aquí, el problema radica en la ineficiencia de los métodos tradicionales de análisis de datos frente al volumen y la complejidad de la información económica contemporánea. Además, los medios de comunicación enfrentan una creciente demanda de entrega rápida y precisa de contenidos, lo que presenta desafíos significativos en términos de costos y operatividad. Para abordar estos retos, se desarrolló un sistema basado en los modelos T5 y GPT-2, ambos con arquitecturas de tipo transformer. Los datos económicos fueron preprocesados, limpiados y estructurados para entrenar los modelos. Se realizaron ajustes utilizando hiperparámetros optimizados y métricas de evaluación como BLEU, BERTScore y perplejidad, con el objetivo de medir la calidad de los textos generados. Los resultados mostraron que el modelo T5 superó al GPT-2 en precisión, coherencia y fluidez del texto generado, logrando un BLEU de 0.14, un BERTScore promedio (F1) de 0.83 y una perplejidad de 1.11 tras la optimización. En comparación, el GPT-2 alcanzó un BLEU de 0.15, un BERTScore promedio (F1) de 0.70 y una perplejidad de 12.75. Estas métricas indican que el T5 es más adecuado para generar textos complejos y altamente estructurados, mientras que el GPT-2 destaca en tareas donde se requiere mayor creatividad y generación de contenido más diversificado. El resultado de esta investigación, aporta un avance en la transformación de datos económicos en contenido informativo, reduciendo costos y tiempos asociados a los procesos tradicionales. La solución propuesta se presenta como una herramienta prometedora para democratizar el acceso a información económica y apoyar la toma de decisiones en entornos dinámicos.Item Machine Learning aplicado a estudios de otorgamiento de créditos en presencia del desbalanceo de clases(Pontificia Universidad Javeriana Cali, 2024) Grijalba González, Daniel Felipe; Ochoa Muñoz, Andrés Felipe; García Arboleda, Isabel CristinaEn el sector bancario, la toma de decisiones sobre la aprobación o rechazo de créditos es crucial para equilibrar la rentabilidad y la gestión de riesgos. Los modelos de Machine Learning (ML) son herramientas útiles en este proceso, aunque enfrentan desafíos como el desbalanceo de clases, que puede afectar la capacidad predictiva y sesgar los resultados hacia la clase dominante. Este trabajo de grado aborda el desbalanceo de clases en el otorgamiento de créditos utilizando modelos de ML aplicados a tres conjuntos de datos públicos de Kaggle con diferentes tasas de otorgamiento. Se evaluaron y compararon técnicas como Oversampling, Undersampling y SMOTE para mejorar la capacidad predictiva y reducir el sesgo, con el fin de optimizar la gestión de riesgos y aumentar la rentabilidad de las instituciones financieras.