Repository logo
  • Communities & Collections
  • All of DSpace
  • English
  • Català
  • Čeština
  • Deutsch
  • Español
  • Français
  • Gàidhlig
  • Italiano
  • Latviešu
  • Magyar
  • Nederlands
  • Polski
  • Português
  • Português do Brasil
  • Suomi
  • Svenska
  • Türkçe
  • Tiếng Việt
  • Қазақ
  • বাংলা
  • हिंदी
  • Ελληνικά
  • Yкраї́нська
  • Log In
    New user? Click here to register.Have you forgotten your password?
  1. Home
  2. Browse by Subject

Browsing by Subject "Machine Learning (ML)"

Now showing 1 - 4 of 4
Results Per Page
Sort Options
  • Loading...
    Thumbnail Image
    Item
    Desarrollo de modelo de machine learning para la identificación de correlaciones entre genotipo y fenotipo de individuos con síndrome de Prader-Willi
    (Pontificia Universidad Javariana Cali, 2025) Romero Bernal, Daniel Felipe; Tafur Jiménez, Luis Alberto; Tobar Tosse, Fabián
    El presente proyecto aborda el Síndrome de Prader-Willi (SPW), un trastorno genético complejo asociado a alteraciones en la impronta genómica de la región cromosómica 15q11-q13, que se caracteriza por un amplio espectro de manifestaciones clínicas, incluida la obesidad severa. A pesar de los avances en diagnóstico genético, persisten limitaciones significativas en la comprensión de cómo las modificaciones genéticas y epigenéticas contribuyen a las características fenotípicas del SPW. El objetivo principal fue desarrollar un modelo de Machine Learning (ML) para identificar correlaciones entre genotipo y fenotipo, utilizando datos genéticos y epigenéticos. Para ello, se integraron diversas fuentes de datos públicos, creando un conjunto de datos consolidado que permitió representar mejor las manifestaciones clínicas asociadas al síndrome. Se construyeron y evaluaron tres modelos de ML, seleccionados por su capacidad para manejar relaciones complejas entre variables y garantizar interpretabilidad. Las métricas de evaluación, como precisión, sensibilidad y f1-score, fueron ajustadas mediante la optimización de parámetros y la mejora del procesamiento de datos. A pesar de las limitaciones inherentes al tamaño y calidad de la base de datos, los resultados del proyecto muestran que el enfoque propuesto es prometedor para inferir el fenotipo dado por cambios en los perfiles de metilación, a partir de las características genómicas en pacientes con SPW. Estos hallazgos podrían facilitar tanto el desarrollo de tratamientos personalizados como la identificación temprana del síndrome. En última instancia, la identificación precisa de correlaciones genotípicas y fenotípicas contribuye significativamente a una mejor comprensión de los mecanismos moleculares subyacentes del SPW y sus posibles implicaciones terapéuticas.
  • No Thumbnail Available
    Item
    Generación automática de resúmenes de documentos financieros usando técnicas basadas en grafos
    (Pontificia Universidad Javeriana Cali, 2024) Hernández Giraldo, Andrés Felipe; Rocha Fernández, Cristian David; Montes Estrada, Juan Carlos; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego Luis
    La generación automática de resúmenes es un área de creciente interés que busca facilitar la comprensión eficiente de grandes volúmenes de información textual. Este proyecto aborda el problema combinando técnicas extractivas y abstractivas mediante un enfoque mixto y el uso de algoritmos de grafos. El sistema automatizado desarrollado incluye la preparación y limpieza de textos financieros, vectorización con TF-IDF y modelos de embeddings como Cohere y Jina AI, cálculo de similitud coseno, creación de grafos, y selección de oraciones relevantes mediante el algoritmo MMR. El código fuente del proyecto, desarrollado en Python, está disponible en un repositorio con instrucciones de instalación y ejecución.
  • Loading...
    Thumbnail Image
    Item
    Generación de noticias a partir de conjuntos de datos económicos utilizando técnicas de inteligencia artificial y aprendizaje automático
    (Pontificia Universidad Javeriana Cali, 2025) López Gómez, David Leonardo; Bejarano Bejarano, Luis Vidal; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria Inés
    En el contexto actual de rápida generación de datos económicos, surge el desafío de transformar conjuntos de datos complejos en información accesible y comprensible. Esta investigación aborda esta problemática mediante el uso de técnicas de inteligencia artificial (IA) y aprendizaje automático (AA) para la generación automatizada de noticias basadas en procesamiento de lenguaje natural (PLN). Aquí, el problema radica en la ineficiencia de los métodos tradicionales de análisis de datos frente al volumen y la complejidad de la información económica contemporánea. Además, los medios de comunicación enfrentan una creciente demanda de entrega rápida y precisa de contenidos, lo que presenta desafíos significativos en términos de costos y operatividad. Para abordar estos retos, se desarrolló un sistema basado en los modelos T5 y GPT-2, ambos con arquitecturas de tipo transformer. Los datos económicos fueron preprocesados, limpiados y estructurados para entrenar los modelos. Se realizaron ajustes utilizando hiperparámetros optimizados y métricas de evaluación como BLEU, BERTScore y perplejidad, con el objetivo de medir la calidad de los textos generados. Los resultados mostraron que el modelo T5 superó al GPT-2 en precisión, coherencia y fluidez del texto generado, logrando un BLEU de 0.14, un BERTScore promedio (F1) de 0.83 y una perplejidad de 1.11 tras la optimización. En comparación, el GPT-2 alcanzó un BLEU de 0.15, un BERTScore promedio (F1) de 0.70 y una perplejidad de 12.75. Estas métricas indican que el T5 es más adecuado para generar textos complejos y altamente estructurados, mientras que el GPT-2 destaca en tareas donde se requiere mayor creatividad y generación de contenido más diversificado. El resultado de esta investigación, aporta un avance en la transformación de datos económicos en contenido informativo, reduciendo costos y tiempos asociados a los procesos tradicionales. La solución propuesta se presenta como una herramienta prometedora para democratizar el acceso a información económica y apoyar la toma de decisiones en entornos dinámicos.
  • Loading...
    Thumbnail Image
    Item
    Machine Learning aplicado a estudios de otorgamiento de créditos en presencia del desbalanceo de clases
    (Pontificia Universidad Javeriana Cali, 2024) Grijalba González, Daniel Felipe; Ochoa Muñoz, Andrés Felipe; García Arboleda, Isabel Cristina
    En el sector bancario, la toma de decisiones sobre la aprobación o rechazo de créditos es crucial para equilibrar la rentabilidad y la gestión de riesgos. Los modelos de Machine Learning (ML) son herramientas útiles en este proceso, aunque enfrentan desafíos como el desbalanceo de clases, que puede afectar la capacidad predictiva y sesgar los resultados hacia la clase dominante. Este trabajo de grado aborda el desbalanceo de clases en el otorgamiento de créditos utilizando modelos de ML aplicados a tres conjuntos de datos públicos de Kaggle con diferentes tasas de otorgamiento. Se evaluaron y compararon técnicas como Oversampling, Undersampling y SMOTE para mejorar la capacidad predictiva y reducir el sesgo, con el fin de optimizar la gestión de riesgos y aumentar la rentabilidad de las instituciones financieras.
logo-javeriana

Pontificia Universidad Javeriana Cali

Calle 18 No 118-250 Cali, Colombia

Teléfono:(+57) 602-321-82-00/602-485-64-00 - Línea gratuita nacional 01-8000-180556

Contacto repositorio Vitela: vitela@javerianacali.edu.co