Browsing by Subject "Deep learning"
Now showing 1 - 13 of 13
Results Per Page
Sort Options
Item Application of data augmentation methods in transfer learning algorithms to identify amphibian species in bioacoustic signals(Pontificia Universidad Javeriana Cali, 2024) Melo Ordóñez, Adriana Lucía; Tobón Llano, Luis EduardoEl calentamiento global y sus efectos se han establecido como asuntos importantes en la actualidad. Las consecuencias y evidencias del cambio climático deberían representar la urgencia de medidas más estrictas para prevenir secuelas irreversibles. De esta manera, es crucial reunir evidencia que corrobore el grado de efecto del calentamiento global, y el Monitoreo Acústico Pasivo, PAM en inglés, es un método para cumplir este objetivo. PAM puede supervisar especies que se encuentran en riesgo de extinción y que también son especialmente sensibles a los cambios de temperatura como es el caso de los anuros. Consecuentemente, estas especies son fundamentales en determinar el impacto del calentamiento global y la escala de urgencia para abordarlo. El estudio y supervisión de señales, reunidos de la aplicación de PAM, puede implicar un desafío debido a la extensa cantidad de horas de datos que se necesitan analizar, lo que puede ser una tarea demandante y que consume mucho tiempo. Entonces, el uso de Machine Learning aparece como una herramienta efectiva para automatizar la identificación de señales bioacústicas y facilitar su estudio. Sin embargo, con el fin de alcanzar resultados excepcionales con algoritmos de Machine Learning se requieren una cantidad de datos considerable, la cual no siempre puede estar disponible. Con el objeto de afrontar la falta de datos y mejorar el desempeño de los algoritmos, técnicas como la aumentación de datos y el aprendizaje por transferencia han sido desarrolladas. Este trabajo de grado pretende probar la eficacia de estas dos técnicas para clasificar espectrogramas multi-etiqueta generados de llamados de especies de anuros. Los experimentos involucraron comparar el desempeño de tres arquitecturas de redes neuronales convolucionales (ResNet, VGG y EfficientNet) en dos bases de datos. Los experimentos concluyeron que EfficientNet obtuvo los resultados más significativos, consiguiendo en promedio un F1-score de 0.83 cuando se usó junto con la aumentación de datos y el aprendizaje por transferencia.Item BananaGAN : Augmenting major banana disease detection using generated diseased pseudostem and rachis images(Pontificia Universidad Javeriana Cali, 2021) Vergara, Javier Alejandro; Acharjee, Animesh; Selvaraj, MichaelItem Citobot: un enfoque de inteligencia artificial para la detección temprana del cáncer de cuello uterino(Pontificia Universidad Javeriana Cali, 2024) Rivero Urbano, David Steven; Vargas Cardona, Hernán DaríoHoy en día, el cáncer de cuello uterino sigue siendo una preocupación en términos de salud pública a nivel mundial debido a su alta incidencia y mortalidad, especialmente en países en desarrollo. En 2022, en Colombia se reportaron 30.997 casos prevalentes, lo que significó un incremento del 17% en la proporción de casos nuevos reportados. A pesar de los avances y la disponibilidad de pruebas de detección, estas cifras continúan generando inquietud, principalmente en áreas rurales, debido a la dificultad para obtener imágenes diagnósticas y la falta de expertos médicos capacitados para proporcionar una evaluación precisa en estos sitios. En el ámbito de la ingeniería, el uso de algoritmos de aprendizaje automático y profundo ha demostrado ser efectivo en aplicaciones de imágenes médicas, permitiendo identificar patrones y extraer características de distintas enfermedades, obteniendo un diagnóstico preciso en segundos. Además, la metodología de MLOps (DevOps para Machine Learning) se ha posicionado como una solución para llevar estos modelos a producción de manera efectiva, automatizando los flujos de trabajo y garantizando la escalabilidad y fiabilidad de los algoritmos. MLOps fusiona las prácticas de desarrollo de software (DevOps) con los procesos específicos de Machine Learning (ML), facilitando la implementación efectiva de modelos en entornos de producción y asegurando la integridad y confiabilidad de los algoritmos a lo largo del ciclo de vida del modelo. Bajo este contexto, el proyecto CITOBOT busca desarrollar un sistema portátil basado en inteligencia artificial para el tamizaje del cáncer de cuello uterino, implementando metodologías que permitan integrar adecuadamente un modelo predictivo de imágenes colposcópicas en una aplicación móvil que impulse el dispositivo CITOBOT. El objetivo es mejorar la detección temprana del cáncer de cuello uterino y garantizar un diagnóstico preciso y confiable de la enfermedad. Con esta iniciativa, se busca aliviar la carga de los centros médicos al proporcionar una herramienta de apoyo para el diagnóstico del cáncer de cuello uterino. Además, se pretende abordar las limitaciones en el acceso a servicios especializados en áreas rurales, al ofrecer una solución que pueda ser utilizada en dichas regiones.Item Clasificación de arritmias cardiacas a partir de señales fisiológicas usando técnicas de aprendizaje profundo(Pontificia Universidad Javeriana Cali, 2024) Artunduaga Vaquiro, Jesús David; Rocha Navarro, Owen Isaías; Gil González, JuliánEn este proyecto se propuso el desarrollo de un sistema de clasificación de señales de electrocardiogramas (ECG) utilizando técnicas de aprendizaje profundo. El objetivo general de este estudio es desarrollar un sistema de clasificación que utilice modelos de aprendizaje automático para la detección de arritmias cardiacas a partir de señales fisiológicas. Para lograrlo, se plantean los siguientes objetivos específicos: preparar un conjunto de datos de señales de electrocardiogramas (ECG) con arritmias cardiacas para el entrenamiento de modelos de aprendizaje profundo, implementar dos modelos de aprendizaje profundo para la detección de arritmias cardiacas, evaluar los modelos para medir su rendimiento y elaborar una interfaz gráfica de usuario que permita interactuar con el modelo de mejor rendimiento. La metodología propuesta se basó en un enfoque sistemático y estructurado. Se inició con la preparación de un conjunto de datos relevantes de señales de electrocardiogramas con arritmias cardiacas, que incluyó la recopilación y limpieza de los datos. A continuación, se implementaron dos modelos de aprendizaje profundo, los cuales fueron ajustados y evaluados en cuanto a su rendimiento. Finalmente, se desarrolló una interfaz web para el modelo de clasificación de arritmias con el mejor rendimiento. Como resultados esperados, se obtuvieron dos modelos de aprendizaje profundo entrenados y listos para su evaluación, así como una interfaz web que mejoró la experiencia del usuario final con el modelo que presentó mejor rendimiento. Además, se generó un informe final que documentó todo el proceso de investigación, incluyendo los resultados obtenidos, conclusiones y recomendaciones para futuras investigaciones. Con este proyecto, se contribuye al campo de la detección de arritmias cardiacas mediante el uso de técnicas de aprendizaje profundo, brindando una herramienta que apoye el trabajo médico en el diagnóstico temprano de enfermedades cardíacas.Item Desarrollo de un componente de Deep Learning para el procesamiento de datos medio ambientales para la plataforma URB@NECOLIFE(Pontificia Universidad Javeriana Cali, 2020) Chaparro Cuadros, Cristian Alejandro; Zúñiga Cañón, Claudia LilianaEl Grupo de Investigación COMBA I+D de la Universidad Santiago de Cali, junto con la Universidad de Vigo y el Centro Universitario de la Defensa de España (CUD), han desarrollado el macroproyecto llamado Urb@nEcoLife. El cual busca, a través de una red de sensores móviles, capturar datos relacionados con la contaminación del aire. En el siguiente trabajo se muestra la implementación de la metodología Cross-Industry Standard Process for Data Mining CRISDM, con el fin de resolver y predecir posibles problemas medio ambientales de la ciudad Cali – Colombia, usando como base un algoritmo de red neuronal recurrente para procesar las series de tiempo armadas de los datos de contaminación de los años 2010 – 2017. Dentro del proyecto se exploraron.Item Desarrollo de un sistema de ecualización automática de audio a partir de un modelo de incrustación de palabras(Pontificia Universidad Javeriana Cali, 2024) Rengifo Mera, Juan David; Sarria Montemiranda, Gerardo MauricioEn este trabajo se desarrolla una herramienta de ecualización automática basada en descripciones del sonido mediante el uso de modelos de aprendizaje profundo y procesamiento del lenguaje natural. El objetivo es hacer accesible para cualquiera ecualizaciones de audio que respondan a sus deseos creativos, utilizando modelos de incrustación de palabras como GloVe, Tok2Vec, GPT y BERT, y combinándolos en un modelo de ensamble con una capa de atención.Item Estadificación imagenológica de la atrofia geográfica en la degeneración macular relacionada con la edad (DMAE), utilizando tomografía óptica coherente (OCT) con 3 cortes, en una población del sur de Colombia(Pontificia Universidad Javariana Cali, 2024) Quiñones Lucio, Andrés Felipe; Vargas Cardona, Hernán DaríoLa degeneración macular relacionada con la edad (DMAE) es una enfermedad degenerativa que afecta el segmento posterior del ojo, específicamente la mácula, que es la parte central de la retina responsable de la visión detallada y nítida. Es una de las principales causas de pérdida visual en personas mayores de 50 años. Existen dos tipos de DMAE: la atrófica o seca y la exudativa o húmeda. La forma atrófica es la más común y se caracteriza por la presencia de atrofia geográfica y acumulación de drusas— depósitos de desechos celulares y lipídicos—en la retina, particularmente en la mácula. Fisiopatológicamente, ocurre una descomposición y muerte (apoptosis) de las células maculares, lo que conduce a un deterioro gradual de la visión central. La forma exudativa es menos común pero más agresiva; se distingue por el desarrollo de neovascularización anormal debajo de la retina que puede sangrar y ocasionar cicatrices, resultando en una disminución más rápida de la agudeza visual. Aunque la DMAE no tiene cura, existen tratamientos que ayudan a retrasar su progresión y preservar la visión, lo que resalta la importancia del diagnóstico y tratamiento tempranos. La tomografía de coherencia óptica (OCT) se ha consolidado como una herramienta esencial para visualizar las capas retinianas y detectar cambios estructurales asociados con la DMAE. Las tecnologías avanzadas de OCT permiten obtener imágenes de alta resolución, facilitando la identificación de la atrofia y otras lesiones asociadas. La clasificación consensuada de la atrofia en DMAE mediante OCT ha sido establecida para estandarizar diagnósticos y fue la utilizada en el presente trabajo para su aplicación en técnicas de aprendizaje profundo.Item Generador de resúmenes para noticias sobre economía(Pontificia Universidad Javeriana Cali, 2024) Guerrero Caicedo, Natalia; Rivero Ortega, Jesús DavidSe diseñó y desarrolló un generador de resúmenes extractivos enfocado en noticias económicas utilizando técnicas de aprendizaje automático. Se exploraron diversas tecnologías relacionadas con el ámbito de la generación de resúmenes, de las cuales se escogieron las dos más pertinentes. Además, se discutieron las limitaciones técnicas asociadas a esta tarea y las estrategias posibles para mitigar estos desafíos.Item Identificación automática de ataque cerebrovascular (ACV) isquémico mediante la aplicación de técnicas de Deep Learning en imágenes de tomografía computarizada(Pontificia Universidad Javariana Cali, 2025) Hurtado Bustos, Sebastián; Valencia Amaya, Santiago; Vargas Cardona, Hernán DaríoEl ataque cerebrovascular isquémico (ACV) ocurre cuando un coágulo de sangrebloquea una arteria del cerebro, llevando a una interrupción del flujo sanguíneo y privando a las células cerebrales de oxígeno y nutrientes, siendo la segunda causa de muerte a nivel mundial según la OMS y es de las primeras causas de discapacidad a largo plazo. Por otro lado, la desinformación es un factor importante que agrava la problemática, dando prioridad a trabajar en la concientización de este. El proyecto tiene como objetivo principal entrenar modelos para apoyo al diagnóstico que puedan ayudar a los profesionales de la salud a detectar de manera más rápida y precisa el ACV isquémico, lo que podría tener un impacto significativo en el tratamiento y la recuperación de los pacientes, así como en la reducción de los costos asociados y el impacto socioeconómico de esta enfermedad. Los modelos implementan técnicas de aprendizaje profundo basadas en redes neuronales convolucionales en 3 dimensiones (CNN3D) las cuales se usaron como extractores de características sobre estudios de tomografía computacional (CT). Luego de procesar el conjunto de datos con todos los modelos de deep learning, se aplicaron clasificadores SVM con los kernels lineal, RBF y polinomial utilizando Grid Search para ajustar hiperparámetros, KNN evaluado con 3 y 5 vecinos; Perceptrón Multicapa (MLP) y XGBoost. Para cada clasificador se realizaron 10 repeticiones con partición 70-30 % (Hold-Out aleatorio), y se reportó el valor promedio ± desviación estándar de la exactitud, sensibilidad, especificidad, F1-Score, y AUCROC. El esquema experimental permitió demostrar que las CNN 3D funcionan muy bien comoextractores de información relevante en CT, para identificar automáticamente ACV.Item Identificación automática de patologías en la voz a partir de técnicas de aprendizaje automático(Pontificia Universidad Javariana Cali, 2024) Acosta López, Juan Esteban; Palacio Lozano, Carlos Felipe; Gil González, JuliánEl proyecto de investigación profundizó en el desarrollo de múltiples modelos de aprendizaje automático, estableciendo una comparativa entre las técnicas clásicas de aprendizaje y las cada vez más emergentes técnicas de aprendizaje profundo, llevando a cabo una tarea de clasificación en el ámbito de la salud. El problema central de esta investigación consistió en determinar de manera precisa si un modelo de aprendizaje automático podía identificar la presencia de patologías en la voz. El enfoque adoptado para ambas técnicas de aprendizaje fue diferenciado, permitiendo a los modelos de cada técnica centrarse en distintas aproximaciones para resolver el mismo problema. Varias tareas realizadas previamente al desarrollo de los modelos contribuyeron a mejorar sus resultados, demostrando cómo, mediante ciertas estrategias, se pueden superar limitaciones como la cantidad de datos disponibles, logrando así un mejor desempeño. Finalmente, al completar los experimentos, se desarrolló una interfaz gráfica que permite interactuar con dos de los modelos creados, destacando los mejores resultados obtenidos en cada una de las técnicas de aprendizaje seleccionadas. Los resultados finales resaltan cómo el aprendizaje automático desempeña un papel diferencial en tareas complejas para los seres humanos, ya sea por su naturaleza imperceptible o por la necesidad de analizar grandes volúmenes de datos para generar resultados en tiempo real. En conclusión, esta investigación evidencia el potencial del aprendizaje automático en la detección de patologías en la voz, logrando resultados precisos a pesar de contar con una cantidad limitada de datos en comparación con otros problemas. Además, abre el camino para futuros refinamientos y estudios clínicos que incluyan los modelos en entornos reales, permitiendo obtener una retroalimentación no observable en las etapas de desarrollo.Item Modelo de clasificación de planos cerebrales en ecografías prenatales utilizando aprendizaje de máquina profundo(Pontificia Universidad Javariana Cali, 2025) Aguado Valderrama, Juan José; Rodríguez López, Luis Alfredo; Torres Valencia, Cristian Alejandro; Palta, FelipeLas Ecografías Craneales Prenatales (ECP) desempeñan un papel crucial en el monitoreo del desarrollo fetal. No obstante, la evaluación de imágenes de ECP entre las semanas 18 a 40 del embarazo enfrenta grandes retos debido a la falta de herramientas automatizadas para su clasificación. Actualmente, el diagnóstico depende en gran medida de la interpretación de especialistas, lo que implica largas horas de clasificación manual para análisis más profundos y el almacenamiento de la información. Esta situación se ve agravada en áreas con recursos limitados, donde la escasez de profesionales capacitados y equipos de alta calidad puede comprometer la precisión y accesibilidad de las evaluaciones. La automatización de la clasificación de imágenes ECP podría aliviar la carga de trabajo de los especialistas y mejorar la eficiencia en los análisis. Este estudio propone desarrollar una herramienta basada en aprendizaje profundo para clasificar los distintos planos del cerebro (transventricular, transtalámico y transcerebeloso) en imágenes de ECP. La metodología incluye el preprocesamiento de imágenes, segmentación y clasificación mediante redes neuronales convolucionales. Además, se evaluará el rendimiento del modelo utilizando métricas como precisión, exactitud, sensibilidad y puntuación F1, con validación por profesionales de la salud.Item Modelo para la detección de cáncer de seno en imágenes histológicas a partir de aprendizaje profundo con múltiples anotadores(Pontificia Universidad Javeriana Cali, 2024) González Vélez, Juan Felipe; Buitrago Chávez, Jhoan Manuel; Gil González, JuliánEl cáncer de seno es el tipo de cáncer más común en mujeres, por lo que la detección temprana de esta enfermedad es crucial para combatirla. Actualmente, una de las formas de detectar el cáncer de seno es mediante el análisis del tejido mamario a través de imágenes histológicas. Este análisis es un proceso tedioso que debe ser realizado por un experto. El aprendizaje automático puede ser útil para facilitar esta tarea; sin embargo, requiere una cantidad suficiente de información recolectada para su entrenamiento, lo cual es difícil de obtener debido a la escasez de expertos capaces de anotar las imágenes. En este proyecto se proponen diferentes modelos de aprendizaje profundo para la clasificación de imágenes histológicas, aprovechando las anotaciones de múltiples anotadores con diversos grados de experiencia y conocimiento. Los resultados de estos modelos fueron comparados con varios modelos clásicos de aprendizaje automático que utilizan las etiquetas verdaderas para su entrenamiento.Item Sistema de clasificación de coberturas en imágenes tomadas por drones usando técnicas de Deep Learning(Pontificia Universidad Javeriana Cali, 2020) Tello Dagua, Jhon Jairo; Reymondin, LouisEl mapeo de la cobertura terrestre es un tema de investigación importante en la ciencia del cambio en el uso de la tierra y la planificación del paisaje. Las actividades humanas cambian constantemente los patrones de cobertura de la tierra e influyen en los procesos biofísicos del territorio. Tradicionalmente la detección, clasificación y el monitoreo de coberturas de la tierra se ha llevado a cabo a través de la teledetección satelital. La capacidad para detectar, clasificar y cuantificar depende en gran parte de la capacidad del sensor y técnicas de clasificación entre las que se destacan la supervisada y no supervisada. Estas técnicas dependen de la calidad del algoritmo utilizado para discriminar las categorías. Con el uso de los drones es posible en la actualidad contar con grandes conjuntos de imágenes de alta resolución que contienen una gran cantidad de información que se puede explorar. Estas imágenes tienen el potencial de contener varios tipos de características como: bosques, casas, edificios, cultivos, carreteras, entre muchos otros. Esta investigación se enfocará en explorar el uso de técnicas de Deep Learning y redes neuronales convolucionales para la clasificación automatizada de coberturas de la tierra usando imágenes de alta resolución tomadas por drones. Se usará la librería de Deep Learning, Deeplearning4j para implementar un prototipo para la clasificación de coberturas. Como este tipo de modelos requiere que el conjunto de datos de entrenamiento sea bastante grande para un rendimiento más óptimo también dentro de la investigación se creará una plataforma para el etiquetado de imágenes por parte de expertos y una base de datos que estará en continuo crecimiento a medida que se etiqueten nuevas imágenes.