Maestría en Ciencia de Datos
Permanent URI for this collection
Browse
Browsing Maestría en Ciencia de Datos by Title
Now showing 1 - 20 of 107
Results Per Page
Sort Options
Item Análisis comparativo de Modelos de Segmentación en imágenes de tomografía computarizada (CT) del área abdominal(Pontificia Universidad Javeriana Cali, 2024) Polanco Velasco, Jan; Astudillo Bello, Stefania; Gil González, JuliánEl presente trabajo de grado titulado “Análisis comparativo de Modelos de Segmentación en imágenes de tomografía computarizada (CT) del área abdominal” se propone desarrollar y comparar seis modelos de Deep Learning ampliamente utilizados en tareas de segmentación: U-Net, U-Net con Backbone VGG16, U-Net con Backbone ResNet50, SegNet, FPN con Backbone ResNet50 y LinkNet con Backbone VGG16. El objetivo principal de este estudio es determinar cuál de estos modelos ofrece el mejor rendimiento en términos de precisión, recall, coeficiente Dice, accuracy, IoU y loss, al segmentar imágenes de CT del área abdominal. El proyecto se estructura en varias etapas clave. En primer lugar, se lleva a cabo una recolección y procesamiento exhaustivo de los datos de CT abdominal, incluyendo técnicas de limpieza de artefactos y ruido adicional, así como el uso de Data Augmentation para aumentar la diversidad del conjunto de datos. Posteriormente, se implementan y entrenan los modelos de segmentación seleccionados utilizando plataformas avanzadas de computación, como Kaggle, ajustando los parámetros específicos para el problema en cuestión. La evaluación del rendimiento de cada modelo se realiza utilizando un conjunto de métricas rigurosas y específicas, tales como precisión, recall, coeficiente Dice, accuracy, IoU, loss, F1 y F2, permitiendo un análisis comparativo detallado de los resultados obtenidos. Además, se consideran aspectos como el tiempo de entrenamiento y la capacidad de generalización de los modelos a nuevos datos no vistos durante el entrenamiento.Item Análisis de clusterización de clientes alertados por posibles operaciones sospechosas en bancolombia(Pontificia Universidad Javeriana Cali, 2024) Ospina Martínez, Ximena; Mariaca Rueda, Cristian David; Cano Cadavid, Andrés FelipeEn la Vicepresidencia de Cumplimiento en Bancolombia cada mes se generan alertas de clientes con posibles operaciones sospechosas, identificadas a partir de modelos analíticos detectivos. El crecimiento del negocio y aumento de la cobertura de tipologías ha derivado en un aumento de alertas, saturando la capacidad de análisis del área de Investigación, lo que impide generar una respuesta oportuna para mitigar el riesgo de Lavado de Activos y Financiación del Terrorismo (LAFT). Por el aumento de alertas, se han implementado algunos métodos de agrupación que emplean procedimientos intuitivos y requieren aproximadamente tres días hábiles para su ejecución. Para el área de Investigación es útil este proyecto, ya que se centra en buscar la mejora de los procesos de evaluación impactando dos aspectos relevantes a la hora de identificar riesgos LAFT: capacidad y tiempo oportuno de evaluación de las alertas. El objetivo principal del trabajo es implementar modelos de clusterización a partir de técnicas de aprendizaje de máquina para agrupar a los clientes alertados según características de riesgo LAFT que estos representan para el Banco. Además, se busca identificar las variables más relevantes e influyentes en el riesgo LAFT de un cliente alertado. Se espera obtener un modelo de agrupamiento para clientes con posibles operaciones sospechosas en Bancolombia, tener claras las variables, características y patrones que tienen los clientes alertados por operaciones sospechosas, para ser tenidas en cuenta en los monitoreos del Banco, y de esta forma, aportar a que el indicador de oportunidad en el tiempo de respuesta de las alertas sea optimo.Item Análisis de conglomerados en desigualdades y Enfermedades Cardiovasculares (ECV): una base para la asignación de recursos en políticas públicas en salud(Pontificia Universidad Javariana Cali, 2024) Meza Buchely, Juan Sebastián; Rosero Ramos, Karen Marcela; Paz Roa, Juan CamiloEl proyecto tiene como objetivo identificar la incidencia de las condiciones socioeconómicas en la mortalidad por ECV para fortalecer la focalización de recursos de las políticas públicas de salud en la región pacífica colombiana teniendo como base información correspondiente al periodo 2016-2020 mediante un análisis de conglomerados geoespacial. La metodología empleada en el estudio combina un enfoque teórico-práctico basado en la recolección de datos secundarios y su posterior análisis mediante la metodología CRISP-DM, que consta de seis etapas para el procesamiento de datos. Se emplearon técnicas de análisis espacial y de conglomerados para identificar patrones en la prevalencia de mortalidad por ECV en la región pacífica colombiana. El procedimiento incluyó la recopilación de información de fuentes oficiales, la aplicación de reducción de dimensionalidad (T-SNE) y el uso de algoritmos de clusterización (K-means y otros métodos complementarios) para agrupar municipios según sus características sociodemográficas y tasas de mortalidad. Posteriormente, se validaron los resultados con expertos en políticas públicas de salud y se implementó un tablero digital interactivo para la visualización de los hallazgos, con el objetivo de apoyar la toma de decisiones en salud pública. Los resultados del estudio permitieron destacar que las condiciones socioeconómicas, como el NBI, la cobertura educativa, el IRCA, el valor agregado y el gasto en salud, tienen un alto poder explicativo en la mortalidad por ECV en la región pacífica colombiana. Utilizando el método K-means con reducción de dimensionalidad mediante T-SNE, se agruparon los municipios en cuatro clústeres con características diferenciadas. La validación con métricas estadísticas determinó que este modelo era el más adecuado, confirmando su consistencia y separación óptima de los grupos. Además, los resultados fueron validados por expertos en salud pública, quienes resaltaron la relevancia del estudio para la focalización de recursos y la formulación de políticas. Finalmente, se desarrolló un tablero digital de acceso público para apoyar la toma de decisiones en saludItem Análisis de factores y alerta temprana del riesgo de violencia basada en género en Colombia(Pontificia Universidad Javeriana Cali, 2023) Barrera Barrera, David Samuel; Poveda Aguirre, Eliana Liney; Arango Londoño, DavidLa violencia física, psicológica, sexual y económica contra las mujeres hacen parte de las distintas formas de violencia basada en género (VBG). En consecuencia, con el presente proyecto se creó, tentativamente, un modelo de aprendizaje no supervisado que permitió identificar los determinantes que inciden en la VBG y, con ello, visibilizar el uso de herramientas de machine learning para la comprensión de este fenómeno a nivel nacional. Conocer dónde se concentra, por qué, y en qué casos se incrementa la violencia de pareja y sexual es relevante para la prevención y, en particular, para la planificación de los recursos y servicios institucionales implicados en la lucha contra la VBG, especialmente de intervención temprana.Item Análisis de imágenes satelitales para la clasificación de ecosistemas en predios(Pontificia Universidad Javariana Cali, 2024) Quiroz Moscarella, Roberto Enrique; Santos Peñuela, Francisco José; Castaño Idárraga, Omar AndrésEl proyecto aplicado se centra en la segmentación de imágenes satelitales de predios para identificar ecosistemas. Aborda la problemática del trabajo manual requerido para segmentar zonas en imágenes, especialmente en la elaboración de proyectos de bonos de carbono. Se desarrolló un algoritmo funcional que permita a los investigadores segmentar grandes extensiones de tierra de manera eficiente, reduciendo el tiempo necesario para esta tarea. Los resultados obtenidos permiten la automatización del proceso de segmentación, particularmente sobre zonas verdes y cuerpos de agua permitiendo la evaluación de su extensión. Las posibles aplicaciones de este proyecto abarcan la investigación ambiental, la planificación del uso del suelo y la gestión de recursos naturales.Item Análisis de la deforestación en la Amazonía colombiana usando técnicas de aprendizaje automático(Pontificia Universidad Javeriana Cali, 2023) León Acosta, Paola Andrea; Otero Martínez, Guillermo AndrésDebido al alto impacto de la deforestación en el calentamiento global, el aumento de enfermedades zoonóticas y el riesgo de extinción de la biodiversidad, surge la necesidad de desarrollar nuevos enfoques para la medición y análisis de la deforestación que permitan a los gobiernos tener una mejor compresión de este fenómeno para centrar su atención y recursos a atender esta crisis ambiental en las zonas más vulnerables. Dada esta situación y considerando el amplio uso de los algoritmos de aprendizaje automático para analizar datos complejos como imágenes y textos, este proyecto tuvo como objetivo analizar el comportamiento de la deforestación en la Amazonía colombiana usando diferentes técnicas de aprendizaje automático con imágenes satelitales de Google earth engine, considerando estas metodologías como nuevas propuestas de medición en el análisis de la cobertura forestal. Posteriormente, se evaluaron estos modelos mediante métricas de evaluación, una vez seleccionado el modelo con mejor rendimiento, se identificaron las zonas con deforestación en las imágenes satelitales, y a partir de estos resultados se cuantificó y analizó el incremento de la perdida de bosques en un periodo determinado con el propósito de generar alertas de las zonas más vulnerables, y así brindar una herramienta que se pueda considerar como un insight para la formulación de planes de acción y políticas para la prevención y reforestación.Item Análisis de la red de transporte del sistema de transporte masivo de Cali (MIO) en términos de transbordo(Pontificia Universidad Javeriana Cali, 2024) Marín Zamora, César Alejandro; Guzmán Zuñiga, Jhon Alexander; Vargas Valencia, Miguel Ángel; Martínez Arias, Juan CarlosEn el 2008 en la Ciudad de Cali se implementó un sistema de transporte masivo (MIO), que desde la fecha a la actualidad ha presentado inconvenientes para cubrir su demanda con eficiencia, generando colapso en sus estaciones e inconformidades en sus pasajeros. A partir de lo anterior, se planteó este proyecto de investigación donde se realizo un análisis a la red de transporte del sistema MIO en términos de transbordo, a través de técnicas de recolección y procesamiento de datos como web scraping, clustering aglomerativo, teoría de redes, Network Analysis, medidas de centralidad e intermediación de una red, encontrando como resultado la caracterización de la red de transporte MIO con relación a los transbordos que la conforman, mediante la identificación de las rutas y los puntos de transbordos más utilizados e importantes de la Ciudad, el reconocimiento del patrón de movilidad de los pasajeros con relación al uso de transbordos y la eficiencia del sistema de transporte MIO; información que se podrá utilizar en futuras investigaciones para crear planes de mejora.Item Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado(Pontificia Universidad Javeriana Cali, 2024) Pizarro Rivera, Francisco; Pabón, María ConstanzaEl análisis de polaridad u orientación semántica es una de las ramas del Natural Language Processing que ha tenido más crecimiento en el última década, con amplias aplicaciones a nivel académico y comercial. En este proyecto de grado se realizó una exploración sobre la aplicación de modelos de Machine Learning de carácter Auto Supervisado y No Supervisado para realizar el análisis de polaridad en tweets escritos por los usuarios de la red social X específicamente escritos sobre el contexto político colombiano. Se exploró el uso de un enfoque con modelos híbridos, en los cuales se hace un preproceso de pseudo etiquetado por medio de un modelo basado en lexicones (modelo VADER) para luego entrenar modelos supervisados como SVM, Logistic Regression y Multinomial Naive Bayes. El segundo enfoque constó de usar el modelo No Supervisado de K-Means, obteniendo un performance superior en la ejecución del modelo hibrido. Este trabajo tiene también por output la exportación a modo de prototipo del modelo con mejor performance y su vectorizador entrenado con el vocabulario de los 4.830 tweets recolectados de manera manual para ser desplegado en posibles ambientes de producción para el desarrollo de herramientas de análisis de orientación semántica aplicada a textos de redes sociales, pero en específico a tweets relacionados con el contexto político colombiano.Item Análisis de sentimientos utilizando aprendizaje automático de menciones en twitter para la secretaría de movilidad de Bogotá(Pontificia Universidad Javeriana Cali, 2023) Quiñonez Romero, Luis Eduardo; Carbonell García, Luisa Fernanda; Peralta Alean, Andrés Gabriel; Pabón Burbano, María ConstanzaLa evolución de la sociedad moderna ha llevado a la instauración de urbes de gran densidad en donde difícilmente se logra mantener un balance entre las zonas de trabajo, estudio y las zonas residenciales, lo que genera desplazamientos considerables para la población media dentro de su ciclo de cotidianidad. La ciudad de Bogotá no es la excepción a estas condiciones, por lo que la Secretaría de Movilidad asume un reto en la implementación de medidas que agilicen el transporte de los ciudadanos. Un desafío subyacente en la implementación de estas medidas es la medición de su efectividad, donde la percepción de los usuarios juega un papel fundamental en la evolución de los planes de movilidad y la identificación de necesidades y ajustes de las iniciativas actuales. En ese sentido las redes sociales operan como compiladores masivos de percepciones sobre la gestión realizada, generando que la Secretaría enfoque esfuerzos de comunicación sobre la red social twitter, queriendo contar con un mecanismo automatizado que permita identificar las tendencias en cuanto a las percepciones de los usuarios. Para tal fin se pretende desarrollar un análisis de sentimientos con un modelo de clasificación de aprendizaje supervisado, el cual permita, mediante una aplicación en línea usando uno o varios modelos entrenados, identificar y clasificar conjuntos de tweets.Item Análisis descriptivo y predictivo para la vigilancia de los casos de dengue grave en la ciudad de Cali(Pontificia Universidad Javeriana de Cali, 2023) Mena Ríos, Andrés Mauricio; Hurtado Murillo, Faber Esteban; Sánchez Andrade, Jefferson; Arango Londoño, DavidEste proyecto de ciencia de datos desarrolla un modelo predictivo que permite estimar la cantidad de casos de dengue grave que ocurren en un determinado momento en la ciudad de Cali. Para eso, se realiza un análisis de la dinámica de la enfermedad, considerando aspectos como la temporalidad, la incidencia geográfica y algunas variables sociodemográficas; además, se construyen modelos predictivos basados en cuatro algoritmos de Machine Learning, el uso de fuentes de datos informales, y la incorporación de una variable novedosa como predictor. La primera parte del proyecto se enfoca en análisis descriptivos del dengue grave en Cali, a partir del procesamiento de los registros históricos oficiales, con el propósito de comprender patrones y tendencias de la enfermedad e identificar factores relacionados con su incidencia. La segunda sección del proyecto gira alrededor de la determinación del mejor modelo para predecir la cantidad de casos de dengue en Cali, haciendo uso de una variedad de recursos de la ciencia de datos para la construcción, evaluación y análisis de los candidatos.Item Aplicación de ciencia de datos para proyección de saldos de productos de captaciones en entidad bancaria(Pontificia Universidad Javeriana de Cali, 2023) León Gil, Carlos Alberto; Pinzón Cortés, Mauricio; Arango Londoño, DavidLos datos son el insumo principal de un proyecto de ciencia de datos y a su vez hoy día son el activo más importante que se tiene en cualquier sector. Los resultados de la aplicación de técnicas de ciencia de datos para obtener valor y conocimiento, permiten la mejora continua en el proceso de toma de decisiones generando valor a nivel del negocio. Actualmente en el entorno financiero, se hace necesario hacer uso de la información para la toma de decisiones de una manera más eficiente y oportuna, no solo por buenas prácticas o temas de moda sino por supervivencia. En este sentido tener la mayor cantidad de información para la toma de decisiones hace que los modelos predictivos tengan bastante relevancia. Actualmente no se tiene definido un modelo de predicción de saldos de productos de captaciones para cuentas de ahorros y cuentas corrientes, el cual se hace necesario para poder generar estrategias en pro del mantenimiento o aumento de los saldos, con el fin de garantizar que exista el capital para realizar colocaciones y aumentar la utilidad neta del negocio.Item “Aplicación de Modelos Machine Learning para predecir el riesgo de pérdida de seguimiento en tuberculosis”(Pontificia Universidad Javariana Cali, 2025) Rodríguez Camargo, Rubén Darío ; Guerrero Barreto, Diana Azucena; Ortega Lenis, DeliaLa tuberculosis (TB) es una enfermedad que afecta a un gran número de personas en todo el mundo, es curable y prevenible; razones que han llevado a la Organización Mundial de la Salud (OMS) a priorizar la enfermedad a nivel de salud pública. No obstante, las pérdidas en el seguimiento amenazan el éxito de los programas de control, dado por aumentos en las tasas de mortalidad y se constituyen como un factor desencadenante en la aparición de formas farmacorresistentes. Se han descrito diferentes determinantes en salud (DSS) que influyen en la pérdida de seguimiento, siendo los principales: sexo hombre, tener un bajo nivel educativo, bajos ingresos económicos, pertenecer a un grupo poblacional vulnerable, presentar alguna comorbilidad, tener barreras de acceso al sistema de salud, antecedente de tratamiento previo, baja tolerancia a efectos secundarios al tratamiento y afectaciones en salud mental. El distrito capital no es ajeno a esta situación y se ha visto que el éxito programático no alcanza la meta del 90 % en los últimos años. Dentro de los factores que afectan el cumplimiento se encuentran los pacientes fallecidos y con pérdida de seguimiento cuya prevalencia para el distrito en los últimos 7 años corresponde al 7.3 %. Los avances en inteligencia artificial (IA) han permitido comprender mejor el fenómeno de pérdida de seguimiento en otros países con alta carga de la enfermedad, los cuales han servido como base para la reformulación de políticas públicas por parte de las autoridades sanitarias, que han permitido mejorar la adherencia terapéutica de los pacientes. En este sentido, el objetivo del presente proyecto consistió en desarrollar un modelo de Machine Learning que permita predecir el riesgo de pérdida de seguimiento en pacientes pertenecientes al programa de TB en el distrito capital, a partir de los determinantes sociales en salud contenidos en el sistema de información. Para ello se desarrollaron cuatro tipos de algoritmos de aprendizaje automático supervisado con diferentes técnicas de remuestreo para balancear las clases y se aplicaron diferentes técnicas para seleccionar variables predictoras incidentes en la pérdida de seguimiento. Como resultado se obtuvo un modelo de XGBoost con buen desempeño en las métricas sensibilidad, exactitud y AUC; con el cual se puede brindar un apoyo al personal de salud que hace parte de los programas locales de tuberculosis y del distrito para identificar de forma temprana a este tipo de pacientes.Item Aplicaciones de machine learning para la predicción de rendimientos y gestión de un portafolio de activos financieros en la BVC(Pontificia Universidad Javeriana Cali, 2023) Gómez Bravo, Juan Pablo; Suárez Mensa, Lizeth Fernanda; Quiñones Losada, Katherin Juliana; Arango Londoño, DavidLa teoría de portafolio se desarrolla en un ambiente de incertidumbre, es decir los inversionistas no conocen con certeza el resultado que puede obtenerse al realizar una inversión diversificada, por ende, este trabajo busca gestionar el riesgo de pérdida, mitigando la posibilidad de obtener rendimientos inferiores a los esperados, por lo anterior se realizó la estimación de volatilidad de cada uno de los activos que componen COLCAP, cotizados en la Bolsa de Valores de Colombia (BVC), mediante varias metodologías tradicionales y de Machine Learning buscando el mejor desempeño de dicha estimación, una vez obtenidos los resultados más eficientes por cada activo, se realizan múltiples comparaciones para determinar las covarianzas de los portafolios factibles. Para dar solución a la problemática, se hizo uso de un área fundamental del Machine Learning (Aprendizaje Automático) como lo es la predicción de series temporales, ya que contiene componentes de volatilidad, tendencia, etc. intrínsecas a su comportamiento. Una serie de observaciones tomadas cronológicamente en el tiempo se conoce como Serie de Tiempo. Se trabajarán con series de tiempo financieras a partir de las acciones más importantes de la BVC, con el objetivo de optimizar portafolios de inversión, que puedan resultar como solución a grandes inconvenientes que involucran cuantificar, medir e inclusive controlar el riesgo ante la exposición de inversión. Una vez obtenidos los resultados de pronóstico, mediante el Modelo de Markowitz, (independientemente de los activos seleccionados), se obtiene la distribución ideal de la inversión o distribución eficiente bajo mínimo riesgo de pérdida. Adicionalmente el inversionista cuenta con la posibilidad de calcular una frontera eficiente, fruto de asignar rendimientos mayores que el rendimiento obtenido para el portafolio de mínimo riesgo, así como la información de su Rendimiento, Varianza y VaR del portafolio. Finalmente, mediante Power BI, el inversionista podrá contar con el comportamiento de las tendencias de volatilidad de los activos de renta variable analizados en este trabajo, la posibilidad de elegir hasta un máximo de 5 activos de su interés y obtener la distribución eficiente de su inversión, así como la información referente a su portafolio mencionada previamente.Item Aprendizaje automático aplicado al diagnóstico de la ocurrencia de la leishmaniasis a través de imágenes de lesiones cutáneas(Pontificia Universidad Javeriana Cali, 2023) Castro Duarte, Camilo; Linares Ospina, Diego Luis; Gómez, María AdelaidaEste proyecto buscó aplicar técnicas de aprendizaje automático específicamente Redes Neuronales Convolucionales, para predecir si una lesión de tipo cutánea corresponde o no a la enfermedad de la Leishmaniasis, evaluación que no resulta tan simple mediante observación debido a la similitud con otros tipos de lesiones, para ello, se entrenaron modelos predictivos mediante una base de datos con 885 imágenes de lesiones cutáneas (407 correspondientes a Leishmaniasis y 478 correspondientes a otras lesiones cutáneas), las imágenes de Leishmaniasis fueron suministradas por el CIDEIM (Centro Internacional de Entrenamiento e Investigaciones Médicas). Durante el desarrollo del proyecto se trabajaron diferentes etapas como es el caso de la limpieza y adecuación de la base de datos de imágenes, selección y entrenamiento de los modelos, contraste de resultados y la identificación del modelo más adecuado. Los resultados arrojados por los diferentes experimentos y sus respectivas métricas permitieron establecer cuál es el modelo más adecuado para hacer la predicción, de esta forma es posible hacer un diagnóstico previo de la lesión del paciente sin siquiera estar este de cuerpo presente, también permite ayudar a personal de la salud que no tiene tanta experiencia en este tipo de lesiones a despejar dudas y tomar medidas. De esta forma se le da paso a diferentes posibilidades de aplicación del algoritmo desarrollado dentro del campo médico, como es el caso de integraciones futuras con aplicativos móviles o desarrollos web, esto puede facilitar el análisis de las lesiones de los pacientes de manera remota y de una forma ágil.Item Aprendizaje automático para recomendar el reemplazo de medidores de agua de una red de distribución(Pontificia Universidad Javeriana Cali, 2023) Díaz Vesga, Roy Marnol; Trochez Zambrano, Jesús Alexander; Ramírez Buelvas, Sandra Milena; Troncoso Espinosa, Fredy HumbertoAprendizaje automático para recomendar el reemplazo de medidores de agua de una red de Las empresas de servicios sanitarios que suministran agua utilizan medidores especializados y enfrentan un porcentaje de agua no facturada, que es el agua que entra al sistema, pero no se cobra. Las pérdidas pueden ser técnicas (fugas y gastos internos), por micromedición (consumos gratuitos y problemas con los medidores) y por uso irregular (hurtos y conexiones ilegales). En el caso de las pérdidas por micromedición, los medidores descompuestos pueden generar sub-medición (lecturas inferiores al consumo real) o sobre-medición (lecturas superiores). Estos problemas impactan negativamente en las finanzas de la empresa y en la calidad del servicio, generando reclamaciones y afectando la satisfacción del cliente. Este trabajo de grado presenta un método sistemático para abordar el cambio o reemplazo de medidores mecánicos en una empresa de servicios sanitarios en Chile, enfocándose en el problema de pérdidas por micromedición, en particular en predecir problemas de sobre-medición y sub-medición. Se utiliza información de series de consumo mensual de agua y variables relacionadas con la ubicación y características de los medidores. La metodología combina la técnica de simbolización de series de tiempo (SAX), algoritmos de clasificación y análisis de variables geográficas para predecir el estado de los medidores. Se predicen los medidores con consumo normal, sub-medición y sobre-medición. El uso de la técnica de simbolización de series de tiempo (SAX) ayuda a reducir la complejidad de las series de consumo de agua y facilita su comprensión. Los modelos de clasificación evaluados, como KNN, Árbol de Decisión, Random Forest, AdaBoost y XGBoost, demostraron un buen desempeño al utilizar las variables extraídas de las series simbolizadas, la ubicación y algunas características de los medidores. Especialmente, los modelos XGBoost y Random Forest se destacaron por su alta precisión, con una tasa de acierto promedio del 94% y 93%, respectivamente. El modelo XGBoost se utilizó para predecir el estado de los medidores de agua en la región central de Chile. De acuerdo con las predicciones, se estima que aproximadamente el 77.60% de los medidores presentaría un consumo normal, mientras que el 11.35% mostraría sobre-medición y el 11.05% tendría sub-medición. Los resultados obtenidos demuestran la efectividad de las variables extraídas utilizando la técnica SAX en las series de consumos, así como la inclusión de la variable localidad y características de los medidores como inputs en los modelos de clasificación utilizados. Estos resultados destacan el potencial de este enfoque para la toma de decisiones en el ámbito de los servicios de agua, con el objetivo de lograr una gestión más eficiente y precisa de los recursos hídricos en el país.Item Automatización de la detección y diagnóstico de leishmaniasis por medio de la identifi cación de parásitos en imágenes de placas de laboratorio(Pontificia Universidad Javeriana Cali, 2023) Cardozo Aricapa, Daniel Fernando; Álvarez Vargas, Gloria InésLa leishmaniasis es una enfermedad causada por más de 20 especies del género Leishmania un protozoo parasito. Esta enfermedad se transmite por la picadura de flebótomos hembra infectados, que necesitan ingerir sangre para producir huevos. A nivel mundial, se encuentra entre las diez enfermedades tropicales desatendidas con más de 12 millones de personas infectadas con 0,9 a 1,6 millones de nuevos casos al año y entre 20.000 a 30.000 defunciones. En la actualidad, las estrategias de prevención y control disponibles para el manejo de la leishmaniasis son limitadas, por lo cual se requiere de herramientas efectivas para el diagnóstico temprano y tratamiento adecuado. Es por esto por lo que nuestro objetivo es desarrollar un modelo automatizado capaz de realizar la identificación del parasito y diagnóstico de Leishmaniasis usando imágenes de placas de laboratorio en pacientes con sospecha clínica de la enfermedad. Para estos proponemos utilizar diferentes algoritmos de clasificación que nos permitan realizar la detección de parásitos de Leishmania por medio de la extracción de características, creación de imágenes integrales y clasificación. Como resultados esperados se espera contar con un modelo diagnostico adecuado basado en placas de laboratorio que permita realizar el diagnostico de forma oportuna y accesible capaz de funcionar de forma eficiente en cualquier área que lo requiera. Finalmente, esta tecnología será una herramienta fundamental para la salud publica en áreas endémicas en pro de disminuir la morbimortalidad de la enfermedad.Item Clasificación de arritmias cardiacas a partir de señales fisiológicas usando técnicas de aprendizaje profundo(Pontificia Universidad Javeriana Cali, 2024) Artunduaga Vaquiro, Jesús David; Rocha Navarro, Owen Isaías; Gil González, JuliánEn este proyecto se propuso el desarrollo de un sistema de clasificación de señales de electrocardiogramas (ECG) utilizando técnicas de aprendizaje profundo. El objetivo general de este estudio es desarrollar un sistema de clasificación que utilice modelos de aprendizaje automático para la detección de arritmias cardiacas a partir de señales fisiológicas. Para lograrlo, se plantean los siguientes objetivos específicos: preparar un conjunto de datos de señales de electrocardiogramas (ECG) con arritmias cardiacas para el entrenamiento de modelos de aprendizaje profundo, implementar dos modelos de aprendizaje profundo para la detección de arritmias cardiacas, evaluar los modelos para medir su rendimiento y elaborar una interfaz gráfica de usuario que permita interactuar con el modelo de mejor rendimiento. La metodología propuesta se basó en un enfoque sistemático y estructurado. Se inició con la preparación de un conjunto de datos relevantes de señales de electrocardiogramas con arritmias cardiacas, que incluyó la recopilación y limpieza de los datos. A continuación, se implementaron dos modelos de aprendizaje profundo, los cuales fueron ajustados y evaluados en cuanto a su rendimiento. Finalmente, se desarrolló una interfaz web para el modelo de clasificación de arritmias con el mejor rendimiento. Como resultados esperados, se obtuvieron dos modelos de aprendizaje profundo entrenados y listos para su evaluación, así como una interfaz web que mejoró la experiencia del usuario final con el modelo que presentó mejor rendimiento. Además, se generó un informe final que documentó todo el proceso de investigación, incluyendo los resultados obtenidos, conclusiones y recomendaciones para futuras investigaciones. Con este proyecto, se contribuye al campo de la detección de arritmias cardiacas mediante el uso de técnicas de aprendizaje profundo, brindando una herramienta que apoye el trabajo médico en el diagnóstico temprano de enfermedades cardíacas.Item Clasificación de datos MOCAP sobre una disciplina deportiva usando modelos de Machine Learning(Pontificia Universidad Javeriana Cali, 2024) García Moncayo, Mario Fernando; Valencia Marín, Cristhian KaoriEste proyecto analiza en profundidad los datos capturados para clasificar categorías de movimiento en jugadores de tenis, utilizando herramientas de reconocimiento de actividades humanas (HAR) y captura de movimiento (MOCAP). Con un enfoque en los jugadores de la liga de tenis de Caldas, se busca detectar y extraer datos precisos sobre la posición y orientación de los atletas durante diversas acciones deportivas. Los datos, que fueron previamente obtenidos y organizados sin necesidad de una recolección nueva, están en formato BVH (Biovision Hierarchy), lo que permite representar con detalle la estructura y cinemática del cuerpo humano en movimiento. La investigación emplea modelos avanzados de aprendizaje automático para clasificar y analizar patrones biomecánicos en el tenis, con técnicas como el análisis de componentes principales (PCA) y algoritmos de clasificación para diferenciar movimientos específicos como golpes de derecha, reveses y servicios. Este enfoque facilita el estudio de variaciones entre jugadores en términos de eficiencia técnica y biomecánica. El objetivo final es proporcionar una base para recomendaciones personalizadas que optimicen el entrenamiento, permitiendo a entrenadores y jugadores ajustar técnicas y estrategias. Así, el proyecto tiene el potencial de ofrecer una herramienta para análisis deportivo avanzadoItem Clasificación de emociones complejas en audio de conversaciones de Call Center de la Universidad Javeriana Cali mediante modelos semi supervisados de Machine Learning(Pontificia Universidad Javariana Cali, 2024) Ospina Cuesta, Julián Andrés; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEste proyecto tuvo como objetivo identificar las expresiones emocionales complejas predominantes en llamadas del centro de contacto, para ofrecer una herramienta de medición en la satisfacción de clientes o evaluación de desempeño en la relación empleado-cliente. La problemática abordada se centró en ¿Cómo podría desarrollarse un modelo basado en técnicas de machine learning para la clasificación automática de emociones complejas en grabaciones de llamadas de un centro de contacto universitario, con el propósito de evaluar la satisfacción del cliente? El objetivo principal del proyecto fue desarrollar un modelo semi supervisado de machine learning para la clasificación automática de emociones en grabaciones de llamadas del call center de la Universidad Javeriana Cali, utilizando características acústicas. El alcance se limitó al análisis y clasificación de las emociones complejas predominantes identificadas en estas grabaciones, basándose en definiciones de emociones ajustadas a los objetivos del negocio. Los resultados de este proyecto incluyen: un conjunto de audios procesados y etiquetados de forma semi supervisada en las 'No llamadas', mientras que las 'Llamadas' fueron de manera supervisada; un modelo de clasificación automática de emociones que fue entrenado y validado, logrando una precisión del 95% en 'No llamadas' y del 41% en 'Llamadas'; y, por último, un prototipo de software diseñado como interfaz para cargar audios y clasificar las emociones según los modelos generados.Item Clasificación de los estudiantes de pregrado de acuerdo a su rendimiento académico y su uso para la predicción del éxito de su formación profesional(Pontificia Universidad Javeriana Cali, 2023) López Silva, Carolina; Mosquera Valencia, Diego Fernando; Cortés Rodríguez, Mauricio JoséEn Colombia, se estima que alrededor de la mitad de los estudiantes que inician un proceso de formación superior, lo finalizan. Este comportamiento también se da en la Pontificia Universidad Javeriana Cali, por lo cual, una forma en la que se podría aportar a la solución de esta problemática es con el desarrollo de este proyecto aplicado, donde primero se planteó encontrar las diferentes tipologías de los estudiantes a partir de su rendimiento académico, y un modelo que predice dichas tipologías, y de esa forma se consolide un proceso de analítica que le brinde información a la Universidad, para incidir en el éxito académico, es decir la culminación de los estudios, de sus estudiantes.