Maestría en Ciencia de Datos

Browse

Recent Submissions

Now showing 1 - 20 of 64
  • Item
    Modelo multivariado para predecir la localización de la población a partir de factores sociodemográficos en Colombia
    (Pontificia Universidad Javeriana Cali, 2024) Valbuena Acosta, Carlos; Mora Cardona, Mario Julián
    El objetivo de este proyecto era determinar cuáles son los factores que inciden sobre la localización de un individuo en Colombia. Para lograrlo, implementó el algoritmo Propensity Score Matching con base en los datos del Censo 2018 para la población del Valle del Cauca, en los módulos de personas, hogares, viviendas y marco de georreferenciación, con un universo de 3,2 millones de registros y 40 variables seleccionadas. Para cumplir el objetivo del proyecto, se construyeron 3 bases de datos con sus grupos de tratamiento y control, así: el primero con datos urbanos de Cali y los demás municipios, el segundo, solo con registro urbanos de Cali y el tercero, con registros del área urbana y centros poblados de Cali. Sobre estos algoritmos se entrenó el PSM, partiendo de una preparación de los datos, luego se realizó la estimación del propensity score que es la determinación del problema binario, es decir, la obtención de la probabilidad que un individuo se ubique en un grupo u otro para hacer las muestras comparables, seleccionando los Conjuntos 1 y 2 con el mejor nivel de accuracy con 61% y 50% respectivamente debido a la alta variabilidad que reviste una base como el Censo; con estos dos conjuntos se dio paso a la fase de emparejamiento a través de vecinos más cercanos – KNN, donde el conjunto 1 de Cali y los demás municipios obtiene las menores diferencias en las variables observables luego del emparejamiento. Posteriormente, para predecir la manzana geográfica como unidad mínima de granularidad que ubica al individuo dentro de los Shapes del Censo-DANE, se implementó el clasificador Random Forest, el cual mostró dificultades para predecir la ubicación en una categoría compuesta por 22 caracteres, alcanzando un accuracy de 32 %, luego se hicieron unas transformaciones en la variable a predecir sin afectar su origen, logrando un mejor resultado del 39% con la predicción de los últimos 8 campos de la localización de los individuos de Cali, pero debido al alto costo computacional este modelo no se pudo replicar para datos nuevos provenientes de SISBEN. Finalmente, se espera que este proyecto contribuya a profundizar los análisis económicos que desarrolle el Centro de Investigación Aplicada Riqueza Completa, mediante la implementación de algoritmos de emparejamiento como el PSM, especialmente dentro del uso de variables sociodemográficas como el Censo y su potencial capacidad para determinar la localización de un individuo a partir de estas.
  • Item
    Modelos de machine learning aplicados a un sistema de indicadores que evalúen la sostenibilidad en la movilidad urbana del Valle de Aburrá
    (Pontificia Universidad Javeriana Cali, 2024) Montoya Salazar, Luisa Fernanda; Arteaga Botero, Gustavo Adolfo
    La presente investigación se centra en el análisis de la movilidad urbana del Área Metropolitana del Valle de Aburrá, entendiendo que es una problemática en la que influyen dimensiones sociales, culturales e incluso emocionales que deben ser analizadas y conllevan a que las entidades e instituciones formulen programas y políticas públicas que mejoren las condiciones para incrementar los niveles de calidad de vida de los ciudadanos. Dentro de las herramientas de información y planeación, se contemplan las encuestas de movilidad realizadas a empleados de diversas empresas en el Valle de Aburrá, lo que proporciona datos actualizados y relevantes para comprender las dinámicas actuales de movilidad. En este sentido, esta investigación tiene como objetivo construir modelos de Machine Learning aplicados a un sistema de indicadores que evalúen la sostenibilidad en la movilidad urbana del Valle de Aburrá, con el propósito de identificar patrones de comportamiento y agrupaciones significativas en los datos, para que instituciones, entidades y autoridades lo consideren como instrumento de planeación que aporta a la toma de decisiones al momento de ejecutar proyectos de movilidad urbana en el territorio.
  • Item
    Clasificación de arritmias cardiacas a partir de señales fisiológicas usando técnicas de aprendizaje profundo
    (Pontificia Universidad Javeriana Cali, 2024) Artunduaga Vaquiro, Jesús David; Rocha Navarro, Owen Isaías; Gil González, Julián
    En este proyecto se propuso el desarrollo de un sistema de clasificación de señales de electrocardiogramas (ECG) utilizando técnicas de aprendizaje profundo. El objetivo general de este estudio es desarrollar un sistema de clasificación que utilice modelos de aprendizaje automático para la detección de arritmias cardiacas a partir de señales fisiológicas. Para lograrlo, se plantean los siguientes objetivos específicos: preparar un conjunto de datos de señales de electrocardiogramas (ECG) con arritmias cardiacas para el entrenamiento de modelos de aprendizaje profundo, implementar dos modelos de aprendizaje profundo para la detección de arritmias cardiacas, evaluar los modelos para medir su rendimiento y elaborar una interfaz gráfica de usuario que permita interactuar con el modelo de mejor rendimiento. La metodología propuesta se basó en un enfoque sistemático y estructurado. Se inició con la preparación de un conjunto de datos relevantes de señales de electrocardiogramas con arritmias cardiacas, que incluyó la recopilación y limpieza de los datos. A continuación, se implementaron dos modelos de aprendizaje profundo, los cuales fueron ajustados y evaluados en cuanto a su rendimiento. Finalmente, se desarrolló una interfaz web para el modelo de clasificación de arritmias con el mejor rendimiento. Como resultados esperados, se obtuvieron dos modelos de aprendizaje profundo entrenados y listos para su evaluación, así como una interfaz web que mejoró la experiencia del usuario final con el modelo que presentó mejor rendimiento. Además, se generó un informe final que documentó todo el proceso de investigación, incluyendo los resultados obtenidos, conclusiones y recomendaciones para futuras investigaciones. Con este proyecto, se contribuye al campo de la detección de arritmias cardiacas mediante el uso de técnicas de aprendizaje profundo, brindando una herramienta que apoye el trabajo médico en el diagnóstico temprano de enfermedades cardíacas.
  • Item
    Análisis comparativo de Modelos de Segmentación en imágenes de tomografía computarizada (CT) del área abdominal
    (Pontificia Universidad Javeriana Cali, 2024) Polanco Velasco, Jan; Astudillo Bello, Stefania; Gil González, Julián
    El presente trabajo de grado titulado “Análisis comparativo de Modelos de Segmentación en imágenes de tomografía computarizada (CT) del área abdominal” se propone desarrollar y comparar seis modelos de Deep Learning ampliamente utilizados en tareas de segmentación: U-Net, U-Net con Backbone VGG16, U-Net con Backbone ResNet50, SegNet, FPN con Backbone ResNet50 y LinkNet con Backbone VGG16. El objetivo principal de este estudio es determinar cuál de estos modelos ofrece el mejor rendimiento en términos de precisión, recall, coeficiente Dice, accuracy, IoU y loss, al segmentar imágenes de CT del área abdominal. El proyecto se estructura en varias etapas clave. En primer lugar, se lleva a cabo una recolección y procesamiento exhaustivo de los datos de CT abdominal, incluyendo técnicas de limpieza de artefactos y ruido adicional, así como el uso de Data Augmentation para aumentar la diversidad del conjunto de datos. Posteriormente, se implementan y entrenan los modelos de segmentación seleccionados utilizando plataformas avanzadas de computación, como Kaggle, ajustando los parámetros específicos para el problema en cuestión. La evaluación del rendimiento de cada modelo se realiza utilizando un conjunto de métricas rigurosas y específicas, tales como precisión, recall, coeficiente Dice, accuracy, IoU, loss, F1 y F2, permitiendo un análisis comparativo detallado de los resultados obtenidos. Además, se consideran aspectos como el tiempo de entrenamiento y la capacidad de generalización de los modelos a nuevos datos no vistos durante el entrenamiento.
  • Item
    Desarrollo de un modelo predictivo para el precio de importación de pesticidas en Colombia
    (Pontificia Universidad Javeriana Cali, 2024) Ramírez Méndez, Edisson Miguel; Ramírez Amariz, Luis Felipe; González Gómez, Daniel Enrique
    La agricultura ha sido crucial para la supervivencia y el desarrollo humano, proporcionando los alimentos básicos para la dieta mundial. Sin embargo, en Colombia, la dependencia de insumos importados como insecticidas, fungicidas y herbicidas afecta significativamente los costos de producción agrícola debido a las fluctuaciones del mercado internacional. Este aumento en los precios, reflejado en el Índice de Precios al Consumidor (IPC), impacta en el costo de vida y la calidad de vida en el país. Para abordar este problema, se propone el desarrollo de un modelo predictivo para estimar los precios de estos insumos agrícolas importados. Utilizando datos de la Dirección de Impuestos y Aduanas Nacionales de Colombia (DIAN) desde 2001, el proyecto tiene como objetivo crear una herramienta que permita pronosticar los precios y ayudar a posicionar los productos agrícolas con precios más competitivos. El estudio incluye la introducción, formulación del problema, objetivos, marco de referencia, metodología, análisis de datos, evaluación del modelo, implementación y validación.
  • Item
    Construcción de un modelo para predecir ventas de unidades nuevas de vivienda en Cali por medio de técnicas de aprendizaje estadístico
    (Pontificia Universidad Javeriana Cali, 2024) Mora García, Jorge Hernán; Conde Chavarro, Leidy Lorena; Arango Londoño, David
    El proyecto tiene como objetivo mejorar la precisión en la predicción de las transacciones de vivienda nueva en el futuro. Actualmente, la determinación de estas transacciones se basa en encuestas y sondeos de percepción de mercado, lo que limita la captura de información completa y actualizada sobre la situación real del mercado y la conducta de los posibles compradores. El proyecto consiste en la construcción de un modelo que utilice información secundaria para predecir las ventas de unidades nuevas de vivienda en el área del Distrito de Cali. Esta información secundaria incluye análisis de tendencias en Google Trends y variables macroeconómicas relevantes, como la inflación, el desempleo, las tasas de interés e indicadores agregados de percepción del consumidor y de desempeño de la economía. El enfoque se basa en técnicas de modelación estadística y métodos de aprendizaje automático supervisados, considerando que todos los datos son series temporales. El modelo realizado proporcionó un método eficaz para obtener predicciones tanto en el volumen como en la tendencia de venta de nuevas unidades de vivienda, respaldando así la toma de decisiones de política. Al utilizar técnicas de aprendizaje estadístico, se logró una mejor comprensión de los factores que influyen en las ventas de viviendas nuevas y, por lo tanto, se mejoró la capacidad de predecir las transacciones futuras. La modelación elaborada permite una planificación más eficiente de los recursos y una mejor comprensión de las dinámicas del mercado de viviendas nuevas en Cali. El proyecto propuso un modelo predictivo con técnicas de aprendizaje estadístico y datos secundarios que predice las ventas de unidades de viviendas nuevas en Cali, proporcionando así información más actualizada y precisa para respaldar la toma de decisiones en el sector de la construcción y servicios públicos, mejorando así la planificación y la comprensión del mercado.
  • Item
    Optimización de los canales digitales del banco cooperativo “Bancoomeva” mediante modelos de clusterización
    (Pontificia Universidad Javeriana Cali, 2024) Padilla López, David; Correa Díaz, Marisol; Caballero Cortés, Fabián Rolando; Pabón Burbano, María Constanza
    Por medio del Clustering de datos se realizó una segmentación de los clientes de una entidad financiera, generando un nuevo conocimiento del consumidor financiero para la creación de nuevas estrategias y clasificación de nuevos clientes. Este enfoque permitió identificar patrones y tendencias ocultas en grandes conjuntos de datos transaccionales y financieros, brindando a la empresa una comprensión más profunda de su base de clientes.
  • Item
    Evaluación del efecto de la pandemia sobre la deforestación en Colombia por medio de imágenes de satélite y usando los datos de Terra-i
    (Pontificia Universidad Javeriana Cali, 2024) Anduquia Ramos, Manuel Andrés; Garcés Sevillano, Jesús Alberto; Arango Londoño, David
    El objetivo de este proyecto fue evaluar el impacto que la pandemia del COVID-19 tuvo en los niveles de deforestación en Colombia. Se emplearon técnicas de ciencia de datos, que incluyeron modelos estadísticos mixtos y aprendizaje supervisado de máquinas, para analizar grandes volúmenes de datos provenientes de imágenes satelitales de la plataforma Terra-i, la cual monitorea la deforestación. Además, se utilizaron modelos estadísticos para comprender las relaciones y los factores que contribuyeron a la deforestación en áreas específicas identificadas. Estos modelos permitieron identificar patrones y tendencias, incluyendo factores específicos que pudieron haber influido durante la pandemia, buscando contribuir a la toma de decisiones informadas y a la formulación de estrategias más efectivas para la conservación y el manejo forestal en Colombia.
  • Item
    Sistema de análisis y predicción del crimen “precrimen”
    (Pontificia Universidad Javeriana Cali, 2024) Medina Salcedo, Daniel Lorenzo; Arango Londoño, David
    El proyecto presenta una solución innovadora para abordar la criminalidad. Utilizando técnicas avanzadas de ciencia de datos, se procesan datos espaciales y hechos delictivos, buscando mejorar la seguridad ciudadana mediante la predicción de la cantidad de eventos delictivos y la implementación de estrategias preventivas. El objetivo principal del proyecto es construir una herramienta tecnológica que permita predecir la posible comisión de delitos. Los objetivos específicos incluyen la identificación, clasificación y visualización de datos conectando fuentes abiertas y oficiales que disponen de información sobre delitos, la construcción de un modelo predictivo y la apropiación de conocimientos prácticos en gestión de datos, clasificación, visualización y modelos de predicción
  • Item
    Análisis de la red de transporte del sistema de transporte masivo de Cali (MIO) en términos de transbordo
    (Pontificia Universidad Javeriana Cali, 2024) Marín Zamora, César Alejandro; Guzmán Zuñiga, Jhon Alexander; Vargas Valencia, Miguel Ángel; Martínez Arias, Juan Carlos
    En el 2008 en la Ciudad de Cali se implementó un sistema de transporte masivo (MIO), que desde la fecha a la actualidad ha presentado inconvenientes para cubrir su demanda con eficiencia, generando colapso en sus estaciones e inconformidades en sus pasajeros. A partir de lo anterior, se planteó este proyecto de investigación donde se realizo un análisis a la red de transporte del sistema MIO en términos de transbordo, a través de técnicas de recolección y procesamiento de datos como web scraping, clustering aglomerativo, teoría de redes, Network Analysis, medidas de centralidad e intermediación de una red, encontrando como resultado la caracterización de la red de transporte MIO con relación a los transbordos que la conforman, mediante la identificación de las rutas y los puntos de transbordos más utilizados e importantes de la Ciudad, el reconocimiento del patrón de movilidad de los pasajeros con relación al uso de transbordos y la eficiencia del sistema de transporte MIO; información que se podrá utilizar en futuras investigaciones para crear planes de mejora.
  • Item
    Análisis de clusterización de clientes alertados por posibles operaciones sospechosas en bancolombia
    (Pontificia Universidad Javeriana Cali, 2024) Ospina Martínez, Ximena; Mariaca Rueda, Cristian David; Cano Cadavid, Andrés Felipe
    En la Vicepresidencia de Cumplimiento en Bancolombia cada mes se generan alertas de clientes con posibles operaciones sospechosas, identificadas a partir de modelos analíticos detectivos. El crecimiento del negocio y aumento de la cobertura de tipologías ha derivado en un aumento de alertas, saturando la capacidad de análisis del área de Investigación, lo que impide generar una respuesta oportuna para mitigar el riesgo de Lavado de Activos y Financiación del Terrorismo (LAFT). Por el aumento de alertas, se han implementado algunos métodos de agrupación que emplean procedimientos intuitivos y requieren aproximadamente tres días hábiles para su ejecución. Para el área de Investigación es útil este proyecto, ya que se centra en buscar la mejora de los procesos de evaluación impactando dos aspectos relevantes a la hora de identificar riesgos LAFT: capacidad y tiempo oportuno de evaluación de las alertas. El objetivo principal del trabajo es implementar modelos de clusterización a partir de técnicas de aprendizaje de máquina para agrupar a los clientes alertados según características de riesgo LAFT que estos representan para el Banco. Además, se busca identificar las variables más relevantes e influyentes en el riesgo LAFT de un cliente alertado. Se espera obtener un modelo de agrupamiento para clientes con posibles operaciones sospechosas en Bancolombia, tener claras las variables, características y patrones que tienen los clientes alertados por operaciones sospechosas, para ser tenidas en cuenta en los monitoreos del Banco, y de esta forma, aportar a que el indicador de oportunidad en el tiempo de respuesta de las alertas sea optimo.
  • Item
    Indicador de desarrollo integral en los niños entre 0 y 5 años, en el Valle del Cauca y 13 municipios del Norte del Cauca, a través de modelo predictivo
    (Pontificia Universidad Javeriana Cali, 2024) Ávila Huertas, Wladimir; López Álvarez, Daniel Alejandro; Aristizábal, Mario Felipe; Mora Cardona, Mario Julián
    El objetivo de este proyecto se enfocó en el desarrollo de modelos predictivos para clasificar y predecir el potencial de desarrollo de niños menores o iguales de 5 años en el Valle del Cauca y norte del Cauca 3utilizando los datos del Sisbén. Se analizaron factores socioeconómicos y geográficos que influyen en el desarrollo de la primera infancia, con el objetivo de proporcionar información relevante para la toma de decisiones en políticas públicas y programas sociales dirigidos a esta población vulnerable. La actualización de la base de datos del Sisbén es fundamental para garantizar la eficacia y equidad en la asignación de subsidios y programas sociales en Colombia. Al mantener la información actualizada, se asegura que los recursos lleguen de manera eficiente a las familias más necesitadas, permitiendo una distribución equitativa y efectiva de los subsidios. Además, una base de datos actualizada proporciona una visión precisa de la situación socioeconómica de la población, facilitando la identificación de necesidades y la planificación de intervenciones enfocadas en el bienestar de los niños y sus familias. Los beneficios de contar con una base de datos del Sisbén actualizada son significativos. No solo se mejora la focalización de los programas sociales, sino que también se reducen las inequidades y se promueve el desarrollo integral de los niños en situaciones de pobreza y vulnerabilidad. La actualización de la base de datos permite realizar análisis detallados que sirven como base para la formulación de políticas basadas en evidencia, orientadas a mejorar las condiciones de vida de la población infantil en estas regiones específicas de Colombia. En resumen, este proyecto busca aprovechar los datos del Sisbén para desarrollar un modelo predictivo que ayude a comprender y predecir el desarrollo de la primera infancia en el Valle del Cauca y norte del Cauca. La correcta clasificación de categorías en la base de datos del Sisbén garantiza una asignación eficiente de recursos, generando impactos positivos en la calidad de vida y el futuro de los niños en estas regiones.
  • Item
    Reconstrucción de series climáticas por medio de la combinación de datos de estaciones climáticas en tierra e imágenes satelitales dentro del territorio colombiano aplicando métodos estadísticos y de aprendizaje automático
    (Pontificia Universidad Javeriana Cali, 2024) Castro Suárez, Raúl Fernando; Ochoa Sánchez, Edwin Alexander; Villalba Acevedo, Juan Carlos; Arango Londoño, David
    El proyecto tiene como objetivo principal aplicar técnicas de ciencia de datos y aprendizaje automático para la reconstrucción de series climáticas en Colombia, enfocándose en la precipitación como la variable a analizar. La problemática abordada se relaciona con la falta de datos completos y la presencia de valores faltantes en las series climáticas, lo cual dificulta su análisis y modelado. La zona de estudio del proyecto corresponde al departamento del Valle del Cauca, donde se cuenta con datos provenientes de 58 estaciones meteorológicas y datos satelitales para los mismos puntos. Las etapas abordadas son la comprensión de los datos y el estado del arte, la comprensión de los datos que incluye la recopilación de estos y el análisis exploratorio de los datos, la selección de modelos y evaluación de los resultados de estos.
  • Item
    Detección de enfermedades en cultivos de banano con imágenes aéreas utilizando un modelo de Deep Learning
    (Pontificia Universidad Javeriana Cali, 2024) Enríquez Polanco, Jorge Alberto; Rodríguez Reyes, Michael; Tobón Llano, Luis Eduardo
    Este documento presenta un proyecto cuyo objetivo principal es reducir la cantidad de tiempo invertida en el monitoreo de los cultivos de banano, mediante la implementación de modelos de Aprendizaje Profundo (Deep Learning). Estos modelos se han utilizado para detectar y monitorear las enfermedades de Fusarium wilt y Xanthomonas wilt en los cultivos, empleando imágenes de alta resolución en RGB obtenidas por UAV (vehículos aéreos no tripulados). El proyecto se dirige específicamente a pequeños y medianos agricultores, con el propósito de agilizar los procesos de monitoreo de los cultivos de banano y detectar de manera temprana las enfermedades mencionadas. Para lograr este objetivo, se ha desarrollado un prototipo funcional que ha sido probado en cultivos reales. La implementación del prototipo se ha basado en los avances encontrados en el estado del arte relacionado con dispositivos y arquitecturas utilizadas en la implementación de inteligencia artificial en el monitoreo de cultivos. Además, se ha utilizado una base de datos proporcionada por el Centro Internacional de Agricultura Tropical (CIAT), que cuenta con más de 30 mil plantas de banano anotadas y etiquetadas por expertos fitopatólogos. En 3 cuanto a los objetivos cuantitativos, se ha logrado reducir en al menos un 25% el tiempo necesario para el monitoreo de los cultivos de banano, en comparación con los métodos tradicionales utilizados por los agricultores. Para lograr estos objetivos, se ha utilizado la metodología CDIO, que implica comprender inicialmente la situación, necesidad o problema en un contexto específico. A partir de esta comprensión, se ha diseñado una solución que se ha implementado realizando las modificaciones necesarias hasta llegar a la fase operativa del proyecto
  • Item
    Predicción de variables en salud mental para colaboradores de una Universidad privada ubicada en la ciudad de Cali por medio de aprendizaje automático
    (Pontificia Universidad Javeriana Cali, 2024) Rosero Montilla, María de los Ángeles; Ramírez Cortés, Brayan Steven; Vivas Torres, Juan Manuel; Gil González, Julián
    La salud mental se ha convertido en una de las principales preocupaciones en la actualidad. La Universidad consciente de ello, busca el bienestar de sus colaboradores y se esfuerza por ofrecerles las mejores condiciones de trabajo. Sin embargo, se detecta un preocupante deterioro de la salud mental dentro de la comunidad educativa, situación que se ve agravada por los efectos de la pandemia, por esta razón se desarrollaron modelos de predicción de variables de salud mental en colaboradores pertenecientes a la Universidad privada ubicada en la ciudad de Cali, por medio de técnicas de Machine Learning. Esta investigación ha dado como resultado el desarrollo de modelos predictivos y la creación de documentación detallada sobre el proceso, se espera que los modelos desarrollados en este proyecto puedan ser implementados en diversos sectores, con el objetivo de facilitar la detección temprana de problemas de salud mental en los trabajadores y contribuir a su bienestar integral [1], [2]
  • Item
    Pronóstico del mercado aéreo en las principales rutas comerciales domésticas de pasajeros en Colombia mediante algoritmos de machine learning
    (Pontificia Universidad Javeriana Cali, 2024) Lozano Caballero, Luis Carlos; Restrepo Blanco, Juan Carlos; Mayorga Ballesteros, Natalia; Pabón Burbano, María Constanza
    El mercado doméstico aéreo en Colombia juega un papel fundamental en la economía y el turismo nacional. Sin embargo, la partida de algunas aerolíneas como Viva Air en el año 2023 ha generado una disminución en la capacidad de vuelos en rutas de alta demanda, impactando tanto a las compañías aéreas restantes como a los pasajeros. En este proyecto, se han desarrollado modelos de Machine Learning que utilizan datos históricos para pronosticar la evolución del tráfico de pasajeros en el mercado aéreo. Estos pronósticos están destinados a ayudar a las compañías aéreas a tomar decisiones estratégicas informadas y mejorar la calidad del servicio ofrecido a los pasajeros.
  • Item
    Implementación de un modelo de aprendizaje profundo de máquinas para la detección de cáncer de seno
    (Pontificia Universidad Javeriana Cali, 2024) Ávila Gómez, Jair Orlando; Maldonado Benavides, Fabián Alonso; Bermúdez Murillo, Laura Yohana; Forero Vargas, Manuel Guillermo; Castaño Idarraga, Omar Andrés
    El objetivo principal de este trabajo es implementar un modelo de aprendizaje profundo para la detección de cáncer de seno mediante el análisis de imágenes médicas obtenidas a través de mamografías. Se propone el desarrollo y entrenamiento de un sistema capaz de identificar nódulos sospechosos en estas imágenes. Para lograrlo, se utilizarán diversas arquitecturas convolucionales, como VGG16, VGG19, RESNET y RESNET50, así como Visión Transformer (VIT)
  • Item
    Pronóstico de disponibilidad de los recursos de generación de la central TermoGuajira a partir de modelos de aprendizaje automático
    (Pontificia Universidad Javeriana Cali, 2024) Martínez Miranda, Keyner; Arango Londoño, David
    El Centro Nacional de Despacho (CND) ha identi ficado restricciones eléctricas en la subárea GCM del sistema eléctrico colombiano, lo cual ha llevado a declarar un estado de emergencia desde abril de 2022. En el estado actual del sistema eléctrico, la disponibilidad de los recursos de generación internos en esta subárea es crucial para garantizar la seguridad y confiabilidad del sistema eléctrico, ya que su ausencia puede desencadenar eventos no deseados y afectar a los usuarios finales. Por lo tanto, el objetivo de este proyecto es desarrollar un modelo a través de técnicas de aprendizaje automático, con el fin de implementar medidas preventivas y estrategias de contingencia que minimicen el riesgo de indisponibilidades no programadas y aseguren el suministro eléctrico confiable. El proyecto seguirá pasos metodológicos, como el análisis exploratorio de datos, el desarrollo del modelo de machine learning y la validación de las predicciones generadas
  • Item
    Modelo predictivo para la identificación de la enfermedad producida por la plaga Heilipus Lauri en el cultivo de aguacate Hass en Colombia, por medio del procesamiento y clasificación de imágenes con aplicación de técnicas de Machine Learning
    (Pontificia Universidad Javeriana Cali, 2024) Carvajal Jaramillo, Karen Andrea; Castro Collazos, Mauricio; Riveros Pulgarín, Ramón Siddartha; Arango Londoño, David
    Las enfermedades causadas por el insecto-plaga Heilipus Lauri son una de las principales causantes de los daños en los cultivos de aguacate Hass, adicionalmente reducen la calidad de los cultivos al generar problemas fitosanitarios que dificultan alcanzar el potencial exportador de este producto. Por lo cual, el presente proyecto plantea entrenar y evaluar un algoritmo de clasificación de imágenes con el uso de técnicas de aprendizaje automático, con el uso de un banco de imágenes recolectadas por Agrosavia, para la construcción de una herramienta que pueda ser usada por los pequeños y medianos productores de este fruto, que sirva para el control y monitoreo del daño causado por estas plagas. Además, se espera que este proyecto sirva como marco de referencia para futuras investigaciones en el sector agropecuario y académico en el ámbito de procesamiento y clasificación de imágenes.
  • Item
    Modelo de clasificación de tipologías constructivas basado en fotografías de campo y el modelo ladm-col
    (Pontificia Universidad Javeriana Cali, 2024) Montoya Castellanos, Jonathan; Gil González, Julián
    El proyecto planteado, “Modelo de clasificación de tipologías constructivas basado en fotografías de campo y el modelo LADM-COL”, adquiere relevancia en el ámbito de implementación de procesos catastrales, barridos prediales masivos y evaluación de calidad de productos catastrales. Esto se debe a las necesidades técnicas que enfrenta el Catastro Multipropósito en el país. La captura y almacenamiento de fotografías de construcciones es común en los procesos catastrales como soporte de campo a la información que reposa en las bases de datos. La cantidad de construcciones almacenadas en las bases de datos de un municipio representan un volumen importante de información que debe mostrar “completitud” y “coherencia” entre los soportes de campo y lo registrado en las bases de datos. Esta coherencia y completitud suele construirse y evaluarse de manera puntual, con visitas en campo o soportes fotográficos para determinar la calificación de construcciones asignada en las bases de datos, este proceso debe considerar profesionales especializados, tiempo y logística que se traducen en costos para las instituciones. Dado lo anterior, se identifican los siguientes problemas: el tiempo de ejecución de los procesos, la disponibilidad de personal capacitado y la calidad de los productos generados por dichos profesionales, entre otros aspectos de los procesos catastrales que dificultan el complimiento de los objetivos y metas del catastro multipropósito. El objetivo propuesto para este proyecto fue desarrollar un modelo de clasificación de imágenes utilizando técnicas de aprendizaje automático, con el fin de llevar a cabo tareas de tipificación de construcciones siguiendo el estándar del Modelo LADM-COL. El resultado esperado para este proyecto fue el obtener un modelo de clasificación de imágenes que brinde un apoyo significativo al proceso de reconocimiento predial, al clasificar las construcciones de manera estandarizada y automatizada