Browsing by Subject "Machine learning"
Now showing 1 - 20 of 39
Results Per Page
Sort Options
Item Análisis de imágenes satelitales para la clasificación de ecosistemas en predios(Pontificia Universidad Javariana Cali, 2024) Quiroz Moscarella, Roberto Enrique; Santos Peñuela, Francisco José; Castaño Idárraga, Omar AndrésEl proyecto aplicado se centra en la segmentación de imágenes satelitales de predios para identificar ecosistemas. Aborda la problemática del trabajo manual requerido para segmentar zonas en imágenes, especialmente en la elaboración de proyectos de bonos de carbono. Se desarrolló un algoritmo funcional que permita a los investigadores segmentar grandes extensiones de tierra de manera eficiente, reduciendo el tiempo necesario para esta tarea. Los resultados obtenidos permiten la automatización del proceso de segmentación, particularmente sobre zonas verdes y cuerpos de agua permitiendo la evaluación de su extensión. Las posibles aplicaciones de este proyecto abarcan la investigación ambiental, la planificación del uso del suelo y la gestión de recursos naturales.Item Análisis de polaridad de tweets sobre contexto político colombiano usando técnicas de aprendizaje no supervisado(Pontificia Universidad Javeriana Cali, 2024) Pizarro Rivera, Francisco; Pabón, María ConstanzaEl análisis de polaridad u orientación semántica es una de las ramas del Natural Language Processing que ha tenido más crecimiento en el última década, con amplias aplicaciones a nivel académico y comercial. En este proyecto de grado se realizó una exploración sobre la aplicación de modelos de Machine Learning de carácter Auto Supervisado y No Supervisado para realizar el análisis de polaridad en tweets escritos por los usuarios de la red social X específicamente escritos sobre el contexto político colombiano. Se exploró el uso de un enfoque con modelos híbridos, en los cuales se hace un preproceso de pseudo etiquetado por medio de un modelo basado en lexicones (modelo VADER) para luego entrenar modelos supervisados como SVM, Logistic Regression y Multinomial Naive Bayes. El segundo enfoque constó de usar el modelo No Supervisado de K-Means, obteniendo un performance superior en la ejecución del modelo hibrido. Este trabajo tiene también por output la exportación a modo de prototipo del modelo con mejor performance y su vectorizador entrenado con el vocabulario de los 4.830 tweets recolectados de manera manual para ser desplegado en posibles ambientes de producción para el desarrollo de herramientas de análisis de orientación semántica aplicada a textos de redes sociales, pero en específico a tweets relacionados con el contexto político colombiano.Item Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático(Pontificia Universidad Javeriana Cali, 2023) Londoño Cárdenas, Jhon Sebastián; Ortiz Morales, Luis Alberto; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésEl mercado de acciones es uno que cuenta con cierta antigüedad, es por esto que se han desarrollado y probado una gran variedad técnicas para intentar predecir el comportamiento del valor del precio de las acciones. Sin embargo, para estas predicciones se tienen en cuenta, en mayor medida, variables como el histórico del precio, dejando de lado otro tipo de información como el análisis de sentimientos. En este proyecto se quiso contribuir a la investigación sobre el aporte que puede hacer este tipo de variable menos usada en la predicción del precio de las acciones, por este motivo, se llevó a cabo una integración entre dos técnicas con diferente grado de exploración. Para la parte del análisis de sentimientos se usó un dataset de tweets de la empresa Apple al cual se le aplicó técnicas de Procesamiento de Lenguaje Natural para el preprocesa miento, 2 algoritmos de aprendizaje semi-supervisado para ayudar a etiquetar los sentimientos de todos los tweets y 3 modelos de aprendizaje automático para que pudieran etiquetar tweets nuevos, siendo este la Máquina de Soporte Vectorial. Para la parte del histórico del precio se usó un dataset de diferentes valores de las acciones de la empresa Apple, gracias al cual se en traron 3 modelos de aprendizaje automático de los cuales la LSTM tuvo los mejores resultados. Posteriormente, se integraron los sentimientos obtenidos al histórico del precio, obteniendo que el mejor modelo era el Random Forest, sin embargo, no conseguía superar al mejor modelo que únicamente usaba el histórico del precio. Con dicho modelo de Random Forest se realizaron pruebas en un mercado simulado, determinando que el uso tanto del histórico del precio como del análisis de sentimientos es posible y tiene resultados aceptables, no obstante, la estrategia de compra y venta debe examinarse con mayor rigurosidad para darle un uso a estos modelos en el mundo real.Item “Aplicación de Modelos Machine Learning para predecir el riesgo de pérdida de seguimiento en tuberculosis”(Pontificia Universidad Javariana Cali, 2025) Rodríguez Camargo, Rubén Darío ; Guerrero Barreto, Diana Azucena; Ortega Lenis, DeliaLa tuberculosis (TB) es una enfermedad que afecta a un gran número de personas en todo el mundo, es curable y prevenible; razones que han llevado a la Organización Mundial de la Salud (OMS) a priorizar la enfermedad a nivel de salud pública. No obstante, las pérdidas en el seguimiento amenazan el éxito de los programas de control, dado por aumentos en las tasas de mortalidad y se constituyen como un factor desencadenante en la aparición de formas farmacorresistentes. Se han descrito diferentes determinantes en salud (DSS) que influyen en la pérdida de seguimiento, siendo los principales: sexo hombre, tener un bajo nivel educativo, bajos ingresos económicos, pertenecer a un grupo poblacional vulnerable, presentar alguna comorbilidad, tener barreras de acceso al sistema de salud, antecedente de tratamiento previo, baja tolerancia a efectos secundarios al tratamiento y afectaciones en salud mental. El distrito capital no es ajeno a esta situación y se ha visto que el éxito programático no alcanza la meta del 90 % en los últimos años. Dentro de los factores que afectan el cumplimiento se encuentran los pacientes fallecidos y con pérdida de seguimiento cuya prevalencia para el distrito en los últimos 7 años corresponde al 7.3 %. Los avances en inteligencia artificial (IA) han permitido comprender mejor el fenómeno de pérdida de seguimiento en otros países con alta carga de la enfermedad, los cuales han servido como base para la reformulación de políticas públicas por parte de las autoridades sanitarias, que han permitido mejorar la adherencia terapéutica de los pacientes. En este sentido, el objetivo del presente proyecto consistió en desarrollar un modelo de Machine Learning que permita predecir el riesgo de pérdida de seguimiento en pacientes pertenecientes al programa de TB en el distrito capital, a partir de los determinantes sociales en salud contenidos en el sistema de información. Para ello se desarrollaron cuatro tipos de algoritmos de aprendizaje automático supervisado con diferentes técnicas de remuestreo para balancear las clases y se aplicaron diferentes técnicas para seleccionar variables predictoras incidentes en la pérdida de seguimiento. Como resultado se obtuvo un modelo de XGBoost con buen desempeño en las métricas sensibilidad, exactitud y AUC; con el cual se puede brindar un apoyo al personal de salud que hace parte de los programas locales de tuberculosis y del distrito para identificar de forma temprana a este tipo de pacientes.Item Application of data augmentation methods in transfer learning algorithms to identify amphibian species in bioacoustic signals(Pontificia Universidad Javeriana Cali, 2024) Melo Ordóñez, Adriana Lucía; Tobón Llano, Luis EduardoEl calentamiento global y sus efectos se han establecido como asuntos importantes en la actualidad. Las consecuencias y evidencias del cambio climático deberían representar la urgencia de medidas más estrictas para prevenir secuelas irreversibles. De esta manera, es crucial reunir evidencia que corrobore el grado de efecto del calentamiento global, y el Monitoreo Acústico Pasivo, PAM en inglés, es un método para cumplir este objetivo. PAM puede supervisar especies que se encuentran en riesgo de extinción y que también son especialmente sensibles a los cambios de temperatura como es el caso de los anuros. Consecuentemente, estas especies son fundamentales en determinar el impacto del calentamiento global y la escala de urgencia para abordarlo. El estudio y supervisión de señales, reunidos de la aplicación de PAM, puede implicar un desafío debido a la extensa cantidad de horas de datos que se necesitan analizar, lo que puede ser una tarea demandante y que consume mucho tiempo. Entonces, el uso de Machine Learning aparece como una herramienta efectiva para automatizar la identificación de señales bioacústicas y facilitar su estudio. Sin embargo, con el fin de alcanzar resultados excepcionales con algoritmos de Machine Learning se requieren una cantidad de datos considerable, la cual no siempre puede estar disponible. Con el objeto de afrontar la falta de datos y mejorar el desempeño de los algoritmos, técnicas como la aumentación de datos y el aprendizaje por transferencia han sido desarrolladas. Este trabajo de grado pretende probar la eficacia de estas dos técnicas para clasificar espectrogramas multi-etiqueta generados de llamados de especies de anuros. Los experimentos involucraron comparar el desempeño de tres arquitecturas de redes neuronales convolucionales (ResNet, VGG y EfficientNet) en dos bases de datos. Los experimentos concluyeron que EfficientNet obtuvo los resultados más significativos, consiguiendo en promedio un F1-score de 0.83 cuando se usó junto con la aumentación de datos y el aprendizaje por transferencia.Item Aprendizaje automático aplicado al diagnóstico de la ocurrencia de la leishmaniasis a través de imágenes de lesiones cutáneas(Pontificia Universidad Javeriana Cali, 2023) Castro Duarte, Camilo; Linares Ospina, Diego Luis; Gómez, María AdelaidaEste proyecto buscó aplicar técnicas de aprendizaje automático específicamente Redes Neuronales Convolucionales, para predecir si una lesión de tipo cutánea corresponde o no a la enfermedad de la Leishmaniasis, evaluación que no resulta tan simple mediante observación debido a la similitud con otros tipos de lesiones, para ello, se entrenaron modelos predictivos mediante una base de datos con 885 imágenes de lesiones cutáneas (407 correspondientes a Leishmaniasis y 478 correspondientes a otras lesiones cutáneas), las imágenes de Leishmaniasis fueron suministradas por el CIDEIM (Centro Internacional de Entrenamiento e Investigaciones Médicas). Durante el desarrollo del proyecto se trabajaron diferentes etapas como es el caso de la limpieza y adecuación de la base de datos de imágenes, selección y entrenamiento de los modelos, contraste de resultados y la identificación del modelo más adecuado. Los resultados arrojados por los diferentes experimentos y sus respectivas métricas permitieron establecer cuál es el modelo más adecuado para hacer la predicción, de esta forma es posible hacer un diagnóstico previo de la lesión del paciente sin siquiera estar este de cuerpo presente, también permite ayudar a personal de la salud que no tiene tanta experiencia en este tipo de lesiones a despejar dudas y tomar medidas. De esta forma se le da paso a diferentes posibilidades de aplicación del algoritmo desarrollado dentro del campo médico, como es el caso de integraciones futuras con aplicativos móviles o desarrollos web, esto puede facilitar el análisis de las lesiones de los pacientes de manera remota y de una forma ágil.Item Citobot: un enfoque de inteligencia artificial para la detección temprana del cáncer de cuello uterino(Pontificia Universidad Javeriana Cali, 2024) Rivero Urbano, David Steven; Vargas Cardona, Hernán DaríoHoy en día, el cáncer de cuello uterino sigue siendo una preocupación en términos de salud pública a nivel mundial debido a su alta incidencia y mortalidad, especialmente en países en desarrollo. En 2022, en Colombia se reportaron 30.997 casos prevalentes, lo que significó un incremento del 17% en la proporción de casos nuevos reportados. A pesar de los avances y la disponibilidad de pruebas de detección, estas cifras continúan generando inquietud, principalmente en áreas rurales, debido a la dificultad para obtener imágenes diagnósticas y la falta de expertos médicos capacitados para proporcionar una evaluación precisa en estos sitios. En el ámbito de la ingeniería, el uso de algoritmos de aprendizaje automático y profundo ha demostrado ser efectivo en aplicaciones de imágenes médicas, permitiendo identificar patrones y extraer características de distintas enfermedades, obteniendo un diagnóstico preciso en segundos. Además, la metodología de MLOps (DevOps para Machine Learning) se ha posicionado como una solución para llevar estos modelos a producción de manera efectiva, automatizando los flujos de trabajo y garantizando la escalabilidad y fiabilidad de los algoritmos. MLOps fusiona las prácticas de desarrollo de software (DevOps) con los procesos específicos de Machine Learning (ML), facilitando la implementación efectiva de modelos en entornos de producción y asegurando la integridad y confiabilidad de los algoritmos a lo largo del ciclo de vida del modelo. Bajo este contexto, el proyecto CITOBOT busca desarrollar un sistema portátil basado en inteligencia artificial para el tamizaje del cáncer de cuello uterino, implementando metodologías que permitan integrar adecuadamente un modelo predictivo de imágenes colposcópicas en una aplicación móvil que impulse el dispositivo CITOBOT. El objetivo es mejorar la detección temprana del cáncer de cuello uterino y garantizar un diagnóstico preciso y confiable de la enfermedad. Con esta iniciativa, se busca aliviar la carga de los centros médicos al proporcionar una herramienta de apoyo para el diagnóstico del cáncer de cuello uterino. Además, se pretende abordar las limitaciones en el acceso a servicios especializados en áreas rurales, al ofrecer una solución que pueda ser utilizada en dichas regiones.Item Clasificación de emociones complejas en audio de conversaciones de Call Center de la Universidad Javeriana Cali mediante modelos semi supervisados de Machine Learning(Pontificia Universidad Javariana Cali, 2024) Ospina Cuesta, Julián Andrés; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEste proyecto tuvo como objetivo identificar las expresiones emocionales complejas predominantes en llamadas del centro de contacto, para ofrecer una herramienta de medición en la satisfacción de clientes o evaluación de desempeño en la relación empleado-cliente. La problemática abordada se centró en ¿Cómo podría desarrollarse un modelo basado en técnicas de machine learning para la clasificación automática de emociones complejas en grabaciones de llamadas de un centro de contacto universitario, con el propósito de evaluar la satisfacción del cliente? El objetivo principal del proyecto fue desarrollar un modelo semi supervisado de machine learning para la clasificación automática de emociones en grabaciones de llamadas del call center de la Universidad Javeriana Cali, utilizando características acústicas. El alcance se limitó al análisis y clasificación de las emociones complejas predominantes identificadas en estas grabaciones, basándose en definiciones de emociones ajustadas a los objetivos del negocio. Los resultados de este proyecto incluyen: un conjunto de audios procesados y etiquetados de forma semi supervisada en las 'No llamadas', mientras que las 'Llamadas' fueron de manera supervisada; un modelo de clasificación automática de emociones que fue entrenado y validado, logrando una precisión del 95% en 'No llamadas' y del 41% en 'Llamadas'; y, por último, un prototipo de software diseñado como interfaz para cargar audios y clasificar las emociones según los modelos generados.Item Clasificador de sonidos que indiquen una alerta o amenaza para las personas con discapacidad auditiva(Pontificia Universidad Javeriana Cali, 2024) Villalobos Tenorio, Jeremías; Gil González, JuliánEste trabajo de grado se enfoca en el entrenamiento de modelos de aprendizaje automático para clasificar algunos sonidos que se encuentran en el conjunto de datos AudioSet de Google. Estos sonidos fueron seleccionados en función de la cantidad de muestras disponibles y su relevancia para indicar una alerta o amenaza. A través de este proyecto, se quiere documentar el proceso para llegar a entrenar un modelo que cumpla la tarea de clasificación de sonidos, y mostrar los obstáculos que se pueden presentar para lograrlo. También se busca dejar las puertas abiertas para un trabajo futuro donde se implemente un modelo de este tipo en dispositivos móviles con micrófono, y se logre ayudar a las personas con discapacidad auditiva a aprender a asociar lo que escuchan con su significado, o a que puedan identificar sonidos de su entorno físico que indiquen una alerta o amenaza para su integridad. Para llegar a los resultados del proyecto, fue necesario generar espectrogramas a partir de los sonidos descargados y entrenar varios modelos con ayuda de transfer learning. En los resultados se presenta una comparación entre los modelos entrenados, su evaluación con distintas métricas de desempeño, y su comparación con algunos modelos del estado del arte.Item Desarrollo de un aplicativo móvil para la identificación de arritmias cardíacas mediante procesamiento digital de señales ECG y aprendizaje automático(Pontificia Universidad Javariana Cali, 2025) Muñoz de la Torre, Jereminth; Otero Argel, Karolina María; Vargas Cardona, Hernán DaríoLas enfermedades cardiovasculares (ECV) representan una preocupación global, siendo una de las principales causas de mortalidad según la Organización Mundial de la Salud (OMS). En Colombia, estas enfermedades ocupan un lugar importante en las estadísticas de mortalidad, destacándolas arritmias cardíacas como un factor crítico debido a su potencial para desencadenar muerte súbita cardíaca (MSC). El objetivo de esta propuesta es desarrollar un aplicativo móvil basado en procesamiento digital de señales ECG y aprendizaje automático para identificar arritmias cardíacas y alertar sobre la posibilidad de MSC en pacientes con antecedentes cardiovasculares o enfermedades crónicas. La metodología del estudio se estructura en varias etapas, incluyendo la selección de la base de datos ECG adecuada, el procesamiento de señales, la extracción de características, el entrenamiento de modelos de aprendizaje automático, la validación y evaluación de los modelos, la implementación del aplicativo móvil y la validación del mismo mediante simuladores de ECG. Los resultados obtenidos incluyen un modelo de aprendizaje automático con una precisión del 96 %, lo que demuestra su eficacia en la clasificación de arritmias cardíacas. Además, se logró integrar exitosamente el modelo en el aplicativo móvil denominado KIBO, el cual ofrece tres salidas principales: el ritmo cardíaco, la identificación de arritmias potencialmente peligrosas capaces de desencadenar muerte súbita cardíaca (MSC), y el vector de ECG asociado. Esto permite lograr el fin último de activar de manera oportuna una ruta de atención en emergencias, mejorando la respuesta ante posibles complicaciones relacionadas con MSC y contribuyendo a la prevención de eventos fatales.Item Desarrollo de un componente de Deep Learning para el procesamiento de datos medio ambientales para la plataforma URB@NECOLIFE(Pontificia Universidad Javeriana Cali, 2020) Chaparro Cuadros, Cristian Alejandro; Zúñiga Cañón, Claudia LilianaEl Grupo de Investigación COMBA I+D de la Universidad Santiago de Cali, junto con la Universidad de Vigo y el Centro Universitario de la Defensa de España (CUD), han desarrollado el macroproyecto llamado Urb@nEcoLife. El cual busca, a través de una red de sensores móviles, capturar datos relacionados con la contaminación del aire. En el siguiente trabajo se muestra la implementación de la metodología Cross-Industry Standard Process for Data Mining CRISDM, con el fin de resolver y predecir posibles problemas medio ambientales de la ciudad Cali – Colombia, usando como base un algoritmo de red neuronal recurrente para procesar las series de tiempo armadas de los datos de contaminación de los años 2010 – 2017. Dentro del proyecto se exploraron.Item Desarrollo de un modelo de aprendizaje automático para la asignación de códigos de producto por sociedades comisionistas de la bolsa mercantil de Colombia a partir de descripciones de productos en supermercados(Pontificia Universidad Javeriana Cali, 2024) Collantes Zuluaga, Santiago; García Cifuentes, Juan Pablo; Gil González, JuliánEste proyecto presenta el desarrollo de un modelo de aprendizaje automático para la asignación automática de códigos de productos en la Bolsa Mercantil de Colombia (BMC) a partir de descripciones proporcionadas por sus Sociedades Comisionistas (SC). Utilizando técnicas avanzadas de procesamiento de lenguaje natural (NLP) y aprendizaje profundo, se busca mejorar la precisión y eficiencia del proceso actual de asignación manual. Las técnicas implementadas incluyen word embeddings con Word2Vec, modelos preentrenados de spaCy, la combinación de métricas de similitud como Jaccard y coseno, y redes siamesas (SBERT) para la comparación semántica de oraciones. A lo largo del proyecto, se identificaron varias limitaciones en el corpus de datos, como la variabilidad y calidad de las descripciones, errores ortográficos y léxicos, y la falta de metadatos adicionales. Los resultados mostraron que los modelos preentrenados y las redes siamesas proporcionaron mejoras significativas en la precisión de la asignación en comparación con los modelos entrenados únicamente con nuestro corpus. La combinación de métricas de similitud también demostró ser efectiva para mejorar el alineamiento de descripciones. El estudio concluye que la integración de datos adicionales y el ajuste fino continuo de los modelos pueden llevar a mejoras adicionales en la precisión y eficiencia de este proyecto.Item Detección de Tejido Canceroso en Glándulas Mamarias Basado en Aprendizaje Automático Supervisado con Múltiples Expertos(Pontificia Universidad Javeriana Cali, 2024) Muñoz Hoyos, Adrián Sebastián; Martínez Reyes, Jean Cristopher; Gil González, JuliánLa creciente demanda de especialistas médicos y la alta carga laboral de los patólogos dificultan el diagnóstico rápido del cáncer, lo cual es crucial para la vida del paciente. En particular, el cáncer de glándula mamaria afecta a las mujeres sin importar su origen. Este proyecto desarrolló un modelo de inteligencia artificial para detectar tejido canceroso en imágenes histológicas de glándulas mamarias. Utilizando imágenes de bases de datos públicas anotadas por expertos, el modelo de aprendizaje automático mejora la precisión y velocidad del diagnóstico, reduciendo costos operacionales y apoyando al personal médico al priorizar casos sospechosos de cáncer.Item Detección de tejido canceroso mamario a partir de técnicas de aprendizaje automático en imágenes de histología(Pontificia Universidad Javeriana Cali, 2024) Ortiz Meléndez, Diego Fernando; Layton Galindo, Oscar Julian; Gil González, JulianEl cáncer de mama femenino es el más común a nivel mundial, con 2,3 millones de casos diagnosticados anualmente y un riesgo de recurrencia del 15%. La detección temprana es crucial para mejorar el tratamiento y las tasas de supervivencia. Sin embargo, el análisis visual de imágenes histológicas es complejo y subjetivo, lo que lleva a errores en el diagnóstico. Este proyecto desarrolló un modelo de clasificación de imágenes histológicas utilizando aprendizaje automático para detectar tejido canceroso mamario, con el objetivo de apoyar a los especialistas en la detección temprana y precisa de la enfermedad. Se recopilaron imágenes histopatológicas de bases de datos públicas, se entrenó un modelo de clasificación supervisada, y se validó su rendimiento para asegurar su precisión y confiabilidad.Item Diseño e implementación de un sistema predictivo de calidad del agua para piscicultura en Colombia, basado en tecnología IoT y aprendizaje automático(Pontificia Universidad Javariana Cali, 2025) Burbano Rincón, Kamilo Yani Vam; Álvarez Bermúdez, Diego Alejandro; Martínez Álvarez, Alexánder; Valencia Díaz, Manuel VicenteLa piscicultura en Colombia es crucial económica y socialmente. El control efectivo de las variables fisicoquímicas del agua es fundamental para su éxito. Este trabajo presenta el diseño, implementación y evaluación de un sistema IoT para monitorear estas variables en una piscicultura en Jamundí, Valle del Cauca. El sistema, que incluye hardware para medir temperatura del agua, pH y total de sólidos disueltos en el agua (TDS), transmite datos a una plataforma web cada 15 minutos. En el desarrollo del software de la plataforma web se empleó una arquitectura modelo-vista-controlador (MVC) con Java y Spring Boot, garantizando seguridad y usabilidad. Además, se aplicaron técnicas de machine learning para optimizar la gestión del agua, evaluando modelos como la regresión lineal, regresor de máquinas de soporte vectorial, regresor de k-vecinos más cercanos, regresor de árbol de decisión y regresor de bosque aleatorio. El modelo que obtuvo el menor MAE (Error absoluto medio) fue el regresor de árboles de decisión. En la plataforma web, los piscicultores pueden registrar las mediciones fisicoquímicas del agua de manera manual o utilizar el dispositivo diseñado para obtener las mediciones automáticamente. Las variables para las que se realizaron predicciones fueron la temperatura del agua, la conductividad del agua, los TDS y el pH. El sistema desarrollado permite a los operadores de pisciculturas acceder a datos actualizados en línea desde cualquier dispositivo con conexión a internet. Los datos recolectados se presentan de manera clara y comprensible mediante gráficos, facilitando su interpretación y análisis. Además, los modelos de aprendizaje automático implementados han demostrado ser efectivos en la predicción de la calidad del agua, lo que mejora significativamente la toma de decisiones y optimiza la gestión de mediciones en la piscícola.Item Estimación de los determinantes de los precios de vivienda en la ciudad de Cali utilizando web scraping y machine learning(Pontificia Universidad Javeriana de Cali, 2020) Penagos Arias, Carlos EnriqueEste trabajo de tesis presenta la importancia de los modelos estadísticos a la hora de determinar los indicadores más importantes en la fijación de los precios de las viviendas en Cali. Para realizar esta investigación es de vital importancia conocer en primera instancia el web scraping el cual fue utilizado para obtener los datos del presente estudio, adicionalmente los modelos elegidos para realizar la investigación presentada son el modelo de regresión lineal, modelo lineal generalizado, modelo aditivo generalizado, árbol de decisión y redes neuronales. Los cuales con la ayuda del software estadístico R nos presentan un modelo de regresión y nos permiten determinar cual modelo es el mejor para ajustar los precios de las viviendas en la ciudad.Item Estimación del precio de renta en predios rurales mediante modelación espacial en Colombia.(Pontificia Universidad Javariana Cali, 2024) Salgado Ramírez, Carlos Andrés; Arango Londoño, David; Bohórquez, Martha PatriciaLa Sociedad de Activos Especiales (SAE), que administra predios en extinción de dominio, actualmente está en el proceso de otorgar sus predios a diversas instituciones y comunidades para contribuir tanto a la soberanía alimentaria, como a otros sectores sociales del país. Para lograr esto, se deben establecer precios de renta justos y transparentes. Los métodos existentes para estimar la renta en predios rurales no han sido implementados hasta ahora en el país. Este proyecto desarrolla un modelo basado en técnicas de aprendizaje supervisado usando machine learning para estimar la renta de predios rurales en Colombia. El modelo incorpora la dependencia espacial, lo que permite una comprensión más profunda de las variaciones en los precios de renta. Este proyecto representa una oportunidad de innovación para la estimación de la renta en predios rurales y contribuye significativamente a la seguridad y soberanía alimentaria del país.Item Generador de resúmenes para noticias sobre economía(Pontificia Universidad Javeriana Cali, 2024) Guerrero Caicedo, Natalia; Rivero Ortega, Jesús DavidSe diseñó y desarrolló un generador de resúmenes extractivos enfocado en noticias económicas utilizando técnicas de aprendizaje automático. Se exploraron diversas tecnologías relacionadas con el ámbito de la generación de resúmenes, de las cuales se escogieron las dos más pertinentes. Además, se discutieron las limitaciones técnicas asociadas a esta tarea y las estrategias posibles para mitigar estos desafíos.Item Identificación de alteraciones en heridas quirúrgicas mediante la aplicación de inteligencia artificial en imágenes(Pontificia Universidad Javeriana Cali, 2024) Cote Flórez, Álvaro Augusto; Pineda Gómez, Amolfi Hernando; Rodríguez Prada, Javier Armando; Vargas Cardona, Hernán DaríoEl presente proyecto de grado utilizó la inteligencia artificial aplicada al análisis de imágenes digitales para lograr la identificación de alteraciones en heridas quirúrgicas. Esta investigación abordó una problemática de alta relevancia debido a las consecuencias que pueden surgir de las infecciones de sitio operatorio, incluyendo morbilidad, mortalidad y costos económicos significativos tanto para los pacientes como para el sistema de salud. Actualmente, la detección de estas infecciones se realiza principalmente a través de métodos clínicos y cultivos, que pueden ser tardíos y limitados en términos de precisión. Con el uso de técnicas de inteligencia artificial, como el machine learning y el deep learning, se logró desarrollar un modelo automatizado y confiable que permite la identificación de alteraciones en las heridas quirúrgicas, lo que facilita un tratamiento oportuno y efectivo. Para desarrollar el proyecto se recopiló una base de datos de imágenes digitales etiquetadas que muestran la evolución de las heridas quirúrgicas, se eligieron y adaptaron algoritmos de inteligencia artificial capaces de identificar patrones y características en dichas imágenes, y se evaluó la eficacia y precisión del modelo desarrollado mediante validaciones con métricas establecidas en el estado del arte. El resultado del trabajo realizado es el punto de partida para trabajos posteriores que podrán incluir un modelo de apoyo diagnóstico automatizado y confiable para la detección de alteraciones en heridas quirúrgicas. Este proyecto tiene aplicaciones en el campo de la cirugía y la salud pública, y su impacto se refleja en un seguimiento posquirúrgico oportuno y efectivo evitando complicaciones en las heridas y apoyando el proceso de recuperación del paciente, así como en la reducción de costos y procedimientos médicos adicionales debido a complicaciones en las heridasItem Identificación de radiografías patológicas y no patológicas mediante procesamiento digital de imágenes y técnicas de aprendizaje de máquina(Pontificia Universidad Javeriana Cali, 2022) Muñoz Díaz, Andrés Felipe; Vargas Cardona, Hernán DaríoEn el mundo, gran cantidad de personas padecen enfermedades respiratorias, las cuales pueden ser o no diagnosticadas. A causa del mal o tardío diagnóstico, se presentan gran cantidad de muertes al año, por lo cual es importante encontrar una manera viable que permita detectar las patologías prematuramente para así mismo poder dar tratamiento oportuno y no en etapas avanzadas de las enfermedades. Dado esto, este trabajo propone una metodología en lenguaje Python la cual permite identificar radiografías de tórax patológicas y no patológicas. Lo anterior se hace a partir de 3 etapas, la primera de pre-procesamiento de imágenes, en la que se realiza una limpieza de las imágenes diagnósticas y eliminación de ruido. La segunda una etapa de extracción de características discriminativas y una tercera etapa donde a partir de técnicas de aprendizaje de máquina para realizar la clasificación propuesta desde diferentes algoritmos.