Vitela :: Browsing by Subject "XGBoost"

Browsing by Subject "XGBoost"

Now showing 1 - 5 of 5

Desarrollo de un modelo predictivo de abandono y segmentación de clientes para COLOMBIA INTERNET ISP: análisis del churn rate
(Pontificia Universidad Javeriana Cali, 2025) Jimeno Grisales, Evelyn; Garrido García, Oscar Mauricio; García Lemus, Deybison Antonio; Mosquera Valencia, Diego Fernando
El presente proyecto se centra en el desarrollo de un modelo predictivo orientado a la estimación del churn-rate en COLOMBIA INTERNET ISP, empresa de servicios de Internet con operaciones en los departamentos del Valle del Cauca y Tolima. La empresa registra una tasa de abandono promedio del 2.1% mensual. A través del uso de técnicas de análisis de datos y algoritmos de aprendizaje automático, se busca identificar patrones de comportamiento asociados a la pérdida de clientes y construir un modelo capaz de predecir dicho fenómeno con base en variables demográficas, comerciales y de uso del servicio. La metodología aplicada sigue el enfoque CRISP-DM, e incluye etapas de comprensión del negocio, recolección y preparación de datos, modelado, evaluación e implementación. Se implementaron técnicas de imputación, transformación y depuración de datos, así como análisis univariado y de correlación para seleccionar variables relevantes. Posteriormente, se entrenaron y evaluaron distintos modelos de clasificación, tales como regresión logística, árboles de decisión, random forest y XGBoost, utilizando métricas de desempeño como sensibilidad, precisión, F1-score y área bajo la curva ROC (AUC) para seleccionar el modelo con mejor rendimiento. Finalmente, se realizó una segmentación de clientes utilizando técnicas de clustering, con el propósito de identificar perfiles con distintos niveles de riesgo de abandono. Este proyecto constituye una aplicación integral de la ciencia de datos al análisis del churn en el sector de telecomunicaciones, desde la preparación y exploración de datos hasta la evaluación comparativa de modelos predictivos y la segmentación de usuarios con base en su comportamiento.
Identificación de niveles de riesgos en salud para la gestión de afiliados mediante aprendizaje automático
(Pontificia Universidad Javeriana Cali, 2025) Avila Reina, Adriana Janeth; Aguilar Ramírez, David Orlando; Vargas Cardona, Hernán Darío
El proyecto aplicado tuvo como objetivo desarrollar un modelo automatizado para la identificación de niveles de riesgo en salud de afiliados de la empresa Keralty mediante técnicas de aprendizaje automático supervisado. Su importancia radica en la necesidad de fortalecer los procesos de estratificación de riesgo que actualmente se basan en reglas estáticas definidas por expertos, las cuales no se actualizan automáticamente ante nuevos datos ni aprovechan el potencial analítico de grandes volúmenes de información clínica, demográfica y de utilización de servicios. La problemática abordada se centra en mejorar la capacidad de la organización para identificar oportunamente a los pacientes con mayor probabilidad de deterioro en su estado de salud, permitiendo así priorizar acciones preventivas que optimicen el uso de recursos y reduzcan costos asociados a complicaciones evitables. Para resolver esta limitación, se preparó una base de datos estructurada, anonimizada y etiquetada con 36 clases combinadas de riesgo y severidad, y se entrenaron múltiples clasificadores supervisados, incluyendo XGBoost, Random Forest, Árboles de Decisión, Regresión Logística, KNN y SVM, tanto en versiones balanceadas como desbalanceadas. Los modelos fueron evaluados mediante métricas como exactitud, precisión, recall, F1-score y AUC-ROC, y validados con técnicas de partición aleatoria repetida (random holdout). XGBoost sin balancear fue el modelo con mejor desempeño general en las 36 clases incluso al ser aplicado sobre registros correspondientes a un período posterior, lo cual respalda su estabilidad operativa y capacidad de generalización dentro del mismo sistema de datos. Estos resultados sugieren que los modelos supervisados pueden complementar los enfoques actuales de gestión del riesgo, ofreciendo mayor precisión en la clasificación de pacientes y una base técnica para el diseño de intervenciones diferenciadas. Aunque el proyecto no contempla una fase de despliegue real, sus hallazgos representan un insumo relevante para tomadores de decisión que buscan integrar herramientas de inteligencia artificial en la gestión en salud. Finalmente, se identificó como línea futura la exploración de técnicas no supervisadas para detectar nuevas segmentaciones no capturadas por los esquemas actuales.
Implementación de modelos de machine learning para la predicción de la demanda en una empresa manufacturera de productos de aseo y desinfección
(Pontificia Universidad Javeriana Cali, 2025) Isaza Sanabria, Luisa Angélica; Murillo Cadena, Juan Andrés; Villa Infante, Carlos Fabián; García Arboleda, Isabel Cristina
Este proyecto de investigación implementó modelos de Machine Learning con el objetivo de optimizar la predicción de la demanda en una empresa manufacturera de productos de aseo y desinfección, atendiendo problemáticas como el exceso de inventarios y ventas pérdidas. A partir de un análisis exploratorio de datos se identificaron variables relevantes y patrones de comportamiento de la demanda que permitieron incrementar la precisión de los pronósticos mediante técnicas avanzadas de ciencia de datos. Los resultados obtenidos en los modelos se sistematizaron y se presentaron en un dashboard interactivo en Power BI, lo que facilitó la interpretación de la información y respaldó la toma de decisiones tanto operativas como estratégicas. En términos de impacto, la implementación de esta propuesta contribuyó a optimizar la gestión de inventarios, disminuir el riesgo de desabastecimiento y reducir los costos asociados a productos obsoletos, evidenciando la pertinencia de estas metodologías en entornos industriales caracterizados por una alta variabilidad en la demanda.
Modelo predictivo de puntualidad aérea (OTP) en Colombia basado en factores climáticos
(Pontificia Universidad Javeriana Cali, 2025) Buitrago Martín, Daniel Mauricio; Martínez López, David Steven; Vidal Godoy, Paula; Arango Londoño, David
La puntualidad de los vuelos, medida a través del indicador On-Time Performance (OTP), constituye un aspecto crítico en la calidad del servicio aeronáutico y en la eficiencia operativa de las aerolíneas. En Colombia, las condiciones climáticas se han identificado como uno de los factores que más inciden en los retrasos, generando afectaciones operativas, sobrecostos y una disminución en la satisfacción del pasajero. Este estudio toma como unidad de análisis los vuelos comerciales domésticos operados en Colombia, integrando información histórica de desempeño operacional y variables meteorológicas. El horizonte temporal de análisis comprende datos entre 2019 y 2024, obtenidos de fuentes oficiales como Aerocivil, Cirium, Flightradar24, IDEAM, NOAA y reportes METAR. A partir de estos datos se desarrolla un modelo predictivo basado en técnicas de aprendizaje supervisado, específicamente Random Forest y XGBoost, con un proceso metodológico que incluye análisis exploratorio, selección de características, construcción del modelo y validación mediante métricas estándar de clasificación. El propósito es estimar la probabilidad de retraso y alcanzar un desempeño igual o superior al 85% de precisión, además de identificar las variables meteorológicas más influyentes en el comportamiento de la puntualidad aérea. Los resultados esperados buscan aportar una herramienta de apoyo para la toma de decisiones operativas, optimizar la planificación, reducir costos asociados a demoras y contribuir al fortalecimiento del sector aeronáutico colombiano.
Sistema para la estimación de peso de ganado bovino a partir de técnicas de aprendizaje automático
(Pontificia Universidad Javeriana Cali, 2025) Perdomo Trujillo, Miller Eduardo; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria Inés
La ganadería bovina requiere métodos precisos, prácticos y económicos para estimar el peso vivo, un parámetro esencial para el manejo productivo, la salud y la comercialización. Los métodos tradicionales básculas y cintas métricas pueden resultar costosos, poco accesibles en zonas rurales y generar estrés en los animales. Este proyecto desarrolló un sistema de estimación de peso mediante visión artificial y aprendizaje automático, optimizado para dispositivos móviles sin conexión a internet. Se construyó un conjunto de datos compuesto por 513 registros tabulares y 17 899 imágenes de vista posterior, permitiendo integrar información morfométrica y visual en distintos enfoques de modelado. Se evaluaron dos líneas metodológicas principales. La primera utilizó modelos de regresión sobre datos tabulares (SVR, Random Forest, XGBoost y MLP). Los modelos de conjunto lograron los mejores resultados, destacando XGBoost, que alcanzó un R² > 0.99 y un MAE de 3.27 kg. Este desempeño confirma que las variables morfométricas permiten una estimación altamente precisa del peso vivo. 29.9 kg), lo que evidencia que la información tabular sigue siendo esencial para obtener predicciones confiables y mejora significativamente la precisión final. Además, se desarrolló un prototipo móvil Android utilizando TensorFlow Lite para realizar inferencias directamente en el dispositivo (Edge Computing). La aplicación puede estimar el peso a partir de una fotografía del tercio posterior del animal y demostró ser funcional en entornos rurales con conectividad limitada. No obstante, la precisión basada exclusivamente en imágenes aún se encuentra por debajo de la obtenida con datos morfométricos. El segundo enfoque exploró modelos multimodales e híbridos basados en imágenes. El mejor resultado provino de una arquitectura paralela que combina una ResNet50 preentrenada para extraer características visuales con un MLP Regressor para procesar los datos tabulares. Esta fusión alcanzó un R² = 0.74 y un MAE = 21.57 kg. Es relevante subrayar que estas métricas corresponden al modelo híbrido y no a uno puramente visual. Al evaluar únicamente la rama de visión, el desempeño disminuyó (R² ≈ 0.60 y MAE ≈ En conclusión, los datos tabulares ofrecen la mayor precisión disponible; la combinación multimodal mejora respecto a la visión sola, pero no supera al mejor modelo tabular (XGBoost). El prototipo móvil demuestra viabilidad práctica y potencial de aplicación real, aunque requiere mejoras en la integración de modalidades y en la robustez ante variabilidad de captura para alcanzar niveles comparables a los métodos tradicionales.

Browsing by Subject "XGBoost"

Results Per Page

Sort Options