Identificación de niveles de riesgos en salud para la gestión de afiliados mediante aprendizaje automático

Abstract
El proyecto aplicado tuvo como objetivo desarrollar un modelo automatizado para la identificación de niveles de riesgo en salud de afiliados de la empresa Keralty mediante técnicas de aprendizaje automático supervisado. Su importancia radica en la necesidad de fortalecer los procesos de estratificación de riesgo que actualmente se basan en reglas estáticas definidas por expertos, las cuales no se actualizan automáticamente ante nuevos datos ni aprovechan el potencial analítico de grandes volúmenes de información clínica, demográfica y de utilización de servicios. La problemática abordada se centra en mejorar la capacidad de la organización para identificar oportunamente a los pacientes con mayor probabilidad de deterioro en su estado de salud, permitiendo así priorizar acciones preventivas que optimicen el uso de recursos y reduzcan costos asociados a complicaciones evitables. Para resolver esta limitación, se preparó una base de datos estructurada, anonimizada y etiquetada con 36 clases combinadas de riesgo y severidad, y se entrenaron múltiples clasificadores supervisados, incluyendo XGBoost, Random Forest, Árboles de Decisión, Regresión Logística, KNN y SVM, tanto en versiones balanceadas como desbalanceadas. Los modelos fueron evaluados mediante métricas como exactitud, precisión, recall, F1-score y AUC-ROC, y validados con técnicas de partición aleatoria repetida (random holdout). XGBoost sin balancear fue el modelo con mejor desempeño general en las 36 clases incluso al ser aplicado sobre registros correspondientes a un período posterior, lo cual respalda su estabilidad operativa y capacidad de generalización dentro del mismo sistema de datos. Estos resultados sugieren que los modelos supervisados pueden complementar los enfoques actuales de gestión del riesgo, ofreciendo mayor precisión en la clasificación de pacientes y una base técnica para el diseño de intervenciones diferenciadas. Aunque el proyecto no contempla una fase de despliegue real, sus hallazgos representan un insumo relevante para tomadores de decisión que buscan integrar herramientas de inteligencia artificial en la gestión en salud. Finalmente, se identificó como línea futura la exploración de técnicas no supervisadas para detectar nuevas segmentaciones no capturadas por los esquemas actuales.
item.page.abstract.eng
item.page.descriptioneng
Citation