Ortega Lenis, DeliaParada Portilla, Juan Sebastián2025-03-132025-03-132024http://hdl.handle.net/11522/4629Este trabajo desarrolla modelos de aprendizaje automático para predecir el gasto de bolsillo en salud de los hogares colombianos. Utilizando datos de la Encuesta de Calidad de Vida (ECV), se identificaron variables clave como la presencia de enfermedades crónicas en el hogar, el ingreso del hogar, el tamaño del hogar, el estado de salud y la afiliación al sistema de seguridad social. Inicialmente, se exploraron modelos de regresión, pero debido a la alta proporción de valores nulos (85\% de los hogares no reportan gasto en salud), su desempeño fue limitado. Para abordar este problema, se transformó la variable dependiente en una binaria y se aplicaron modelos de clasificación, incluyendo Random Forest, Gradient Boosting y regresión logística, optimizados con la técnica SMOTE para balancear las clases. Los resultados muestran que los modelos de clasificación superan a los de regresión, con Random Forest y Gradient Boosting logrando los mejores desempeños en términos de ROC AUC. Este estudio proporciona herramientas útiles para el diseño de políticas públicas basadas en evidencia, permitiendo identificar hogares con mayor riesgo de incurrir en altos gastos en salud y facilitando intervenciones para reducir el impacto financiero en las familias colombianas.106 p.application/pdfspaGasto de Bolsillo en SaludAprendizaje automáticoModelos predictivosPolíticas públicas en SaludAnálisis estadísticoOut-of-pocket health spendingMachine LearningPredictive modelsPublic policies in healthStatistical análisisPredicción del gasto de bolsillo en salud de los hogares en Colombia usando modelos de aprendizaje automáticohttp://purl.org/coar/resource_type/c_bdcchttps://creativecommons.org/licenses/by-nc-sa/4.0/http://purl.org/coar/access_right/c_abf2