Browsing by Subject "Predictive models"
Now showing 1 - 5 of 5
Results Per Page
Sort Options
Item Indicador de desarrollo integral en los niños entre 0 y 5 años, en el Valle del Cauca y 13 municipios del Norte del Cauca, a través de modelo predictivo(Pontificia Universidad Javeriana Cali, 2024) Ávila Huertas, Wladimir; López Álvarez, Daniel Alejandro; Aristizábal, Mario Felipe; Mora Cardona, Mario JuliánEl objetivo de este proyecto se enfocó en el desarrollo de modelos predictivos para clasificar y predecir el potencial de desarrollo de niños menores o iguales de 5 años en el Valle del Cauca y norte del Cauca 3utilizando los datos del Sisbén. Se analizaron factores socioeconómicos y geográficos que influyen en el desarrollo de la primera infancia, con el objetivo de proporcionar información relevante para la toma de decisiones en políticas públicas y programas sociales dirigidos a esta población vulnerable. La actualización de la base de datos del Sisbén es fundamental para garantizar la eficacia y equidad en la asignación de subsidios y programas sociales en Colombia. Al mantener la información actualizada, se asegura que los recursos lleguen de manera eficiente a las familias más necesitadas, permitiendo una distribución equitativa y efectiva de los subsidios. Además, una base de datos actualizada proporciona una visión precisa de la situación socioeconómica de la población, facilitando la identificación de necesidades y la planificación de intervenciones enfocadas en el bienestar de los niños y sus familias. Los beneficios de contar con una base de datos del Sisbén actualizada son significativos. No solo se mejora la focalización de los programas sociales, sino que también se reducen las inequidades y se promueve el desarrollo integral de los niños en situaciones de pobreza y vulnerabilidad. La actualización de la base de datos permite realizar análisis detallados que sirven como base para la formulación de políticas basadas en evidencia, orientadas a mejorar las condiciones de vida de la población infantil en estas regiones específicas de Colombia. En resumen, este proyecto busca aprovechar los datos del Sisbén para desarrollar un modelo predictivo que ayude a comprender y predecir el desarrollo de la primera infancia en el Valle del Cauca y norte del Cauca. La correcta clasificación de categorías en la base de datos del Sisbén garantiza una asignación eficiente de recursos, generando impactos positivos en la calidad de vida y el futuro de los niños en estas regiones.Item Modelo multivariado para predecir la localización de la población a partir de factores sociodemográficos en Colombia(Pontificia Universidad Javeriana Cali, 2024) Valbuena Acosta, Carlos; Mora Cardona, Mario JuliánEl objetivo de este proyecto era determinar cuáles son los factores que inciden sobre la localización de un individuo en Colombia. Para lograrlo, implementó el algoritmo Propensity Score Matching con base en los datos del Censo 2018 para la población del Valle del Cauca, en los módulos de personas, hogares, viviendas y marco de georreferenciación, con un universo de 3,2 millones de registros y 40 variables seleccionadas. Para cumplir el objetivo del proyecto, se construyeron 3 bases de datos con sus grupos de tratamiento y control, así: el primero con datos urbanos de Cali y los demás municipios, el segundo, solo con registro urbanos de Cali y el tercero, con registros del área urbana y centros poblados de Cali. Sobre estos algoritmos se entrenó el PSM, partiendo de una preparación de los datos, luego se realizó la estimación del propensity score que es la determinación del problema binario, es decir, la obtención de la probabilidad que un individuo se ubique en un grupo u otro para hacer las muestras comparables, seleccionando los Conjuntos 1 y 2 con el mejor nivel de accuracy con 61% y 50% respectivamente debido a la alta variabilidad que reviste una base como el Censo; con estos dos conjuntos se dio paso a la fase de emparejamiento a través de vecinos más cercanos – KNN, donde el conjunto 1 de Cali y los demás municipios obtiene las menores diferencias en las variables observables luego del emparejamiento. Posteriormente, para predecir la manzana geográfica como unidad mínima de granularidad que ubica al individuo dentro de los Shapes del Censo-DANE, se implementó el clasificador Random Forest, el cual mostró dificultades para predecir la ubicación en una categoría compuesta por 22 caracteres, alcanzando un accuracy de 32 %, luego se hicieron unas transformaciones en la variable a predecir sin afectar su origen, logrando un mejor resultado del 39% con la predicción de los últimos 8 campos de la localización de los individuos de Cali, pero debido al alto costo computacional este modelo no se pudo replicar para datos nuevos provenientes de SISBEN. Finalmente, se espera que este proyecto contribuya a profundizar los análisis económicos que desarrolle el Centro de Investigación Aplicada Riqueza Completa, mediante la implementación de algoritmos de emparejamiento como el PSM, especialmente dentro del uso de variables sociodemográficas como el Censo y su potencial capacidad para determinar la localización de un individuo a partir de estas.Item ¿Permiten los modelos predictivos y el análisis técnico optimizar los resultados de estrategias de inversión periódica sobre un índice bursátil?(Pontificia Universidad Javeriana Cali, 2024) Duque González, Andrés Felipe; Lofruscio Vallejo, María Antonia; Arango Londoño, DavidEl presente estudio explora la inversión pasiva o indexación proponiendo un método periódico de inversión que ofrece una alternativa al convencional Dollar Cost Averaging (DCA). La estrategia propuesta armoniza principios de los mercados eficientes con el análisis técnico, combinando dos perspectivas históricamente divergentes, y emplea el modelo predictivo ARIMA, para optimizar la cantidad invertida en cada período. El propósito de esta aproximación es ajustar las inversiones a las fluctuaciones del mercado, basándose en datos históricos y tendencias actuales para guiar las decisiones de inversión, desplazando así el foco de la predicción de precios hacia la optimización del monto invertido. Aunque investigaciones previas han explorado ajustes periódicos en el volumen de inversión, la novedad de este estudio radica en integrar el análisis técnico y modelos predictivos para la toma de decisiones sobre el volumen de aportes, un enfoque poco explorado en la literatura existente. A partir de este proyecto de investigación se espera que la estrategia propuesta, superé en rendimiento y riesgo al enfoque tradicional de Dollar Cost Averaging.Item Predicción de desenlaces de pacientes de emergencias atendidas por hospitales nivel I y II en el Valle del Cauca(Pontificia Universidad Javariana Cali, 2024) Castañeda González, Luis Carlos; Gallego Paz, Sonia Yurany; León Tabares, Juan José; Paz Roa, Juan CamiloEste proyecto parte de la problemática de la sobreocupación en los servicios de urgencias y la necesidad de optimizar la atención al paciente, agilizando la toma de decisiones en este entorno crítico. El servicio de urgencias inicia con una valoración de Triage al momento de la llegada del paciente, posteriormente, el paciente pasa a la valoración inicial por parte de un médico tratante que determina el manejo del paciente. Durante la atención, los pacientes terminan su servicio con uno de varios desenlaces que puede ser entre otros: 1) Alta de urgencia, 2) hospitalización, 3) remisión normal, 4) remisión prioritaria y 5) remisión urgente. Este proyecto aplicado propone un modelo de aprendizaje automático que puede apoyar al personal médico en su predicción de los desenlaces clínicos, y de esta manera contribuir a una mejor toma de decisiones de alta de urgencias, hospitalización o remisión a un nivel superior de complejidad. La implementación de este modelo en la valoración inicial podría contribuir a la optimización de la atención a los pacientes al agilizar las decisiones de traslados, minimizar errores humanos, y aliviar la fatiga cognitiva de los médicos. Se emplearon tres modelos de aprendizaje automático: Regresión Logística Multinomial (RLM), Máquinas de Soporte Vectorial (SVM) y Extreme Gradient Boosting (XGBoost). El rendimiento se evaluó con métricas como precisión, sensibilidad y F1-score. Se incluyó un análisis de texto utilizando TF-IDF para enriquecer los datos y mejorar la precisión del modelo. Se encontró que tanto RLM como SVM mostraron limitaciones en la predicción de clases minoritarias, como la necesidad de hospitalización o remisión. El modelo XGBoost, potenciado con análisis de texto, obtuvo el mejor rendimiento, mejorando la precisión, especialmente en la predicción de clases minoritarias. Los resultados obtenidos confirman que la inclusión de información textual permite mejorar la predicción. Asimismo, evidencian las limitaciones de RLM y SVM en conjuntos de datos desbalanceados y destaca la superioridad de XGBoost y otros algoritmos avanzados. Los resultados obtenidos se alinean con la literatura, que también evidencia las limitaciones de RLM y SVM en conjuntos de datos desbalanceados y destaca la superioridad de XGBoost y otros algoritmos avanzados. Este proyecto de ciencia de datos contribuye al desarrollo de herramientas que pueden ayudar a optimizar la atención en urgencias, mejorando la toma de decisiones, la asignación de recursos y la calidad del servicio. A futuro, se propone validar los modelos en otros contextos e incorporar nuevas variables para mejorar aún más la predicción.Item Predicción del gasto de bolsillo en salud de los hogares en Colombia usando modelos de aprendizaje automático(Pontificia Universidad Javariana Cali, 2024) Parada Portilla, Juan Sebastián; Ortega Lenis, DeliaEste trabajo desarrolla modelos de aprendizaje automático para predecir el gasto de bolsillo en salud de los hogares colombianos. Utilizando datos de la Encuesta de Calidad de Vida (ECV), se identificaron variables clave como la presencia de enfermedades crónicas en el hogar, el ingreso del hogar, el tamaño del hogar, el estado de salud y la afiliación al sistema de seguridad social. Inicialmente, se exploraron modelos de regresión, pero debido a la alta proporción de valores nulos (85\% de los hogares no reportan gasto en salud), su desempeño fue limitado. Para abordar este problema, se transformó la variable dependiente en una binaria y se aplicaron modelos de clasificación, incluyendo Random Forest, Gradient Boosting y regresión logística, optimizados con la técnica SMOTE para balancear las clases. Los resultados muestran que los modelos de clasificación superan a los de regresión, con Random Forest y Gradient Boosting logrando los mejores desempeños en términos de ROC AUC. Este estudio proporciona herramientas útiles para el diseño de políticas públicas basadas en evidencia, permitiendo identificar hogares con mayor riesgo de incurrir en altos gastos en salud y facilitando intervenciones para reducir el impacto financiero en las familias colombianas.