Tobar Tosse, Henry FabiánLópez León, William AndrésParra Barrera, Eliana LisethMeneses Ramírez, Karem Dayana2026-01-282026-01-282025http://hdl.handle.net/11522/5291El cáncer gástrico continúa siendo uno de los principales desafíos en salud pública a nivel mundial, no solo por su elevada mortalidad, sino también por las limitaciones actuales para estratificar adecuadamente el riesgo y personalizar las decisiones terapéuticas. A pesar de los avances diagnósticos y moleculares, la predicción de supervivencia sigue siendo imprecisa debido a la heterogeneidad tumoral y a la fragmentación de la información clínica y genómica. En este escenario, los modelos integrativos basados en ciencia de datos representan una oportunidad para mejorar el pronóstico y apoyar de manera objetiva la toma de decisiones clínicas. Este proyecto tuvo como objetivo desarrollar y evaluar modelos de predicción de supervivencia en cáncer gástrico mediante la integración de variables clínicas (edad, sexo, estadio TNM, grado histológico), perfiles de expresión de miRNA y características cuantitativas derivadas de imágenes histopatológicas digitales H&E. Para ello, se emplearon datos del repositorio TCGA STAD del National Cancer Institute, incluyendo tablas clínicas, matrices de expresión miRNA-seq y Whole Slide Images en formato SVS. El pipeline metodológico incluyó: (1) preprocesamiento clínico con imputación y estandarización; (2) selección de miRNA mediante análisis de expresión diferencial y pruebas univariadas; (3) normalización de color y extracción de parches tisulares con OpenSlide; (4) extracción de características morfológicas, estructurales y texturales con un enfoque interpretable desde criterios histopatológicos; y (5) agregación estadística por paciente. Con este conjunto multimodal se entrenaron tres modelos de supervivencia ampliamente utilizados: Coxnet penalizado, Random Survival Forest (RSF) y DeepSurv, optimizados mediante búsqueda aleatoria y validación interna. Entre las estrategias evaluadas, el modelo Coxnet penalizado se consolidó como el más robusto e interpretable para la predicción de supervivencia en la cohorte TCGA-STAD. Este alcanzó un C index de 0.7315 y valores de AUC(t) de 0.784, 0.758 y 0.760 a 1, 3 y 5 años, respectivamente. El Brier Score obtenido (0.1441) evidenció una adecuada calibración, mientras que las curvas de Kaplan–Meier mostraron una separación significativa entre los grupos de riesgo (log-rank p = 1.36 × 10⁻⁴), confirmando su utilidad para estratificar pacientes según su pronóstico. En conjunto, estos resultados demuestran que los enfoques multimodales permiten capturar de manera más completa la heterogeneidad biológica del cáncer gástrico y proporcionan herramientas predictivas superiores al análisis clínico tradicional, favoreciendo una estratificación temprana del riesgo y decisiones terapéuticas más precisas.120 p.application/pdfspaCáncer gástricoSupervivenciaCiencia de datosMachine learningModelo predictivoGastric cancerSurvivalData sciencePredictive modelingPredicción de la supervivencia en pacientes con cáncer de estómago: integración de características clínicas, genéticas y análisis de imágenes para el apoyo en la toma de decisiones clínicasmaster thesishttps://creativecommons.org/licenses/by-nc-sa/4.0/http://purl.org/coar/access_right/c_abf2