Arango Londoño, DavidOrtiz Gallego, RicardoBadillo Mojica, Daniel2026-03-182026-03-182025http://hdl.handle.net/11522/5433La disponibilidad y acceso a datos abiertos sobre biodiversidad son fundamentales para orientar estrategias de conservación y toma de decisiones. Sin embargo, la ausencia de herramientas predictivas que integren variables socioeconómicas y de gobernanza ha limitado la capacidad para anticipar su crecimiento y contribuir al cumplimiento de compromisos internacionales como la Meta 21 del Marco Mundial Kunming-Montreal. Este proyecto tuvo como objetivo desarrollar un modelo predictivo para estimar el crecimiento en la publicación de datos sobre biodiversidad en el nodo GBIF Colombia, combinando información socioeconómica y gubernamental. El proceso metodológico incluyó la recolección, depuración y análisis exploratorio de datos de fuentes principales como el Banco Mundial, GBIF y el Open Government Partnership, seguido de la implementación de modelos estadísticos como Efectos Fijos, LASSO, Ridge y modelos de aprendizaje automático como Random Forest, XGBoost, LSTM, evaluados mediante validación cruzada temporal. Destaca el mejor desempeño, estabilidad y capacidad para capturar la tendencia de crecimiento anual en la publicación de datos a través de un modelo híbrido (Ridge + Random Forest). El modelo propuesto ofrece una herramienta estratégica para proyectar escenarios de crecimiento a partir de variables socioeconómicas, apoyar la planificación y contribuir al cumplimiento de los compromisos internacionales sobre biodiversidad y ciencia abierta.77 p.application/pdfspaModelo predictivo para estimar el crecimiento en la publicación de datos sobre biodiversidad: un enfoque basado en variables socioeconómicas y decisiones gubernamentales en el nodo GBIF Colombiamaster thesishttps://creativecommons.org/licenses/by-nc-sa/4.0/http://purl.org/coar/access_right/c_abf2