Modelo predictivo para estimar el crecimiento en la publicación de datos sobre biodiversidad: un enfoque basado en variables socioeconómicas y decisiones gubernamentales en el nodo GBIF Colombia

Abstract
La disponibilidad y acceso a datos abiertos sobre biodiversidad son fundamentales para orientar estrategias de conservación y toma de decisiones. Sin embargo, la ausencia de herramientas predictivas que integren variables socioeconómicas y de gobernanza ha limitado la capacidad para anticipar su crecimiento y contribuir al cumplimiento de compromisos internacionales como la Meta 21 del Marco Mundial Kunming-Montreal. Este proyecto tuvo como objetivo desarrollar un modelo predictivo para estimar el crecimiento en la publicación de datos sobre biodiversidad en el nodo GBIF Colombia, combinando información socioeconómica y gubernamental. El proceso metodológico incluyó la recolección, depuración y análisis exploratorio de datos de fuentes principales como el Banco Mundial, GBIF y el Open Government Partnership, seguido de la implementación de modelos estadísticos como Efectos Fijos, LASSO, Ridge y modelos de aprendizaje automático como Random Forest, XGBoost, LSTM, evaluados mediante validación cruzada temporal. Destaca el mejor desempeño, estabilidad y capacidad para capturar la tendencia de crecimiento anual en la publicación de datos a través de un modelo híbrido (Ridge + Random Forest). El modelo propuesto ofrece una herramienta estratégica para proyectar escenarios de crecimiento a partir de variables socioeconómicas, apoyar la planificación y contribuir al cumplimiento de los compromisos internacionales sobre biodiversidad y ciencia abierta.
item.page.abstract.eng
item.page.descriptioneng
Keywords
Citation
DOI