Aplicación de ciencia de datos para predecir el éxito de la ejecución de los contratos públicos en Colombia

dc.contributor.advisorPabón Burbano, María Constanza
dc.contributor.authorArias Sanabria, Javier Andrés
dc.date.accessioned2026-03-18T15:03:54Z
dc.date.available2026-03-18T15:03:54Z
dc.date.issued2025
dc.description.abstractEste trabajo de grado aborda el desafío de predecir el riesgo de fracaso (y, consecuentemente, validar el éxito) en la ejecución de la contratación pública en Colombia mediante la aplicación de técnicas avanzadas de Ciencia de Datos. Dada la vasta disponibilidad de información en el Portal de Datos Abiertos (SECOP I), el objetivo principal de esta investigación fue desarrollar un modelo predictivo escalable que funcione como un sistema de alerta temprana para identificar irregularidades contractuales, un tema de alto interés nacional y valor estratégico para las entidades de control. Metodológicamente, se analizó el universo poblacional completo de los procesos registrados entre 2011 y 2025, procesando una matriz final de más de 1.98 millones de registros. El diseño de ingeniería de características incluyó la codificación de riesgo geográfico mediante Target Encoding y el Procesamiento de Lenguaje Natural (NLP) a través de la vectorización TF-IDF para analizar semánticamente los objetos contractuales. Se evaluaron y optimizaron cinco arquitecturas de aprendizaje supervisado, enfrentando el reto del desbalance de clases mediante aprendizaje sensible al costo. Los resultados demostraron la superioridad del modelo de ensamble LightGBM, el cual logró un rendimiento excepcional con un AUC-ROC de 0.973 y una sensibilidad del 92.82%, manteniendo una tasa de falsas alarmas controlada (7.55%). En conclusión, este proyecto demuestra que el uso de Machine Learning supera las limitaciones del análisis estadístico tradicional al capturar interacciones complejas, entregando a los sectores gubernamentales una herramienta de auditoría preventiva ágil y de alta precisión para la protección de los recursos públicos.spa
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Ciencia de Datos
dc.format.extent65 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttp://hdl.handle.net/11522/5419
dc.language.isospa
dc.publisherPontificia Universidad Javeriana Cali
dc.publisher.departmentFacultad de Ingeniería y Ciencias
dc.publisher.programMaestría en Ciencia de Datos
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subjectContratación públicaspa
dc.subjectAprendizaje automáticospa
dc.subjectAnálisis predictivospa
dc.subjectProcesamiento de lenguaje naturalspa
dc.subjectRiesgo contractualspa
dc.subjectPublic procurementeng
dc.subjectMachine learningeng
dc.subjectPredictive analyticseng
dc.subjectNatural language processingeng
dc.subjectContractual riskeng
dc.titleAplicación de ciencia de datos para predecir el éxito de la ejecución de los contratos públicos en Colombiaspa
dc.typemaster thesis
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.localTesis/Trabajo de grado - Monografía - Maestría
dc.type.redcolhttps://purl.org/redcol/resource_type/TM
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
Proyecto de Grado Final - Javier Andres Arias Sanabria,,.pdf
Size:
1.11 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Licencia de Uso - Javier Andres Arias Sanabria,,.pdf
Size:
220.41 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: