Predicción de fraudes y anomalías en el suministro de agua potable con técnicas de analítica de datos

dc.contributor.advisorRamírez Buelvas, Sandra Milena
dc.contributor.authorZamudio Rojas, José David
dc.contributor.authorEnríquez Sánchez, Dany Alexander
dc.contributor.authorRodríguez Rodríguez, Cristian Fabián
dc.date.accessioned2026-01-28T16:50:16Z
dc.date.available2026-01-28T16:50:16Z
dc.date.issued2025
dc.description.abstractEl estudio desarrolló una metodología integral para la detección de fraudes y anomalías en el consumo de agua potable en Chile, utilizando una base de datos anonimizada con series de consumo mensuales, características metrológicas y localización geográfica de medidores mecánicos. En la detección de fraude sin enfoque de negocio, los modelos supervisados Random Forest (RF) y XGBoost (XGB) mostraron desempeños técnicos similares, con diferencias leves en métricas como el F1-Score. Al incorporar el enfoque de negocio mediante matrices de costos y métricas económicas, las métricas estadísticas se mantuvieron estables, pero el Random Forest resultó con mejor desempeño operativamente, alcanzando una ganancia promedio cercana a 2,31 millones de dólares y un mROI del 64,3%, superior al 59,9% obtenido por XGBoost. En el análisis de anomalías técnicas, los modelos supervisados también se evaluaron, pero el desempeño fue limitado debido a la baja frecuencia de muestreo, mientras que el enfoque no supervisado basado en DBSCAN no logró separar de forma efectiva los casos de interés de fraude y anomalías. Adicional, se empleó la regresión logística para el problema de fraude como modelo base interpretable: permitió identificar el efecto de variables de consumo, clase metrológica, año de instalación y zona geográfica, alcanzó un AUC-ROC de 0,78 y un Brier Score de 0,18, aunque la prueba de Hosmer--Lemeshow (p-value approx 0) indicó un ajuste limitado frente a la complejidad del fenómeno. Por su parte, en el caso de anomalías el modelo de regresión logística no cumplió los supuestos fundamentales de linealidad en el logit ni de adecuación del ajuste, por lo que no resultó apropiado para predecir anomalías y fue descartado como alternativa metodológica en este componente. A su vez, enfoque no supervisado basado en DBSCAN tampoco logró separar de forma efectiva los casos de interés, presentando sensibilidades cercanas a cero para la detección de fraude y utilidad acotada para anomalías. Finalmente, pese a las limitaciones inherentes del muestreo mensual y el desbalance extremo, los resultados obtenidos muestran que es posible construir modelos predictivos útiles para la priorización de inspecciones y el fortalecimiento de estrategias de control de fraude.spa
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Ciencia de Datos
dc.format.extent191 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttp://hdl.handle.net/11522/5282
dc.language.isospa
dc.publisherPontificia Universidad Javeriana Cali
dc.publisher.departmentFacultad de Ingeniería y Ciencias
dc.publisher.programMaestría en Ciencia de Datos
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subjectAnomalíasspa
dc.subjectFraudespa
dc.subjectSostenibilidadspa
dc.subjectAguaspa
dc.subjectMachine learningeng
dc.subjectAnomalieseng
dc.subjectFraudeng
dc.subjectSustainabilityeng
dc.subjectWatereng
dc.titlePredicción de fraudes y anomalías en el suministro de agua potable con técnicas de analítica de datosspa
dc.typemaster thesis
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.localTesis/Trabajo de grado - Monografía - Maestría
dc.type.redcolhttps://purl.org/redcol/resource_type/TM
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
Proyecto de Grado Final - Cristian Fabián Rodríguez Rodríguez,Dany Alexander Enríquez Sánchez,José David Zamudio Rojas.pdf
Size:
3.46 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Licencia de Uso - Cristian Fabián Rodríguez Rodríguez,Dany Alexander Enríquez Sánchez,José David Zamudio Rojas.pdf
Size:
308.49 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: