Implementación de un modelo de machine learning para predecir el cumplimiento de contratos de café nacionales en racafé”

Loading...
Thumbnail Image
Date
2024
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Javariana Cali
Abstract
El proyecto presentado nace en Racafé, una empresa con 70 años de trayectoria en la industria del café, un sector de gran orgullo y tradición en Colombia. La compañía enfrenta el desafío de gestionar los pagos de contratos de café, donde, aunque eventualmente se cumplen, los incumplimientos frecuentes afectan negativamente el flujo de caja, incluso con los mecanismos establecidos para mitigarlos. Actualmente, Racafé gestiona manualmente la identificación de clientes incumplidores, lo que implica procesos de seguimiento y control manuales. A partir de un conjunto de datos con 37 variables sobre las características y el comportamiento de pago de los clientes, se realizó un análisis exploratorio y se aplicaron técnicas de clusterización y un análisis de GVIF, lo que permitió reducir las variables relevantes a 11. Con este conjunto, se evaluaron tres modelos de machine learning supervisado: Regresión Logística, Random Forest y Support Vector Machine. Los modelos fueron optimizados ajustando hiperparámetros y se compararon mediante métricas como accuracy, recall, especificidad, F1-Score y AUC, utilizando validación cruzada para garantizar la robustez de los resultados. El modelo Random Forest mostró el mejor rendimiento, destacándose por su alta especificidad (0.836) y AUC (0.906). Este modelo fue implementado en un dashboard interactivo que predice si un cliente cumplirá o no con su contrato de café, clasificando como "No Cumple" si la probabilidad de incumplimiento es mayor o igual a 0.5. La herramienta automatiza procesos y facilita la toma de decisiones de la Gerencia Financiera y Comercial, optimizando la gestión de pagos y la identificación de períodos críticos de recuperación de cartera. Los resultados obtenidos modernizan la gestión de Racafé, optimizan la administración del flujo de caja y fortalecen la relación con los clientes nacionales. Esta iniciativa posiciona a Racafé como un referente en el uso de ciencia de datos para la toma de decisiones estratégicas, contribuyendo a la sostenibilidad y modernización la industria cafetera.
Description
item.page.descriptioneng
The project presented was born in Racafé, a company with 70 years of experience in the coffee industry, a sector of great pride and tradition in Colombia. The company faces the challenge of managing coffee contract payments, where, although they are eventually met, frequent defaults negatively affect cash flow, even with mechanisms in place to mitigate them. Currently, Racafé manually manages the identification of non-compliant customers, which involves manual monitoring and control processes. Based on a data set with 37 variables on the characteristics and payment behavior of customers, an exploratory analysis was carried out and clustering techniques and a GVIF analysis were applied, which allowed the relevant variables to be reduced to 11. With this set, three supervised machine learning models were evaluated: Logistic Regression, Random Forest and Support Vector Machine. The models were optimized by adjusting hyperparameters and were compared using metrics such as accuracy, recall, specificity, F1-Score and AUC, using cross-validation to guarantee the robustness of the results. The Random Forest model showed the best performance, standing out for its high specificity (0.836) and AUC (0.906). This model was implemented in an interactive dashboard that predicts whether or not a customer will comply with their coffee contract, classifying as "Not Compliant" if the probability of non-compliance is greater than or equal to 0.5. The tool automates processes and facilitates decision-making by Financial and Commercial Management, optimizing payment management and identifying critical portfolio recovery periods. The results obtained modernize Racafé's management, optimize cash flow administration and strengthen the relationship with national clients. This initiative positions Racafé as a benchmark in the use of data science for strategic decision making, contributing to the sustainability and modernization of the coffee industry.
Keywords
Industria Cafetera, Machine Learning, Gestión Financiera, Gestión de Pagos, Predicción, Coffee Industry, Financial Management, Payment Management, Prediction
Citation