Implementación de machine learning para la estimación del riesgo de fuga de los clientes en empresa de la industria del retail de moda en Colombia

Loading...
Thumbnail Image
Date
2024
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Javariana Cali
Abstract
El trabajo de grado presentado, titulado "Implementación de Machine Learning para la Estimación del Riesgo de Fuga de los Clientes en una Marca de una Empresa de la Industria del Retail de Moda en Colombia", tiene como objetivo principal desarrollar una herramienta predictiva que permita identificar los clientes con mayor probabilidad de abandonar la marca. Esto se busca lograr mediante la aplicación de técnicas de machine learning que analicen el comportamiento de los clientes, sus hábitos de compra y las interacciones con la empresa. El problema central identificado es que la empresa del caso de estudio, Chevignon, sufre una pérdida significativa de clientes cada año, lo que afecta tanto los ingresos como la percepción de marca. En respuesta a esta problemática, se propuso utilizar datos históricos y técnicas de aprendizaje automático para predecir el riesgo de abandono y así mejorar las estrategias de retención.El modelo de predicción desarrollado emplea varios algoritmos, entre ellos XGBoost, Random Forest, Support Vector Machines (SVM) y redes neuronales artificiales (ANN). Los resultados muestran que el modelo XGBoost obtuvo el mejor desempeño con una precisión del 86.18% y una sensibilidad del 88.35%, lo que lo convierte en la herramienta más adecuada para predecir la fuga de clientes. La capacidad de predecir el abandono permitió a la empresa implementar acciones proactivas, como ofertas personalizadas y programas de fidelización, lo que ayudará a reducir la pérdida de clientes. El trabajo también enfatiza la importancia de la limpieza y la preparación de los datos, destacando la necesidad de eliminar variables altamente correlacionadas que podrían afectar la precisión del modelo. A lo largo del proceso, se evaluó la importancia de las variables en el modelo, identificándose que factores como la permanencia del cliente y el tiempo en la marca son determinantes en la predicción del abandono. En cuanto a trabajos futuros, se sugiere continuar optimizando los modelos mediante la incorporación de nuevas variables, el ajuste de hiperparámetros y la experimentación con otros algoritmos, como redes neuronales profundas o técnicas de ensamblado de modelos. También se propone investigar la posibilidad de implementar el modelo en tiempo real y personalizar las estrategias de retención en función del perfil y comportamiento de los clientes. En conclusión, este trabajo ofrece una herramienta valiosa para la marca, que, al predecir el riesgo de abandono, permitirá a la empresa tomar decisiones más informadas y estratégicas para mejorar la retención de clientes, reduciendo costos asociados y aumentando la competitividad en un mercado en constante cambio.
Description
item.page.descriptioneng
The degree project presented, entitled "Implementation of Machine Learning for the Estimation of the Risk of Customer Flight in a Brand of a Company in the Fashion Retail Industry in Colombia", has as its main objective to develop a predictive tool that allows identifying the customers with a greater probability of abandoning the brand. This is sought to be achieved through the application of machine learning techniques that analyze customer behavior, their purchasing habits and interactions with the company. The central problem identified is that the case study company, Chevignon, suffers a significant loss of customers each year, which affects both revenue and brand perception. In response to this problem, it was proposed to use historical data and machine learning techniques to predict the risk of churn and thus improve retention strategies. The prediction model developed uses several algorithms, including XGBoost, Random Forest, Support Vector Machines (SVM) and artificial neural networks (ANN). The results show that the XGBoost model obtained the best performance with an accuracy of 86.18%. and a sensitivity of 88.35%, which makes it the most appropriate tool to predict customer churn. The ability to predict churn allowed the company to implement proactive actions, such as personalized offers and loyalty programs, which will help reduce customer churn. The work also emphasizes the importance of data cleaning and preparation, highlighting the need to eliminate highly correlated variables that could affect the accuracy of the model. Throughout the process, the importance of the variables in the model was evaluated, identifying that factors such as customer permanence and time in the brand are determinants in predicting abandonment. As for future work, it is suggested to continue optimizing the models by incorporating new variables, adjusting hyperparameters and experimenting with other algorithms, such as deep neural networks or model assembly techniques. It is also proposed to investigate the possibility of implementing the model in real time and personalizing retention strategies based on the profile and behavior of customers. In conclusion, this work offers a valuable tool for the brand, which, by predicting the risk of churn, will allow the company to make more informed and strategic decisions to improve customer retention, reducing associated costs and increasing competitiveness in a constantly changing market.
Keywords
Abandono, Clientes, Retención, Moda, Recuperación, Churn, Machine Learning, Retail, Data Science, Recovery
Citation