Maestría en Ingeniería
Permanent URI for this collection
Browse
Browsing Maestría en Ingeniería by Author "Álvarez Vargas, Gloria Inés"
Now showing 1 - 2 of 2
Results Per Page
Sort Options
Item De-duplication for product master data records using machine learning techniques(Pontificia Universidad Javeriana Cali, 2021) Hallo Larrea, Julio Xavier; Álvarez Vargas, Gloria InésCon la transformación digital de las organizaciones, específicamente en grandes empresas como plataformas de comercio electrónico y marketplaces, los datos de productos han crecido exponencialmente para alcanzar los objetivos y necesidades comerciales. Para respaldar esto, tanto los profesionales como los académicos han reconocido la importancia de los datos maestros como recurso fundamental de la organización, y a su vez han identificado que la administración de datos maestros es un proceso independiente de la aplicación que lo describe, posee y administra. Con el fin de medir si este recurso es "apto para el uso", se han desarrollado metodologías, técnicas y artefactos de calidad de datos, definiendo los cuatro KPI clave: "completitud, exactitud, unicidad y oportunidad". Actualmente, las plataformas de software MDM proporcionan medios para lograr la medición y gestión correctas de los KPI descritos anteriormente. Por lo tanto, en el proceso de gestión, la interacción humana siempre es necesaria, específicamente cuando los algoritmos de deduplicación actuales deben ajustarse en función de los datos etiquetados que muestran si dos o más entidades son o no duplicados. Esta investigación aborda este problema específico utilizando técnicas de aprendizaje automático, en las cuales diseñamos, construimos y probamos un modelo que de-duplica los registros de datos maestros de productos dentro de un corpus de datos de productos públicos. Como resultado de la investigación, se han propuesto cinco (5) modelos de de-duplicación. Los modelos utilizan dos (2) tipos diferentes en arquitecturas de redes neuronales, Perceptrón Multicapa y LSTM, con dos (2) técnicas de pre-procesamiento de datos diferentes. Luego, todos los modelos han sido entrenados y probados utilizando los registros de pares de datos maestros de producto del corpus de datos seleccionado como parte de los objetivos de la investigación. Para evaluar el desempeño de cada modelo se han propuesto KPI's cuantitativos como F1 Score, entre otros, y KPI's cualitativos para clasificar la eficiencia de cada uno. Asimismo, se ha propuesto un árbol de decisión para seleccionar el modelo más adecuado según los objetivos de negocio y los recursos disponibles. Por último, se presentan las conclusiones y posible ampliación de la propuesta de investigación.Item Predicción del riesgo de abandono de un asociado para una cooperativa multiactiva de Santiago de Cali, mediante técnicas de aprendizaje automático(Pontificia Universidad Javeriana Cali, 2022) Males, Victor Hugo; Álvarez Vargas, Gloria InésPredecir la tasa de abandono (churn rate) o riesgo de abandono de los clientes, es importante para las empresas y más para la cooperativa multiactiva objeto de estudio, debido a que es importante mantener activa la base social de asociados a la cooperativa. En este marco, el presente trabajo se enfoca en la implementación de técnicas de aprendizaje automático a un conjunto de variables cuantitativas y cualitativas y realizar un despliegue de una visualización con la mejor técnica de aprendizaje automático entrenada, que permita a las áreas comerciales de vinculación y retención tomar mejores decisiones en la implementación de sus estrategias para la reducción del riesgo de abandono. Con esto, la visualización realiza funcionalidades de exploración de análisis de datos, predicción de una lista de usuarios y según las variables que riesgo puede tener un asociado de no continuar en la cooperativa.