Maestría en Ingeniería
Permanent URI for this collection
Browse
Browsing Maestría en Ingeniería by Subject "Aprendizaje automático"
Now showing 1 - 5 of 5
Results Per Page
Sort Options
Item De-duplication for product master data records using machine learning techniques(Pontificia Universidad Javeriana Cali, 2021) Hallo Larrea, Julio Xavier; Álvarez Vargas, Gloria InésCon la transformación digital de las organizaciones, específicamente en grandes empresas como plataformas de comercio electrónico y marketplaces, los datos de productos han crecido exponencialmente para alcanzar los objetivos y necesidades comerciales. Para respaldar esto, tanto los profesionales como los académicos han reconocido la importancia de los datos maestros como recurso fundamental de la organización, y a su vez han identificado que la administración de datos maestros es un proceso independiente de la aplicación que lo describe, posee y administra. Con el fin de medir si este recurso es "apto para el uso", se han desarrollado metodologías, técnicas y artefactos de calidad de datos, definiendo los cuatro KPI clave: "completitud, exactitud, unicidad y oportunidad". Actualmente, las plataformas de software MDM proporcionan medios para lograr la medición y gestión correctas de los KPI descritos anteriormente. Por lo tanto, en el proceso de gestión, la interacción humana siempre es necesaria, específicamente cuando los algoritmos de deduplicación actuales deben ajustarse en función de los datos etiquetados que muestran si dos o más entidades son o no duplicados. Esta investigación aborda este problema específico utilizando técnicas de aprendizaje automático, en las cuales diseñamos, construimos y probamos un modelo que de-duplica los registros de datos maestros de productos dentro de un corpus de datos de productos públicos. Como resultado de la investigación, se han propuesto cinco (5) modelos de de-duplicación. Los modelos utilizan dos (2) tipos diferentes en arquitecturas de redes neuronales, Perceptrón Multicapa y LSTM, con dos (2) técnicas de pre-procesamiento de datos diferentes. Luego, todos los modelos han sido entrenados y probados utilizando los registros de pares de datos maestros de producto del corpus de datos seleccionado como parte de los objetivos de la investigación. Para evaluar el desempeño de cada modelo se han propuesto KPI's cuantitativos como F1 Score, entre otros, y KPI's cualitativos para clasificar la eficiencia de cada uno. Asimismo, se ha propuesto un árbol de decisión para seleccionar el modelo más adecuado según los objetivos de negocio y los recursos disponibles. Por último, se presentan las conclusiones y posible ampliación de la propuesta de investigación.Item Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático(Pontificia Universidad Javeriana Cali, 2022) Abadía Sarria, Sara; Pabón, María Constanza; Martínez Arias, Juan CarlosLa definición de los requisitos del lenguaje natural es un proceso que puede llevar mucho tiempo en grandes proyectos de software. Clasificar los requisitos de software de lenguaje natural en funcionales y no funcionales, y al mismo tiempo categorías de no funcionales como rendimiento, compatibilidad, usabilidad, confiabilidad, seguridad, mantenibilidad y portabilidad, es una tarea que contribuye a la definición de requisitos para que proyectos de software sean exitosos. Esta tarea de clasificación requiere el juicio de un experto y requiere mucho tiempo, siendo un desafío porque es un proceso manual. La automatización de la clasificación de requisitos es una estrategia para agilizar las actividades de los ingenieros de requisitos. Estudios relacionados muestran la existencia de escasos conjuntos de datos de requisitos de software, lo que dificulta promover, crear y mejorar modelos predictivos que faciliten las tareas de clasificación automática de requisitos, además, estos escasos conjuntos de datos en la mayoría de ellos están definidos en inglés, por lo tanto, los modelos predictivos desarrollados no se pueden utilizar directamente para proyectos en diferentes idiomas porque la gramática varía con el idioma. En vista de lo anterior, este trabajo se enfoca en generar modelos predictivos de clasificación de requisitos de software de lenguaje natural en funcionales y no funcionales, y al mismo tiempo las categorías de no funcionales de acuerdo con el estándar ISO/IEC 25010, para contribuir al desarrollo de estudios que apliquen técnicas de aprendizaje automático en el contexto de la ingeniería de requisitos para proyectos desarrollados en español. Los resultados muestran un indicador F1 superior al 60% para la mayoría de los experimentos en donde se utilizó el aumento artificial de información. El estudio se realizó con una muestra de más de 2800 requisitos de software descritos en español que previamente fueron traducidos y consolidados a partir de varios conjuntos de datos en inglés ampliamente utilizados en otras investigaciones, de los cuales 1887 requisitos fueron etiquetados manualmente. La traducción al español se realizó a través de la herramienta de traducción automática de Google y posteriormente, la traducción se verificó manualmente. Este conjunto de datos en español estará disponible para la comunidad científica.Item Modelo para la planeación agregada de la producción en la Industria Licorera del Cauca utilizando técnicas de machine learning para el pronóstico de la demanda(Pontificia Universidad Javeriana Cali, 2023) Arciniegas Sánchez, Nora Fernanda; Mendoza Chacón, Jaime Humberto; Segura Mosquera, Juan ManuelEl análisis de la planeación de la demanda es un proceso crítico para las organizaciones, debido a su alta complejidad y cuyo propósito es distribuir de manera óptima los recursos a lo largo de la cadena de suministro. Durante muchos años se han desarrollado y evolucionado diferentes métodos que permiten a las organizaciones lograr optimizar sus procesos, sin embargo, algunos no responden totalmente a los requerimientos dadas las particularidades de las organizaciones, además, de los constantes cambios a nivel tecnológico, hace necesario que las organizaciones adapten rápidamente sus procesos para responder a dichos cambios y generar ventajas competitivas frente a sus competidores. Dicho lo anterior, la Industria Licorera del Cauca ha buscado generar iniciativas que permitan la optimización de sus recursos, el crecimiento y la expansión a nuevos mercados, es por ello, que el equipo de producción realizó un análisis de la definición del negocio de la Industria Licorera del Cauca, en donde se determinó la necesidad de realizar una óptima gestión de la cadena de suministro, enfocándose en la planeación efectiva de la demanda, impactando significativamente en los procesos de la cadena. Este proyecto, inició con la caracterización de los procesos de preparación y envasado de aguardiente a través del diseño del VSM (Value Stream Map) y un análisis causal el impacto de los cuellos de botella en el proceso de producción, adicionalmente, se realizó un análisis de la capacidad para cada uno de los procesos para analizar su estabilidad con relación a los requisitos y características de las actividad y producto, así mismo, la generación de valor para el cliente; se efectuó un análisis exploratorio de la información de la demanda para cada una de las presentaciones de aguardiente tradicional y sin azúcar, lo que permitió establecer los métodos para el preprocesamiento de la información y selección de variables para la predicción, se seleccionaron 11 modelos tradicionales, econométricos y machine learning en donde se determinó que la aplicación de modelos basados en la familia del ARIMA, árboles decisión y redes neuronales, estos se adaptan a los patrones de demanda de cada uno de los productos de la Industria Licorera del Cauca.Item Predicción del riesgo de abandono de un asociado para una cooperativa multiactiva de Santiago de Cali, mediante técnicas de aprendizaje automático(Pontificia Universidad Javeriana Cali, 2022) Males, Victor Hugo; Álvarez Vargas, Gloria InésPredecir la tasa de abandono (churn rate) o riesgo de abandono de los clientes, es importante para las empresas y más para la cooperativa multiactiva objeto de estudio, debido a que es importante mantener activa la base social de asociados a la cooperativa. En este marco, el presente trabajo se enfoca en la implementación de técnicas de aprendizaje automático a un conjunto de variables cuantitativas y cualitativas y realizar un despliegue de una visualización con la mejor técnica de aprendizaje automático entrenada, que permita a las áreas comerciales de vinculación y retención tomar mejores decisiones en la implementación de sus estrategias para la reducción del riesgo de abandono. Con esto, la visualización realiza funcionalidades de exploración de análisis de datos, predicción de una lista de usuarios y según las variables que riesgo puede tener un asociado de no continuar en la cooperativa.Item Recomendación personalizada de paquetes turísticos mediante aprendizaje automático con integración de datos demográficos, históricos y de preferencias(Pontificia Universidad Javeriana Cali, 2025) Alvear Arteaga, Juan Sebastián; Paz Roa, Juan CamiloActualmente la personalización de servicios es un elemento de gran diferencia competitiva. Servicios de trasmisión de videos, música y redes sociales logran dicha personalización mediante modelos de recomendación que dejan al alcance del usuario productos de su mayor preferencia. Este exitoso esquema también es susceptible de ser aplicado en la industria turística, donde el uso de modelos de recomendación es escaso. Es así como los modelos de aprendizaje automático e inteligencia artificial inherentes a los modelos de recomendación se han convertido en una oportunidad estratégica para agencias de viajes que buscan aumentar la satisfacción del cliente y las ventas de sus planes ofrecidos. Este estudio propone un modelo de recomendación de paquetes turísticos que toma como entrada 17 variables con información del cliente con características demográficas, históricas y cruces de preferencias entre el cliente y los paquetes turísticos. Este primer prototipo es basado en un modelo de random forest que predice la calificación esperada de viaje a partir de estas variables. La metodología para entrenar el modelo incluyó la comparación de modelos de regresión lineal, Lasso, árbol de decisión y random forest, evaluados con métricas de error cuadrático medio (MSE), raíz del error cuadrático medio (RMSE) y error porcentual absoluto medio (MAPE). Los resultados muestran que el modelo Random Forest obtuvo el menor error (RMSE = 0.3361, MSE = 0.1130 y MAPE = 6.01), siendo seleccionado gracias a su balance entre precisión y robustez. Este trabajo confirma la viabilidad del uso de técnicas de aprendizaje automático para lograr la personalización de recomendaciones turísticas.