García Cifuentes, Juan PabloGil González, JuliánCollantes Zuluaga, Santiago2024-08-222024-08-222024https://vitela.javerianacali.edu.co/handle/11522/3879Este proyecto presenta el desarrollo de un modelo de aprendizaje automático para la asignación automática de códigos de productos en la Bolsa Mercantil de Colombia (BMC) a partir de descripciones proporcionadas por sus Sociedades Comisionistas (SC). Utilizando técnicas avanzadas de procesamiento de lenguaje natural (NLP) y aprendizaje profundo, se busca mejorar la precisión y eficiencia del proceso actual de asignación manual. Las técnicas implementadas incluyen word embeddings con Word2Vec, modelos preentrenados de spaCy, la combinación de métricas de similitud como Jaccard y coseno, y redes siamesas (SBERT) para la comparación semántica de oraciones. A lo largo del proyecto, se identificaron varias limitaciones en el corpus de datos, como la variabilidad y calidad de las descripciones, errores ortográficos y léxicos, y la falta de metadatos adicionales. Los resultados mostraron que los modelos preentrenados y las redes siamesas proporcionaron mejoras significativas en la precisión de la asignación en comparación con los modelos entrenados únicamente con nuestro corpus. La combinación de métricas de similitud también demostró ser efectiva para mejorar el alineamiento de descripciones. El estudio concluye que la integración de datos adicionales y el ajuste fino continuo de los modelos pueden llevar a mejoras adicionales en la precisión y eficiencia de este proyecto.106 p.application/pdfspaAprendizaje automáticoProcesamiento de lenguaje naturalRedes siamesasBolsa mercantil de ColombiaAsignación de códigos de productosMachine learningNatural language processingSiamese networksSBERTColombian mercantile exchangeProduct code assignmentDesarrollo de un modelo de aprendizaje automático para la asignación de códigos de producto por sociedades comisionistas de la bolsa mercantil de Colombia a partir de descripciones de productos en supermercadoshttp://purl.org/coar/resource_type/c_7a1fhttps://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2