Desarrollo de un sistema de ecualización automática de audio a partir de un modelo de incrustación de palabras

Abstract
En este trabajo se desarrolla una herramienta de ecualización automática basada en descripciones del sonido mediante el uso de modelos de aprendizaje profundo y procesamiento del lenguaje natural. El objetivo es hacer accesible para cualquiera ecualizaciones de audio que respondan a sus deseos creativos, utilizando modelos de incrustación de palabras como GloVe, Tok2Vec, GPT y BERT, y combinándolos en un modelo de ensamble con una capa de atención.
Description
item.page.descriptioneng
This work develops an automatic equalization tool based on sound descriptions using deep learning models and natural language processing. The goal is to make audio equalization accessible to anyone, allowing them to achieve creative outcomes by using word embedding models such as GloVe, Tok2Vec, GPT, and BERT, and combining them into an ensemble model with an attention layer.
Keywords
Ecualización automática, Aprendizaje profundo, Procesamiento del lenguaje natural, Modelos de incrustación de palabras, Automatic equalization, Deep learning, Natural language processing, Word embedding models
Citation