Identificación automática de patologías en la voz a partir de técnicas de aprendizaje automático
Loading...
Date
2024
Director
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Javariana Cali
Abstract
El proyecto de investigación profundizó en el desarrollo de múltiples modelos de aprendizaje automático, estableciendo una comparativa entre las técnicas clásicas de aprendizaje y las cada vez más emergentes técnicas de aprendizaje profundo, llevando a cabo una tarea de clasificación en el ámbito de la salud. El problema central de esta investigación consistió en determinar de manera precisa si un modelo de aprendizaje automático podía identificar la presencia de patologías en la voz. El enfoque adoptado para ambas técnicas de aprendizaje fue diferenciado, permitiendo a los modelos de cada técnica centrarse en distintas aproximaciones para resolver el mismo problema. Varias tareas realizadas previamente al desarrollo de los modelos contribuyeron a mejorar sus resultados, demostrando cómo, mediante ciertas estrategias, se pueden superar limitaciones como la cantidad de datos disponibles, logrando así un mejor desempeño. Finalmente, al completar los experimentos, se desarrolló una interfaz gráfica que permite interactuar con dos de los modelos creados, destacando los mejores resultados obtenidos en cada una de las técnicas de aprendizaje seleccionadas. Los resultados finales resaltan cómo el aprendizaje automático desempeña un papel diferencial en tareas complejas para los seres humanos, ya sea por su naturaleza imperceptible o por la necesidad de analizar grandes volúmenes de datos para generar resultados en tiempo real. En conclusión, esta investigación evidencia el potencial del aprendizaje automático en la detección de patologías en la voz, logrando resultados precisos a pesar de contar con una cantidad limitada de datos en comparación con otros problemas. Además, abre el camino para futuros refinamientos y estudios clínicos que incluyan los modelos en entornos reales, permitiendo obtener una retroalimentación no observable en las etapas de desarrollo.
Description
item.page.descriptioneng
The research project delved into the development of multiple machine learning models, establishing a comparison between classical learning techniques and the increasingly emerging deep learning techniques, carrying out a classification task in the health field. The central problem of this research was to accurately determine whether a machine learning model could identify the presence of pathologies in the voice. The approach adopted for both learning techniques was differentiated, allowing the models of each technique to focus on different approaches to solve the same problem. Several tasks performed prior to the development of the models contributed to improving their results, demonstrating how, through certain strategies, limitations such as the amount of available data can be overcome, thus achieving better performance. Finally, upon completion of the experiments, a graphical interface was developed that allows interaction with two of the created models, highlighting the best results obtained in each of the selected learning techniques. The final results highlight how machine learning plays a differential role in tasks that are complex for humans, either due to their imperceptible nature or the need to analyze large volumes of data to generate results in real time. In conclusion, this research demonstrates the potential of machine learning in the detection of voice pathologies, achieving accurate results despite having a limited amount of data compared to other problems. In addition, it paves the way for future refinements and clinical studies that include the models in real environments, allowing for unobservable feedback in the development stages.
Keywords
Aprendizaje profundo, Aprendizaje clásico, Red neuronal, Patologías, Voz, Deep learning, Classic techniques, Neural network, Patology, Voice