Identificación automática de patologías en la voz a partir de técnicas de aprendizaje automático

Acosta López, Juan Esteban; Palacio Lozano, Carlos Felipe

Identificación automática de patologías en la voz a partir de técnicas de aprendizaje automático

dc.contributor.advisor	Gil González, Julián
dc.contributor.author	Acosta López, Juan Esteban
dc.contributor.author	Palacio Lozano, Carlos Felipe
dc.date.accessioned	2025-02-14T17:44:39Z
dc.date.available	2025-02-14T17:44:39Z
dc.date.issued	2024
dc.description.abstract	El proyecto de investigación profundizó en el desarrollo de múltiples modelos de aprendizaje automático, estableciendo una comparativa entre las técnicas clásicas de aprendizaje y las cada vez más emergentes técnicas de aprendizaje profundo, llevando a cabo una tarea de clasificación en el ámbito de la salud. El problema central de esta investigación consistió en determinar de manera precisa si un modelo de aprendizaje automático podía identificar la presencia de patologías en la voz. El enfoque adoptado para ambas técnicas de aprendizaje fue diferenciado, permitiendo a los modelos de cada técnica centrarse en distintas aproximaciones para resolver el mismo problema. Varias tareas realizadas previamente al desarrollo de los modelos contribuyeron a mejorar sus resultados, demostrando cómo, mediante ciertas estrategias, se pueden superar limitaciones como la cantidad de datos disponibles, logrando así un mejor desempeño. Finalmente, al completar los experimentos, se desarrolló una interfaz gráfica que permite interactuar con dos de los modelos creados, destacando los mejores resultados obtenidos en cada una de las técnicas de aprendizaje seleccionadas. Los resultados finales resaltan cómo el aprendizaje automático desempeña un papel diferencial en tareas complejas para los seres humanos, ya sea por su naturaleza imperceptible o por la necesidad de analizar grandes volúmenes de datos para generar resultados en tiempo real. En conclusión, esta investigación evidencia el potencial del aprendizaje automático en la detección de patologías en la voz, logrando resultados precisos a pesar de contar con una cantidad limitada de datos en comparación con otros problemas. Además, abre el camino para futuros refinamientos y estudios clínicos que incluyan los modelos en entornos reales, permitiendo obtener una retroalimentación no observable en las etapas de desarrollo.
dc.description.abstracteng	The research project delved into the development of multiple machine learning models, establishing a comparison between classical learning techniques and the increasingly emerging deep learning techniques, carrying out a classification task in the health field. The central problem of this research was to accurately determine whether a machine learning model could identify the presence of pathologies in the voice. The approach adopted for both learning techniques was differentiated, allowing the models of each technique to focus on different approaches to solve the same problem. Several tasks performed prior to the development of the models contributed to improving their results, demonstrating how, through certain strategies, limitations such as the amount of available data can be overcome, thus achieving better performance. Finally, upon completion of the experiments, a graphical interface was developed that allows interaction with two of the created models, highlighting the best results obtained in each of the selected learning techniques. The final results highlight how machine learning plays a differential role in tasks that are complex for humans, either due to their imperceptible nature or the need to analyze large volumes of data to generate results in real time. In conclusion, this research demonstrates the potential of machine learning in the detection of voice pathologies, achieving accurate results despite having a limited amount of data compared to other problems. In addition, it paves the way for future refinements and clinical studies that include the models in real environments, allowing for unobservable feedback in the development stages.
dc.format.extent	70 p.
dc.format.mimetype	application/pdf
dc.identifier.uri	http://hdl.handle.net/11522/4457
dc.language.iso	spa
dc.publisher	Pontificia Universidad Javariana Cali
dc.publisher.faculty	Facultad de Ingeniería y Ciencias
dc.rights.accessrights	http://purl.org/coar/access_right/c_abf2
dc.rights.creativecommons	https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.uri	https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject	Aprendizaje profundo
dc.subject	Aprendizaje clásico
dc.subject	Red neuronal
dc.subject	Patologías
dc.subject	Voz
dc.subject	Deep learning
dc.subject	Classic techniques
dc.subject	Neural network
dc.subject	Patology
dc.subject	Voice
dc.thesis.discipline	Facultad de Ingeniería y Ciencias. Ingeniería de Sistemas y Computación
dc.thesis.grantor	Pontificia Universidad Javeriana Cali
dc.thesis.level	Pregrado
dc.thesis.name	Ingeniero(a)de Sistemas y Computación
dc.title	Identificación automática de patologías en la voz a partir de técnicas de aprendizaje automático	spa
dc.type.coar	http://purl.org/coar/resource_type/c_7a1f
dc.type.local	Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.redcol	https://purl.org/redcol/resource_type/TP