Identificación automática de patologías en la voz a partir de técnicas de aprendizaje automático

dc.contributor.advisorGil González, Julián
dc.contributor.authorAcosta López, Juan Esteban
dc.contributor.authorPalacio Lozano, Carlos Felipe
dc.date.accessioned2025-02-14T17:44:39Z
dc.date.available2025-02-14T17:44:39Z
dc.date.issued2024
dc.description.abstractEl proyecto de investigación profundizó en el desarrollo de múltiples modelos de aprendizaje automático, estableciendo una comparativa entre las técnicas clásicas de aprendizaje y las cada vez más emergentes técnicas de aprendizaje profundo, llevando a cabo una tarea de clasificación en el ámbito de la salud. El problema central de esta investigación consistió en determinar de manera precisa si un modelo de aprendizaje automático podía identificar la presencia de patologías en la voz. El enfoque adoptado para ambas técnicas de aprendizaje fue diferenciado, permitiendo a los modelos de cada técnica centrarse en distintas aproximaciones para resolver el mismo problema. Varias tareas realizadas previamente al desarrollo de los modelos contribuyeron a mejorar sus resultados, demostrando cómo, mediante ciertas estrategias, se pueden superar limitaciones como la cantidad de datos disponibles, logrando así un mejor desempeño. Finalmente, al completar los experimentos, se desarrolló una interfaz gráfica que permite interactuar con dos de los modelos creados, destacando los mejores resultados obtenidos en cada una de las técnicas de aprendizaje seleccionadas. Los resultados finales resaltan cómo el aprendizaje automático desempeña un papel diferencial en tareas complejas para los seres humanos, ya sea por su naturaleza imperceptible o por la necesidad de analizar grandes volúmenes de datos para generar resultados en tiempo real. En conclusión, esta investigación evidencia el potencial del aprendizaje automático en la detección de patologías en la voz, logrando resultados precisos a pesar de contar con una cantidad limitada de datos en comparación con otros problemas. Además, abre el camino para futuros refinamientos y estudios clínicos que incluyan los modelos en entornos reales, permitiendo obtener una retroalimentación no observable en las etapas de desarrollo.
dc.description.abstractengThe research project delved into the development of multiple machine learning models, establishing a comparison between classical learning techniques and the increasingly emerging deep learning techniques, carrying out a classification task in the health field. The central problem of this research was to accurately determine whether a machine learning model could identify the presence of pathologies in the voice. The approach adopted for both learning techniques was differentiated, allowing the models of each technique to focus on different approaches to solve the same problem. Several tasks performed prior to the development of the models contributed to improving their results, demonstrating how, through certain strategies, limitations such as the amount of available data can be overcome, thus achieving better performance. Finally, upon completion of the experiments, a graphical interface was developed that allows interaction with two of the created models, highlighting the best results obtained in each of the selected learning techniques. The final results highlight how machine learning plays a differential role in tasks that are complex for humans, either due to their imperceptible nature or the need to analyze large volumes of data to generate results in real time. In conclusion, this research demonstrates the potential of machine learning in the detection of voice pathologies, achieving accurate results despite having a limited amount of data compared to other problems. In addition, it paves the way for future refinements and clinical studies that include the models in real environments, allowing for unobservable feedback in the development stages.
dc.format.extent70 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttp://hdl.handle.net/11522/4457
dc.language.isospa
dc.publisherPontificia Universidad Javariana Cali
dc.publisher.facultyFacultad de Ingeniería y Ciencias
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectAprendizaje profundo
dc.subjectAprendizaje clásico
dc.subjectRed neuronal
dc.subjectPatologías
dc.subjectVoz
dc.subjectDeep learning
dc.subjectClassic techniques
dc.subjectNeural network
dc.subjectPatology
dc.subjectVoice
dc.thesis.disciplineFacultad de Ingeniería y Ciencias. Ingeniería de Sistemas y Computación
dc.thesis.grantorPontificia Universidad Javeriana Cali
dc.thesis.levelPregrado
dc.thesis.nameIngeniero(a)de Sistemas y Computación
dc.titleIdentificación automática de patologías en la voz a partir de técnicas de aprendizaje automáticospa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dc.type.redcolhttps://purl.org/redcol/resource_type/TP
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
TG-Identificacion_Patologias_Voz.pdf
Size:
2.19 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Licencia_autorizacion (6).pdf
Size:
131.93 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: