Sistema de generación automática de resúmenes académicos: una aplicación de aprendizaje automático

dc.contributor.advisorLinares Ospina, Diego Luis
dc.contributor.authorTabares Pérez, Cristian Camilo
dc.contributor.authorFernández Aristizábal, Juan José
dc.date.accessioned2025-02-17T17:29:26Z
dc.date.available2025-02-17T17:29:26Z
dc.date.issued2025
dc.description.abstractEste proyecto de investigación se centró en el desarrollo de un sistema de generación automática de resúmenes académicos basado en técnicas de aprendizaje automático, con el objetivo de evaluar su capacidad para sintetizar información de textos extensos en el ámbito académico. El problema central radicaba en diseñar un modelo que pudiera capturar y condensar las ideas principales de los documentos. Nuestro enfoque implicó la implementación y comparación de varios métodos, incluyendo modelos extractivos como Luhn y K-Means, y el modelo abstractivo Seq2Seq. Las fases iniciales del desarrollo estuvieron enfocadas en el preprocesamiento de datos provenientes de artículos académicos de arXiv, así como en la exploración de configuraciones preliminares para identificar técnicas y parámetros adecuados.Los experimentos exploraron combinaciones específicas de hiperparámetros, como el tamaño del batch, la cantidad de épocas y las dimensiones de los embeddings, cada una ajustando variables como EPOCHS, BATCH_SIZE y LATENT_DIM. Además, los modelos se evaluaron empleando métricas ROUGE, que miden precisión, recuperación y F1-Score para validar la calidad de los resúmenes generados, y BERTScore, que utiliza representaciones semánticas para evaluar la similitud entre los resúmenes generados y las referencias.En conclusión sistemas de generación de resúmenes, subrayando la importancia de un diseño sistemático y la posibilidad de futuras optimizaciones para mejorar su rendimiento en contextos académicos
dc.description.abstractengThis research project focused on the development of an automatic academic abstract generation system based on machine learning techniques, with the aim of evaluating its ability to synthesize information from long academic texts. The central problem was to design a model that could capture and condense the main ideas of the papers. Our approach involved the implementation and comparison of several methods, including extractive models such as Luhn and K-Means, and the abstractive model Seq2Seq. The initial phases of development focused on preprocessing data from academic papers on arXiv, as well as exploring preliminary configurations to identify suitable techniques and parameters. The experiments explored specific combinations of hyperparameters, such as batch size, number of epochs, and embedding dimensions, each by tuning variables such as EPOCHS, BATCH_SIZE, and LATENT_DIM. In addition, the models were evaluated using ROUGE metrics, which measure precision, recall and F1-Score to validate the quality of the generated summaries, and BERTScore, which uses semantic representations to assess the similarity between the generated summaries and the references.In conclusion, the models were evaluated using summary generation systems, highlighting the importance of a systematic design and the possibility of future optimizations to improve their performance in academic contexts.
dc.format.extent77 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttp://hdl.handle.net/11522/4466
dc.language.isospa
dc.publisherPontificia Universidad Javariana Cali
dc.publisher.facultyFacultad de Ingeniería y Ciencias
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectResumen de textos
dc.subjectAprendizaje automático
dc.subjectEnfoque Extractivo
dc.subjectAprendizaje profundo
dc.subjectEnfoque Abstractivo
dc.subjectText Summarization
dc.subjectMachine Learning Extractive Approach
dc.subjectDeep Learning
dc.subjectEnfoque
dc.subjectAbstractive Approac
dc.thesis.disciplineFacultad de Ingeniería y Ciencias. Ingeniería de Sistemas y Computación
dc.thesis.grantorPontificia Universidad Javeriana Cali
dc.thesis.levelPregrado
dc.thesis.nameIngeniero(a)de Sistemas y Computación
dc.titleSistema de generación automática de resúmenes académicos: una aplicación de aprendizaje automáticospa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dc.type.redcolhttps://purl.org/redcol/resource_type/TP
Files
Original bundle
Now showing 1 - 2 of 2
No Thumbnail Available
Name:
Sistema_generacion_resumenes.pdf
Size:
2.1 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Licencia_Autorizacion.pdf
Size:
233.28 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: