Generación automática de resúmenes de documentos financieros usando técnicas basadas en grafos

dc.contributor.advisorÁlvarez Vargas, Gloria Inés
dc.contributor.advisorLinares Ospina, Diego Luis
dc.contributor.authorHernández Giraldo, Andrés Felipe
dc.contributor.authorRocha Fernández, Cristian David
dc.contributor.authorMontes Estrada, Juan Carlos
dc.date.accessioned2024-07-29T16:48:33Z
dc.date.available2024-07-29T16:48:33Z
dc.date.issued2024
dc.description.abstractLa generación automática de resúmenes es un área de creciente interés que busca facilitar la comprensión eficiente de grandes volúmenes de información textual. Este proyecto aborda el problema combinando técnicas extractivas y abstractivas mediante un enfoque mixto y el uso de algoritmos de grafos. El sistema automatizado desarrollado incluye la preparación y limpieza de textos financieros, vectorización con TF-IDF y modelos de embeddings como Cohere y Jina AI, cálculo de similitud coseno, creación de grafos, y selección de oraciones relevantes mediante el algoritmo MMR. El código fuente del proyecto, desarrollado en Python, está disponible en un repositorio con instrucciones de instalación y ejecución.
dc.description.abstractengThe automatic generation of summaries is an area of ​​growing interest that seeks to facilitate the efficient understanding of large volumes of textual information. This project addresses the problem by combining extractive and abstractive techniques through a mixed approach and the use of graph algorithms. The automated system developed includes the preparation and cleaning of financial texts, vectorization with TF-IDF and embedding models such as Cohere and Jina AI, cosine similarity calculation, graph creation, and selection of relevant sentences using the MMR algorithm. The source code of the project, developed in Python, is available in a repository with installation and execution instructions.
dc.format.extent100 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://vitela.javerianacali.edu.co/handle/11522/3632
dc.language.isospa
dc.publisherPontificia Universidad Javeriana Cali
dc.publisher.facultyFacultad de Ingeniería y Ciencias
dc.rights.accessrightshttp://purl.org/coar/access_right/c_14cb
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectGeneración automática de resúmenes
dc.subjectInvestigación y análisis de información
dc.subjectNLP (Natural Language Processing)
dc.subjectMachine Learning (ML)
dc.subjectTécnicas extractivas y abstractivas
dc.subjectAlgoritmos de grafos
dc.subjectTexto financiero
dc.subjectPreparación y limpieza de textos
dc.subjectAutomatic generation of summaries
dc.subjectResearch and analysis of information
dc.subjectExtractive and abstractive techniques
dc.subjectGraph algorithms
dc.subjectFinancial text
dc.subjectPreparation and cleaning of texts
dc.thesis.disciplineFacultad de Ingeniería y Ciencias. Maestría en Ciencia de Datos - Modalidad virtual
dc.thesis.grantorPontificia Universidad Javeriana Cali
dc.thesis.levelMaestría
dc.titleGeneración automática de resúmenes de documentos financieros usando técnicas basadas en grafosspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.localTesis/Trabajo de grado - Monografía - Maestría
dc.type.redcolhttps://purl.org/redcol/resource_type/TM
Files
Original bundle
Now showing 1 - 2 of 2
No Thumbnail Available
Name:
Resumenes Financieros Automaticos.pdf
Size:
1.73 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
LICENCIA DE USO.pdf
Size:
222.38 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: