Generación de noticias a partir de conjuntos de datos económicos utilizando técnicas de inteligencia artificial y aprendizaje automático

dc.contributor.advisorLinares Ospina, Diego Luis
dc.contributor.advisorÁlvarez Vargas, Gloria Inés
dc.contributor.authorLópez Gómez, David Leonardo
dc.contributor.authorBejarano Bejarano, Luis Vidal
dc.date.accessioned2025-05-05T16:48:25Z
dc.date.available2025-05-05T16:48:25Z
dc.date.issued2025
dc.description.abstractEn el contexto actual de rápida generación de datos económicos, surge el desafío de transformar conjuntos de datos complejos en información accesible y comprensible. Esta investigación aborda esta problemática mediante el uso de técnicas de inteligencia artificial (IA) y aprendizaje automático (AA) para la generación automatizada de noticias basadas en procesamiento de lenguaje natural (PLN). Aquí, el problema radica en la ineficiencia de los métodos tradicionales de análisis de datos frente al volumen y la complejidad de la información económica contemporánea. Además, los medios de comunicación enfrentan una creciente demanda de entrega rápida y precisa de contenidos, lo que presenta desafíos significativos en términos de costos y operatividad. Para abordar estos retos, se desarrolló un sistema basado en los modelos T5 y GPT-2, ambos con arquitecturas de tipo transformer. Los datos económicos fueron preprocesados, limpiados y estructurados para entrenar los modelos. Se realizaron ajustes utilizando hiperparámetros optimizados y métricas de evaluación como BLEU, BERTScore y perplejidad, con el objetivo de medir la calidad de los textos generados. Los resultados mostraron que el modelo T5 superó al GPT-2 en precisión, coherencia y fluidez del texto generado, logrando un BLEU de 0.14, un BERTScore promedio (F1) de 0.83 y una perplejidad de 1.11 tras la optimización. En comparación, el GPT-2 alcanzó un BLEU de 0.15, un BERTScore promedio (F1) de 0.70 y una perplejidad de 12.75. Estas métricas indican que el T5 es más adecuado para generar textos complejos y altamente estructurados, mientras que el GPT-2 destaca en tareas donde se requiere mayor creatividad y generación de contenido más diversificado. El resultado de esta investigación, aporta un avance en la transformación de datos económicos en contenido informativo, reduciendo costos y tiempos asociados a los procesos tradicionales. La solución propuesta se presenta como una herramienta prometedora para democratizar el acceso a información económica y apoyar la toma de decisiones en entornos dinámicos.spa
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Ciencia de Datos
dc.format.mimetypeapplication/pdf
dc.identifier.urihttp://hdl.handle.net/11522/4731
dc.language.isospa
dc.publisherPontificia Universidad Javeriana Cali
dc.publisher.departmentFacultad de Ingeniería y Ciencias
dc.publisher.programMaestría en Ciencia de Datos
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subjectProcesamiento de lenguaje naturalspa
dc.subjectAprendizaje automáticospa
dc.subjectModelo T5spa
dc.subjectModelo GPT2spa
dc.subjectModelos Transformerseng
dc.subjectNatural Language Processing (NLP)eng
dc.subjectMachine Learning (ML)eng
dc.subjectT5 Modeleng
dc.subjectGPT-2 Modeleng
dc.subjectTransformer Modelseng
dc.titleGeneración de noticias a partir de conjuntos de datos económicos utilizando técnicas de inteligencia artificial y aprendizaje automáticospa
dc.typemaster thesis
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.localTesis/Trabajo de grado - Monografía - Maestría
dc.type.redcolhttps://purl.org/redcol/resource_type/TM
Files
Original bundle
Now showing 1 - 2 of 2
No Thumbnail Available
Name:
Estructura Documento Proyecto - Maestría en Ciencia de Datos.pdf
Size:
1.38 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Licencia_autorizacion vf.pdf
Size:
381.34 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: