Diseño de arquitectura para un software que integra tecnologías de OCR y LLM para la captura de datos de procesos judiciales de juzgados civiles y penales de la ciudad de Pereira
Loading...
Date
2025
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Javeriana Cali
Share
Abstract
En Colombia, el sistema SIERJU de la Rama Judicial toma información de los procesos que llevan a cabo todos los juzgados del país para generar indicadores y reportes trimestrales. Lamentablemente, la recopilación y cargue de esta información es un proceso manual, dispendioso y propenso a errores. Este proyecto plantea una solución de software que utiliza tecnologías de Reconocimiento Óptico de Caracteres (OCR) y Modelos de lenguaje de gran tamaño (LLM) que facilite este proceso, automatizando la captura de información del sistema Justicia XXI y los documentos de los procesos judiciales en los despachos judiciales de Pereira, para su carga posterior en el sistema de información SIERJU. El desarrollo del proyecto incluyó la definición de un conjunto de requerimientos arquitecturalmente significativos (ASR), el diseño de una arquitectura de software que satisfaga esos requerimientos y la evaluación de su viabilidad técnica a través de prototipos, experimentos y pruebas con esos prototipos.