Predicción de precios de activos de renta variable de la BVC mediante modelos de aprendizaje supervisado
Loading...
Date
2025
Director
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Javeriana Cali
Share
Abstract
El presente trabajo desarrolla un modelo integral para la predicción de retornos logarítmicos y precios de activos de renta variable de la Bolsa de Valores de Colombia (BVC) empleando metodologías de aprendizaje supervisado. Dado que los mercados financieros operan en un entorno marcado por la alta incertidumbre, la volatilidad y la presencia de dinámicas no lineales, anticipar correctamente el comportamiento de los activos continúa siendo un desafío central tanto para investigadores como para gestores de inversión. Con este propósito, se construyó un pipeline para el tratamiento y modelado de series temporales financieras, que abarcó la depuración de datos, el enriquecimiento mediante indicadores de calidad, volumen, microestructura de mercado, volatilidad e indicadores técnicos, y la posterior implementación de modelos predictivos. La investigación compara el desempeño de modelos clásicos y avanzados, incluyendo dos baselines el Naive0 y Persist, algoritmos basados en árboles de decisión (Random Forest, XGBoost y LightGBM) y redes neuronales recurrentes tipo LSTM, diseñadas para capturar dependencias temporales de largo plazo. Todos los modelos fueron evaluados bajo un esquema de partición temporal estricta (TRAIN–VALID–TEST), evitando la fuga de información y asegurando una medición realista del desempeño fuera de muestra. En cuanto a la predicción de retornos, los resultados muestran que la naturaleza altamente ruidosa y volátil del mercado dificulta la obtención de patrones estables y consistentes a lo largo del tiempo. En este escenario, los modelos basados en boosting, especialmente LightGBM, lograron mejoras moderadas respecto a los baselines en términos de MAE, RMSE y tasas de acierto direccional. Asimismo, las redes LSTM demostraron una capacidad superior para capturar señales direccionales, aun cuando sus métricas de error no siempre superaron a los modelos más simples. Bajo esta estructura, el modelo Naive0 resultó ser el más efectivo, al obtener los menores valores de MAE, RMSE y MAPE, junto con los mayores niveles de R² en todos los emisores. Esto indica que, para pronosticar el nivel absoluto del precio, la mejor aproximación consiste en asumir que el precio futuro será similar al del periodo anterior, lo que explica por qué los modelos complejos no lograron superarlo de manera consistente. El segundo mejor desempeño correspondió a LightGBM, que mostró una mayor estabilidad y generalización que el modelo Persist y que otros algoritmos supervisados, posicionándose como la alternativa más robusta entre los modelos de aprendizaje automático más avanzados.
item.page.abstract.eng
item.page.descriptioneng
Keywords
Predicción , Retornos , Volatilidad , Serie de tiempo , Rentabilidad , Prediction , Returns , Volatility , Time series , Profitability