Prototipo para predecir el precio de Bitcoin por medio de Machine Learning haciendo uso de despliegue continuo
Loading...
Date
2025
Authors
Director
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Javeriana Cali
Share
Abstract
Este proyecto de grado aborda la volatilidad del precio de Bitcoin, que dificulta la toma de decisiones de inversión, mediante el desarrollo de un prototipo para su predicción utilizando Machine Learning (ML) y operaciones de ML (MLOps) para despliegue continuo. Dada la relevancia de Bitcoin y las dificultades que enfrentan los inversores, este trabajo busca ofrecer una solución tecnológica que apoye decisiones más informadas mediante predicciones actualizadas y transparentes. El objetivo general fue diseñar, implementar y evaluar una arquitectura MLOps en la nube (Azure) para automatizar el ciclo de vida de modelos de predicción de series temporales, lo que incluyó determinar variables relevantes (históricos de precio/volumen de exchanges Bitstamp, Binance, Coinbase y métricas on-chain como cantidad movida, transacciones y dificultad de minado desde un nodo local), elaborar un conjunto de datos horario consolidado (inicialmente horario y luego agregado a frecuencia diaria para el entrenamiento de los modelos), desarrollar y comparar modelos LSTM y GRU, seleccionar el de mejor rendimiento, e implementar una aplicación web para visualizar los resultados. Como principales resultados, se implementó la arquitectura MLOps utilizando Azure Data Lake, Databricks, MLflow y Azure Container Apps; el modelo GRU fue seleccionado por su desempeño (MAPE promedio de 1,66%, el cual se alcanzó al entrenar el modelo excluyendo las variables de la cadena; se desarrolló y desplegó una aplicación web con Streamlit mediante CI/CD (Docker, GitHub Actions, Azure Container Registry/Apps) que muestra la predicción diaria y métricas, y se logró la automatización del reentrenamiento diario del modelo. Las lecciones aprendidas destacan la importancia de la fuente y el preprocesamiento de datos (incluyendo transformaciones como diferencia logarítmica), la viabilidad y beneficios de implementar MLOps y CI/CD en la nube, y el desafío persistente que representa predecir con alta precisión la volatilidad inherente del mercado de Bitcoin.
item.page.abstract.eng
This thesis project addresses Bitcoin’s price volatility, which complicates investment decision-making, through the development of a prototype for its prediction using Machine Learning (ML) and ML operations (MLOps) for continuous deployment. Given Bitcoin’s relevance and the challenges faced by investors, this work seeks to provide a technological solution that supports more informed decisions through updated and transparent predictions. The main objective was to design, implement, and evaluate a cloud-based (Azure) MLOps architecture to automate the lifecycle of time series prediction models. This included identifying relevant variables (historical price/volume data from Bitstamp, Binance, and Coinbase exchanges, and on-chain metrics such as amount moved, transactions, and mining difficulty from a local node), creating a consolidated hourly dataset (initially hourly, later aggregated to daily frequency for model training), developing and comparing LSTM and GRU models, selecting the best-performing one, and implementing a web application to visualize the results. Key outcomes include the implementation of the MLOps architecture using Azure Data Lake, Databricks, MLflow, and Azure Container Apps; the GRU model was selected for its performance (average MAPE of 1.66%, achieved by training the model without on-chain variables); a web application was developed and deployed with Streamlit using CI/CD (Docker, GitHub Actions, Azure Container Registry/Apps) to display daily predictions and metrics; and daily automated retraining of the model was achieved. Lessons learned highlight the importance of data sources and preprocessing (including transformations such as logarithmic differencing), the feasibility and benefits of implementing MLOps and CI/CD in the cloud, and the persistent challenge of achieving high-accuracy predictions given Bitcoin’s inherent market volatility.