Prototipo para predecir el precio de Bitcoin por medio de Machine Learning haciendo uso de despliegue continuo

dc.contributor.advisorNoreña Agudelo, Luis Gonzalo
dc.contributor.authorHerrera Salcedo, José Fernando
dc.date.accessioned2025-11-14T15:26:41Z
dc.date.available2025-11-14T15:26:41Z
dc.date.issued2025
dc.description.abstractEste proyecto de grado aborda la volatilidad del precio de Bitcoin, que dificulta la toma de decisiones de inversión, mediante el desarrollo de un prototipo para su predicción utilizando Machine Learning (ML) y operaciones de ML (MLOps) para despliegue continuo. Dada la relevancia de Bitcoin y las dificultades que enfrentan los inversores, este trabajo busca ofrecer una solución tecnológica que apoye decisiones más informadas mediante predicciones actualizadas y transparentes. El objetivo general fue diseñar, implementar y evaluar una arquitectura MLOps en la nube (Azure) para automatizar el ciclo de vida de modelos de predicción de series temporales, lo que incluyó determinar variables relevantes (históricos de precio/volumen de exchanges Bitstamp, Binance, Coinbase y métricas on-chain como cantidad movida, transacciones y dificultad de minado desde un nodo local), elaborar un conjunto de datos horario consolidado (inicialmente horario y luego agregado a frecuencia diaria para el entrenamiento de los modelos), desarrollar y comparar modelos LSTM y GRU, seleccionar el de mejor rendimiento, e implementar una aplicación web para visualizar los resultados. Como principales resultados, se implementó la arquitectura MLOps utilizando Azure Data Lake, Databricks, MLflow y Azure Container Apps; el modelo GRU fue seleccionado por su desempeño (MAPE promedio de 1,66%, el cual se alcanzó al entrenar el modelo excluyendo las variables de la cadena; se desarrolló y desplegó una aplicación web con Streamlit mediante CI/CD (Docker, GitHub Actions, Azure Container Registry/Apps) que muestra la predicción diaria y métricas, y se logró la automatización del reentrenamiento diario del modelo. Las lecciones aprendidas destacan la importancia de la fuente y el preprocesamiento de datos (incluyendo transformaciones como diferencia logarítmica), la viabilidad y beneficios de implementar MLOps y CI/CD en la nube, y el desafío persistente que representa predecir con alta precisión la volatilidad inherente del mercado de Bitcoin.spa
dc.description.abstractThis thesis project addresses Bitcoin’s price volatility, which complicates investment decision-making, through the development of a prototype for its prediction using Machine Learning (ML) and ML operations (MLOps) for continuous deployment. Given Bitcoin’s relevance and the challenges faced by investors, this work seeks to provide a technological solution that supports more informed decisions through updated and transparent predictions. The main objective was to design, implement, and evaluate a cloud-based (Azure) MLOps architecture to automate the lifecycle of time series prediction models. This included identifying relevant variables (historical price/volume data from Bitstamp, Binance, and Coinbase exchanges, and on-chain metrics such as amount moved, transactions, and mining difficulty from a local node), creating a consolidated hourly dataset (initially hourly, later aggregated to daily frequency for model training), developing and comparing LSTM and GRU models, selecting the best-performing one, and implementing a web application to visualize the results. Key outcomes include the implementation of the MLOps architecture using Azure Data Lake, Databricks, MLflow, and Azure Container Apps; the GRU model was selected for its performance (average MAPE of 1.66%, achieved by training the model without on-chain variables); a web application was developed and deployed with Streamlit using CI/CD (Docker, GitHub Actions, Azure Container Registry/Apps) to display daily predictions and metrics; and daily automated retraining of the model was achieved. Lessons learned highlight the importance of data sources and preprocessing (including transformations such as logarithmic differencing), the feasibility and benefits of implementing MLOps and CI/CD in the cloud, and the persistent challenge of achieving high-accuracy predictions given Bitcoin’s inherent market volatility.eng
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Ingeniería de Software
dc.format.extent74 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttp://hdl.handle.net/11522/5109
dc.language.isospa
dc.publisherPontificia Universidad Javeriana Cali
dc.publisher.departmentFacultad de Ingeniería y Ciencias
dc.publisher.programMaestría en Ingeniería de Software
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subjectBitcoinspa
dc.subjectMachine learningspa
dc.subjectMLOpsspa
dc.subjectPredicción de preciosspa
dc.subjectDespliegue continuospa
dc.subjectMachine learningeng
dc.subjectPrice predictioneng
dc.subjectContinuous deploymenteng
dc.titlePrototipo para predecir el precio de Bitcoin por medio de Machine Learning haciendo uso de despliegue continuospa
dc.typemaster thesis
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.localTesis/Trabajo de grado - Monografía - Maestría
dc.type.redcolhttps://purl.org/redcol/resource_type/TM
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
Proyecto de Grado Final - Jose Fernando Herrera Salcedo,,.pdf
Size:
2.41 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Licencia de Uso - Jose Fernando Herrera Salcedo,,.pdf
Size:
275.59 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: