“Aplicación de Modelos Machine Learning para predecir el riesgo de pérdida de seguimiento en tuberculosis”

Loading...
Thumbnail Image
Date
2025
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Javariana Cali
Abstract
La tuberculosis (TB) es una enfermedad que afecta a un gran número de personas en todo el mundo, es curable y prevenible; razones que han llevado a la Organización Mundial de la Salud (OMS) a priorizar la enfermedad a nivel de salud pública. No obstante, las pérdidas en el seguimiento amenazan el éxito de los programas de control, dado por aumentos en las tasas de mortalidad y se constituyen como un factor desencadenante en la aparición de formas farmacorresistentes. Se han descrito diferentes determinantes en salud (DSS) que influyen en la pérdida de seguimiento, siendo los principales: sexo hombre, tener un bajo nivel educativo, bajos ingresos económicos, pertenecer a un grupo poblacional vulnerable, presentar alguna comorbilidad, tener barreras de acceso al sistema de salud, antecedente de tratamiento previo, baja tolerancia a efectos secundarios al tratamiento y afectaciones en salud mental. El distrito capital no es ajeno a esta situación y se ha visto que el éxito programático no alcanza la meta del 90 % en los últimos años. Dentro de los factores que afectan el cumplimiento se encuentran los pacientes fallecidos y con pérdida de seguimiento cuya prevalencia para el distrito en los últimos 7 años corresponde al 7.3 %. Los avances en inteligencia artificial (IA) han permitido comprender mejor el fenómeno de pérdida de seguimiento en otros países con alta carga de la enfermedad, los cuales han servido como base para la reformulación de políticas públicas por parte de las autoridades sanitarias, que han permitido mejorar la adherencia terapéutica de los pacientes. En este sentido, el objetivo del presente proyecto consistió en desarrollar un modelo de Machine Learning que permita predecir el riesgo de pérdida de seguimiento en pacientes pertenecientes al programa de TB en el distrito capital, a partir de los determinantes sociales en salud contenidos en el sistema de información. Para ello se desarrollaron cuatro tipos de algoritmos de aprendizaje automático supervisado con diferentes técnicas de remuestreo para balancear las clases y se aplicaron diferentes técnicas para seleccionar variables predictoras incidentes en la pérdida de seguimiento. Como resultado se obtuvo un modelo de XGBoost con buen desempeño en las métricas sensibilidad, exactitud y AUC; con el cual se puede brindar un apoyo al personal de salud que hace parte de los programas locales de tuberculosis y del distrito para identificar de forma temprana a este tipo de pacientes.
Abstract
item.page.abstract.eng
item.page.descriptioneng
Tuberculosis (TB) is a disease that affects a large number of people around the world, it is curable and preventable; reasons that have led the World Health Organization (WHO) to prioritize the disease at the public health level. However, losses to follow-up threaten the success of control programs, due to increases in mortality rates and constitute a triggering factor in the emergence of drug-resistant forms. Different health determinants (DSS) have been described that influence loss to follow-up, the main ones being: male sex, having a low educational level, low economic income, belonging to a vulnerable population group, presenting some comorbidity, having access barriers to the health system, history of previous treatment, low tolerance to side effects to treatment and mental health effects. The capital district is not immune to this situation and it has been seen that programmatic success does not reach the goal of 90% in recent years. Among the factors that affect compliance are deceased patients and patients lost to follow-up, whose prevalence for the district in the last 7 years corresponds to 7.3%. Advances in artificial intelligence (AI) have allowed us to better understand the phenomenon of loss to follow-up in other countries with a high burden of the disease, which have served as a basis for the reformulation of public policies by health authorities, which have allowed patients to improve therapeutic adherence. In this sense, the objective of this project was to develop a Machine Learning model that allows predicting the risk of loss to follow-up in patients belonging to the TB program in the capital district, based on the social determinants of health contained in the information system. To this end, four types of supervised machine learning algorithms were developed with different resampling techniques to balance the classes and different techniques were applied to select predictor variables incident to loss of follow-up. As a result, an XGBoost model was obtained with good performance in the sensitivity, accuracy and AUC metrics; with which support can be provided to health personnel who are part of local and district tuberculosis programs to identify this type of patients early.
Citation