Predicción de desenlaces de pacientes de emergencias atendidas por hospitales nivel I y II en el Valle del Cauca

Abstract
Este proyecto parte de la problemática de la sobreocupación en los servicios de urgencias y la necesidad de optimizar la atención al paciente, agilizando la toma de decisiones en este entorno crítico. El servicio de urgencias inicia con una valoración de Triage al momento de la llegada del paciente, posteriormente, el paciente pasa a la valoración inicial por parte de un médico tratante que determina el manejo del paciente. Durante la atención, los pacientes terminan su servicio con uno de varios desenlaces que puede ser entre otros: 1) Alta de urgencia, 2) hospitalización, 3) remisión normal, 4) remisión prioritaria y 5) remisión urgente. Este proyecto aplicado propone un modelo de aprendizaje automático que puede apoyar al personal médico en su predicción de los desenlaces clínicos, y de esta manera contribuir a una mejor toma de decisiones de alta de urgencias, hospitalización o remisión a un nivel superior de complejidad. La implementación de este modelo en la valoración inicial podría contribuir a la optimización de la atención a los pacientes al agilizar las decisiones de traslados, minimizar errores humanos, y aliviar la fatiga cognitiva de los médicos. Se emplearon tres modelos de aprendizaje automático: Regresión Logística Multinomial (RLM), Máquinas de Soporte Vectorial (SVM) y Extreme Gradient Boosting (XGBoost). El rendimiento se evaluó con métricas como precisión, sensibilidad y F1-score. Se incluyó un análisis de texto utilizando TF-IDF para enriquecer los datos y mejorar la precisión del modelo. Se encontró que tanto RLM como SVM mostraron limitaciones en la predicción de clases minoritarias, como la necesidad de hospitalización o remisión. El modelo XGBoost, potenciado con análisis de texto, obtuvo el mejor rendimiento, mejorando la precisión, especialmente en la predicción de clases minoritarias. Los resultados obtenidos confirman que la inclusión de información textual permite mejorar la predicción. Asimismo, evidencian las limitaciones de RLM y SVM en conjuntos de datos desbalanceados y destaca la superioridad de XGBoost y otros algoritmos avanzados. Los resultados obtenidos se alinean con la literatura, que también evidencia las limitaciones de RLM y SVM en conjuntos de datos desbalanceados y destaca la superioridad de XGBoost y otros algoritmos avanzados. Este proyecto de ciencia de datos contribuye al desarrollo de herramientas que pueden ayudar a optimizar la atención en urgencias, mejorando la toma de decisiones, la asignación de recursos y la calidad del servicio. A futuro, se propone validar los modelos en otros contextos e incorporar nuevas variables para mejorar aún más la predicción.
Description
item.page.descriptioneng
This project is based on the problem of overcrowding in emergency services and the need to optimize patient care by streamlining decision-making in this critical environment. The emergency service begins with a Triage assessment upon the patient's arrival; subsequently, the patient goes on to the initial assessment by an attending physician who determines the patient's management. During care, patients finish their service with one of several outcomes that may be among others: 1) Emergency discharge, 2) hospitalization, 3) normal referral, 4) priority referral, and 5) urgent referral. This applied project proposes a machine learning model that can support medical staff in their prediction of clinical outcomes, and in this way contribute to better decision-making regarding emergency discharge, hospitalization, or referral to a higher level of complexity. The implementation of this model in the initial assessment could contribute to the optimization of patient care by streamlining transfer decisions, minimizing human errors, and alleviating cognitive fatigue of physicians. Three machine learning models were used: Multinomial Logistic Regression (MLR), Support Vector Machines (SVM) and Extreme Gradient Boosting (XGBoost). Performance was evaluated with metrics such as accuracy, sensitivity, and F1-score. Text analysis using TF-IDF was included to enrich the data and improve the accuracy of the model. Both RLM and SVM were found to show limitations in predicting minority classes, such as the need for hospitalization or referral. The XGBoost model, enhanced with text analysis, performed best, improving accuracy, especially in predicting minority classes. The results obtained confirm that the inclusion of textual information allows for improved prediction. They also show the limitations of RLM and SVM in imbalanced data sets and highlight the superiority of XGBoost and other advanced algorithms. The results obtained are in line with the literature, which also shows the limitations of RLM and SVM in imbalanced data sets and highlights the superiority of XGBoost and other advanced algorithms. This data science project contributes to the development of tools that can help optimize emergency care, improving decision-making, resource allocation, and service quality. In the future, it is proposed to validate the models in other contexts and incorporate new variables to further improve prediction.
Keywords
Ciencia de datos, Aprendizaje de máquina, Modelos predictivos, Sistema de soporte a decisión clínica, Emergencias médicas, Data-Driven Science, Transfer Learning, Predictive models, Clinical Decision Support Systems, Emergency Treatment
Citation