Análisis de sentimiento para determinar patrones predictivos de problemas de crisis reputacional en hoteles de Bogotá
Loading...
Date
2025
Authors
Director
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Javeriana Cali
Share
Abstract
Este proyecto se centró en el análisis de reseñas de hoteles en Bogotá con el objetivo de identificar patrones textuales y temporales asociados a posibles crisis de reputación empresarial. Mediante el uso de herramientas de ciencia de datos como Python, Jupyter Notebook y bibliotecas especializadas como Pandas, Scikit-learn y NLTK, se procesaron miles de opiniones de usuarios para construir un modelo predictivo basado en sentimientos negativos. Se realizó un análisis de series de tiempo sobre reseñas negativas, identificando patrones estacionales y periodos críticos que pueden servir como alertas tempranas. Este componente permitió incorporar una dimensión temporal valiosa para la toma de decisiones estratégicas. Se aplicaron técnicas de procesamiento de lenguaje natural (NLP), incluyendo lematización y vectorización, para transformar el texto en variables cuantificables. A partir de una función de clasificación que distinguía entre estados de crisis y no crisis, se entrenaron cuatro algoritmos de aprendizaje supervisado: Regresión Logística, Random Forest, Support Vector Machine (SVM) y MLPClassifier. Cada modelo fue evaluado antes y después del ajuste de hiperparámetros mediante GridSearchCV, siendo el SVM y el MLP los que lograron mejores métricas de precisión y recall en la predicción de crisis. En conjunto, el proyecto demuestra la viabilidad de utilizar análisis de sentimientos y aprendizaje automático para fortalecer la gestión reputacional en el sector hotelero, con potencial de escalabilidad a otras industrias dependientes de plataformas de opinión digital.
item.page.abstract.eng
This project focused on the analysis of hotel reviews in Bogotá with the aim of identifying textual and temporal patterns associated with potential corporate reputation crises. Using data science tools such as Python, Jupyter Notebook, and specialized libraries such as Pandas, Scikit-learn, and NLTK, thousands of user reviews were processed to build a predictive model based on negative sentiment. A time series analysis of negative reviews was performed, identifying seasonal patterns and critical periods that can serve as early warnings. This component allowed for the incorporation of a valuable temporal dimension for strategic decision-making. Natural language processing (NLP) techniques, including lemmatization and vectorization, were applied to transform the text into quantifiable variables. Based on a classification function that distinguished between crisis and non-crisis states, four supervised learning algorithms were trained: Logistic Regression, Random Forest, Support Vector Machine (SVM), and MLP Classifier. Each model was evaluated before and after hyperparameter tuning using GridSearchCV, with the SVM and MLP models achieving the best accuracy and recall metrics in crisis prediction. Overall, the project demonstrates the feasibility of using sentiment analysis and machine learning to strengthen reputation management in the hospitality sector, with potential for scalability to other industries that rely on digital review platforms.