Clusterización aplicada a empresas del sector energético que reportan indicadores ESG (ambiental, social y de gobernanza)
Loading...
Date
2025
Authors
Director
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Javeriana Cali
Share
Abstract
Este proyecto aplicó técnicas de aprendizaje no supervisado para segmentar empresas del sector energético con base en sus indicadores ESG (Ambientales, Sociales y de Gobernanza), abordando la necesidad de identificar perfiles diferenciados de sostenibilidad corporativa. La problemática detectada radica en la ausencia de clasificaciones sistemáticas que permitan evaluar, comparar y monitorear el desempeño ESG de las empresas, limitando su análisis desde perspectivas técnicas y estratégicas. Para ello, se construyó una base de datos estructurada con 576 registros provenientes de la plataforma London Stock Exchange Group (LSEG), se depuraron las variables mediante limpieza, estandarización y reducción de dimensionalidad usando Análisis de Componentes Principales (PCA), y se entrenaron modelos de clusterización como K-Means y agrupamiento jerárquico. El modelo óptimo fue K-Means con PCA=5 y 40 clústeres, que alcanzó métricas destacadas en cohesión interna y separación entre grupos. No obstante, se adoptó el modelo con K=2 para facilitar la interpretación cualitativa de los clústeres. Los resultados permitieron identificar dos perfiles empresariales claramente diferenciados: uno con alto compromiso en sostenibilidad y otro con desafíos estructurales significativos, aportando valor estratégico para inversionistas, reguladores y gestores de sostenibilidad. Este proyecto demuestra la viabilidad del uso de minería de datos para caracterizar empresas desde una óptica ESG y sienta las bases para futuras investigaciones orientadas a la predicción, monitoreo y evaluación dinámica del desempeño sostenible en sectores estratégicos.
item.page.abstract.eng
This project applied unsupervised learning techniques to segment companies in the energy sector based on their ESG indicators (Environmental, Social, and Governance), addressing the need to identify differentiated profiles of corporate sustainability. The identified issue lies in the absence of systematic classifications that allow for the evaluation, comparison, and monitoring of companies' ESG performance, limiting analysis from both technical and strategic perspectives. To address this, a structured database was built with 576 records sourced from the London Stock Exchange Group (LSEG) platform. Variables were refined through cleaning, standardization, and dimensionality reduction using Principal Component Analysis (PCA), and clustering models such as K-Means and hierarchical clustering were trained. The optimal model was K-Means with PCA=5 and 40 clusters, achieving strong metrics in internal cohesion and group separation. However, the model with K=2 was adopted to facilitate qualitative interpretation of the clusters. The results identified two clearly differentiated business profiles: one with a high commitment to sustainability and another facing significant structural challenges, providing strategic value for investors, regulators, and sustainability managers. This project demonstrates the feasibility of using data mining to characterize companies from an ESG perspective and lays the groundwork for future research aimed at prediction, monitoring, and dynamic evaluation of sustainable performance in strategic sectors.