Detección de anomalías en datos meteorológicos mediante métodos de análisis avanzados
Loading...
Date
2025
Authors
Director
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Javariana Cali
Abstract
Dada la creciente incidencia de fenómenos climáticos, como ciclones, sequías e intensas lluvias, anticipar y estudiar los cambios en las condiciones atmosféricas se ha convertido en una prioridad para países como Colombia, que cuentan con amplias áreas costeras. Estos eventos representan no solo un riesgo significativo para el medio ambiente y la seguridad, sino que también exigen un entendimiento profundo de las dinámicas atmosféricas. Las series de tiempo meteorológicas son herramientas clave en este contexto, ya que permiten el monitoreo continuo de variables climáticas, como la temperatura, la presión, la humedad y la precipitación, facilitando la identificación y estudio de patrones y anomalías que podrían anticipar eventos climáticos. En este contexto, se abordaron las limitaciones actuales en la detección de anomalías en los datos meteorológicos de la Dirección General Marítima en Colombia, siguiendo la metodología CRoss Industry Standard Process for Data Mining (CRISP-DM). Se propuso un enfoque híbrido que combina un algoritmo estadístico diseñado para la detección de anomalías naturalmente imposibles relacionadas con sensores, con un método más robusto que permite detectar días completos como eventos anómalos, en el que se seleccionaron las series multivariadas mediante un análisis de correlación, donde se identificaron las variables que presentaban mayor interdependencia. Luego, se aplicó el clustering utilizando los algoritmos K-means y DBSCAN, con enfoques tanto locales como globales. Los mejores resultados de evaluación se obtuvieron con el enfoque global aplicado a la serie multivariada que incluye temperatura del aire y humedad relativa, mostrando un puntaje de silueta de 0.67 y un índice de Davies Bouldin 0.54 para DBSCAN.
Description
item.page.descriptioneng
Given the increasing incidence of climatic phenomena, such as cyclones, droughts and intense rainfall, anticipating and studying changes in atmospheric conditions has become a priority for countries such as Colombia, which have large coastal areas. These events represent not only a significant risk to the environment and security, but also require a deep understanding of atmospheric dynamics. Meteorological time series are key tools in this context, as they allow the continuous monitoring of climatic variables, such as temperature, pressure, humidity and precipitation, facilitating the identification and study of patterns and anomalies that could anticipate climatic events. In this context, the current limitations in the detection of anomalies in meteorological data from the General Maritime Directorate in Colombia were addressed. following the CRoss Industry Standard Process for Data Mining (CRISP-DM) methodology. A hybrid approach was proposed that combines a statistical algorithm designed for the detection of naturally impossible anomalies related to sensors, with a more robust method that allows to detect entire days as anomalous events, in which the multivariate series were selected through a correlation analysis, where the variables that presented the greatest interdependence were identified. Then, clustering was applied using the K-means and DBSCAN algorithms, with both local and global approaches. The best evaluation results were obtained with the global approach applied to the multivariate series that includes air temperature and relative humidity, showing a silhouette score of 0.67 and a Davies Bouldin index 0.54 for DBSCAN.
Keywords
Series temporales, Clusterización, Meteorología, Aprendizaje no supervisado, Anomalías, Time series, Clustering, Meteorology, Unsupervised learning, Anomalies