Detección de anomalías en datos meteorológicos mediante métodos de análisis avanzados

dc.contributor.advisorBuss Molina, Antal Alexander
dc.contributor.authorMena Ramírez, Yamuna Devi
dc.date.accessioned2025-03-11T17:42:29Z
dc.date.available2025-03-11T17:42:29Z
dc.date.issued2025
dc.description.abstractDada la creciente incidencia de fenómenos climáticos, como ciclones, sequías e intensas lluvias, anticipar y estudiar los cambios en las condiciones atmosféricas se ha convertido en una prioridad para países como Colombia, que cuentan con amplias áreas costeras. Estos eventos representan no solo un riesgo significativo para el medio ambiente y la seguridad, sino que también exigen un entendimiento profundo de las dinámicas atmosféricas. Las series de tiempo meteorológicas son herramientas clave en este contexto, ya que permiten el monitoreo continuo de variables climáticas, como la temperatura, la presión, la humedad y la precipitación, facilitando la identificación y estudio de patrones y anomalías que podrían anticipar eventos climáticos. En este contexto, se abordaron las limitaciones actuales en la detección de anomalías en los datos meteorológicos de la Dirección General Marítima en Colombia, siguiendo la metodología CRoss Industry Standard Process for Data Mining (CRISP-DM). Se propuso un enfoque híbrido que combina un algoritmo estadístico diseñado para la detección de anomalías naturalmente imposibles relacionadas con sensores, con un método más robusto que permite detectar días completos como eventos anómalos, en el que se seleccionaron las series multivariadas mediante un análisis de correlación, donde se identificaron las variables que presentaban mayor interdependencia. Luego, se aplicó el clustering utilizando los algoritmos K-means y DBSCAN, con enfoques tanto locales como globales. Los mejores resultados de evaluación se obtuvieron con el enfoque global aplicado a la serie multivariada que incluye temperatura del aire y humedad relativa, mostrando un puntaje de silueta de 0.67 y un índice de Davies Bouldin 0.54 para DBSCAN.
dc.description.abstractengGiven the increasing incidence of climatic phenomena, such as cyclones, droughts and intense rainfall, anticipating and studying changes in atmospheric conditions has become a priority for countries such as Colombia, which have large coastal areas. These events represent not only a significant risk to the environment and security, but also require a deep understanding of atmospheric dynamics. Meteorological time series are key tools in this context, as they allow the continuous monitoring of climatic variables, such as temperature, pressure, humidity and precipitation, facilitating the identification and study of patterns and anomalies that could anticipate climatic events. In this context, the current limitations in the detection of anomalies in meteorological data from the General Maritime Directorate in Colombia were addressed. following the CRoss Industry Standard Process for Data Mining (CRISP-DM) methodology. A hybrid approach was proposed that combines a statistical algorithm designed for the detection of naturally impossible anomalies related to sensors, with a more robust method that allows to detect entire days as anomalous events, in which the multivariate series were selected through a correlation analysis, where the variables that presented the greatest interdependence were identified. Then, clustering was applied using the K-means and DBSCAN algorithms, with both local and global approaches. The best evaluation results were obtained with the global approach applied to the multivariate series that includes air temperature and relative humidity, showing a silhouette score of 0.67 and a Davies Bouldin index 0.54 for DBSCAN.
dc.format.extent71 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttp://hdl.handle.net/11522/4605
dc.language.isospa
dc.publisherPontificia Universidad Javariana Cali
dc.publisher.facultyFacultad de Ingeniería y Ciencias
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectSeries temporales
dc.subjectClusterización
dc.subjectMeteorología
dc.subjectAprendizaje no supervisado
dc.subjectAnomalías
dc.subjectTime series
dc.subjectClustering
dc.subjectMeteorology
dc.subjectUnsupervised learning
dc.subjectAnomalies
dc.thesis.disciplineFacultad de Ingeniería y Ciencias. Maestría en Ciencia de Datos - Modalidad virtual
dc.thesis.grantorPontificia Universidad Javeriana
dc.thesis.levelMaestría
dc.thesis.nameMagíster en Ciencia de Datos
dc.titleDetección de anomalías en datos meteorológicos mediante métodos de análisis avanzadosspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.localTesis/Trabajo de grado - Monografía - Maestría
dc.type.redcolhttps://purl.org/redcol/resource_type/TM
Files
Original bundle
Now showing 1 - 2 of 2
No Thumbnail Available
Name:
Trabajo_Grado_Yamuna_Mena_R.pdf
Size:
5.83 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Licencia_autorizacion. pdf
Size:
121.07 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: