Repository logo
  • Communities & Collections
  • All of DSpace
  • English
  • Español
  • Log In
    New user? Click here to register.Have you forgotten your password?
  1. Home
  2. Browse by Subject

Browsing by Subject "Data science"

Now showing 1 - 9 of 9
Results Per Page
Sort Options
  • Loading...
    Thumbnail Image
    Item
    Clasificación de emociones complejas en audio de conversaciones de Call Center de la Universidad Javeriana Cali mediante modelos semi supervisados de Machine Learning
    (Pontificia Universidad Javariana Cali, 2024) Ospina Cuesta, Julián Andrés; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego Luis
    Este proyecto tuvo como objetivo identificar las expresiones emocionales complejas predominantes en llamadas del centro de contacto, para ofrecer una herramienta de medición en la satisfacción de clientes o evaluación de desempeño en la relación empleado-cliente. La problemática abordada se centró en ¿Cómo podría desarrollarse un modelo basado en técnicas de machine learning para la clasificación automática de emociones complejas en grabaciones de llamadas de un centro de contacto universitario, con el propósito de evaluar la satisfacción del cliente? El objetivo principal del proyecto fue desarrollar un modelo semi supervisado de machine learning para la clasificación automática de emociones en grabaciones de llamadas del call center de la Universidad Javeriana Cali, utilizando características acústicas. El alcance se limitó al análisis y clasificación de las emociones complejas predominantes identificadas en estas grabaciones, basándose en definiciones de emociones ajustadas a los objetivos del negocio. Los resultados de este proyecto incluyen: un conjunto de audios procesados y etiquetados de forma semi supervisada en las 'No llamadas', mientras que las 'Llamadas' fueron de manera supervisada; un modelo de clasificación automática de emociones que fue entrenado y validado, logrando una precisión del 95% en 'No llamadas' y del 41% en 'Llamadas'; y, por último, un prototipo de software diseñado como interfaz para cargar audios y clasificar las emociones según los modelos generados.
  • Loading...
    Thumbnail Image
    Item
    Clasificación de emociones en audios de call center utilizando ciencia de datos
    (Pontificia Universidad Javeriana Cali, 2025) Marulanda Almanza, Johan Sebastian; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego Luis
    Este proyecto se desarrolló con el objetivo de clasificar emociones en llamadas de call center utilizando transcripciones de audio y técnicas de machine learning, tomando como caso de estudio el centro de contacto de una Universidad de Cali. La investigación se enmarca dentro de una iniciativa más amplia en la que se exploraron un enfoque de análisis de transcripciones textuales, el presente trabajo se centró exclusivamente en la información textual derivada de los audios, evaluando la efectividad de diferentes modelos de clasificación. El principal desafío fue desarrollar un clasificador capaz de identificar emociones de manera automatizada y eficiente a partir de datos textuales. Para ello, se realizó una limpieza y normalización de datos, seguida de un entrenamiento supervisado con modelos como Logistic Regression, Random Forest y Multi-Layer Perceptron (MLP). Se aplicó un ajuste de hiperparámetros utilizando Grid Search, optimizando el rendimiento de los modelos.
  • Loading...
    Thumbnail Image
    Item
    Desarrollo de modelo para identificación de características positivas/negativas de producto en comentarios en plataforma e-commerce usando aprendizaje automático
    (Pontificia Universidad Javeriana Cali, 2025) Villa Ramos, Jhilbran; Ibarra Enríquez, Santiago; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego Luis
    Este proyecto busca desarrollar una herramienta de análisis de sentimientos automatizada para evaluar comentarios en plataformas de comercio electrónico mediante técnicas de Machine Learning. El objetivo principal es identificar características positivas y negativas en las reseñas de los usuarios, permitiendo a las empresas mejorar su reputación, abordar rápidamente comentarios negativos, optimizar productos y servicios, y diseñar estrategias de marketing más efectivas. La metodología del proyecto se divide en dos etapas principales: preparación de datos e implementación del modelo. En la primera etapa, se realiza la adquisición de datos a partir de comentarios de usuarios, seguida de un proceso de limpieza y transformación del texto para eliminar ruido y normalizar los datos. Posteriormente, se aplican técnicas de incrustación de palabras como Word2Vec y GloVe, junto con métodos léxicos tradicionales (Bag-of-Words, TFIDF, One-Hot Encoding) para convertir el texto en representaciones vectoriales adecuadas para el análisis. En la fase de implementación, se entrenan y comparan distintos modelos de clasificación, utilizando los embeddings generados. Adicionalmente, se aplica modelado de temas (LDA) para identificar patrones en los comentarios. Finalmente, se generan visualizaciones interactivas que permiten una comprensión clara de los resultados.
  • Loading...
    Thumbnail Image
    Item
    Determinantes de la pobreza monetaria en Colombia: Un enfoque integral mediante ciencia de datos y técnicas de Machine Learning
    (Pontificia Universidad Javeriana Cali, 2025) Restrepo Castaño, Daniel Gabriel; González Gómez, Daniel Enrique
    Este proyecto aborda la identificación de los principales determinantes de la pobreza monetaria en Colombia mediante un enfoque integral basado en ciencia de datos y técnicas de aprendizaje automático. A partir de un análisis exhaustivo de factores socioeconómicos, demográficos y de vivienda, se desarrollarán modelos predictivos que permitirán identificar hogares en riesgo de caer en la pobreza. Se utilizarán datos de la Gran Encuesta Integrada de Hogares (GEIH) del DANE y otros conjuntos de datos, aplicando técnicas avanzadas de análisis y modelado para mejorar la comprensión de la pobreza. Los resultados proporcionarán evidencia clave para el diseño de políticas públicas más focalizadas y efectivas en la reducción de la pobreza monetaria en el país.
  • Loading...
    Thumbnail Image
    Item
    “Diseminación selectiva de la información usando ciencia de datos: recomendación de libros y lecturas en las bibliotecas Comfama”
    (Pontificia Universidad Javariana Cali, 2024) Bedoya Henao, Edwin José; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego Luis
    Este proyecto se enfoca en el desarrollo de un sistema de recomendación de libros para las Bibliotecas Comfama, con el objetivo de mejorar la experiencia de los usuarios al proporcionar sugerencias personalizadas basadas en sus preferencias de lectura y comportamiento histórico. La relevancia del proyecto radica en abordar el problema de la infoxicación, o sobrecarga de información, en un entorno donde la vasta cantidad de materiales disponibles dificulta la selección de lecturas adecuadas para cada usuario. El sistema de recomendación se construyó utilizando técnicas avanzadas de ciencia de datos, como modelos de agrupación (K-Means) y representaciones vectoriales de libros mediante Word2Vec, lo que permite identificar patrones de lectura y preferencias individuales. A partir de esta estructura, se generaron recomendaciones altamente precisas y personalizadas que optimizan el servicio de préstamo de las Bibliotecas Comfama, aumentando así la satisfacción de los usuarios. El sistema se fundamenta en una estructura de datos que integra tanto características demográficas como el historial de préstamos y consultas de cada usuario, lo que facilita la identificación de perfiles de lectores y la agrupación de usuarios con intereses similares. Como resultado, el proyecto ofrece un sistema innovador que promueve el uso más frecuente y eficiente de los servicios bibliotecarios, fortaleciendo el papel de las bibliotecas en la promoción de la cultura y el conocimiento. Este enfoque tiene aplicaciones potenciales más allá del ámbito bibliotecario, con posibilidades de implementación en sectores como el comercio electrónico o la selección de contenido digital, aprovechando las capacidades de la ciencia de datos para anticipar y satisfacer las preferencias individuales de los usuarios.
  • Loading...
    Thumbnail Image
    Item
    Modelo de clasificación para predecir la salud mental en estudiantes universitarios en Cali: Un enfoque basado en algoritmos desde el modelo de determinantes sociales de la salud
    (Pontificia Universidad Javeriana Cali, 2024) Chaparro Jiménez, Alix Meryam; Ruiz Chacón, Gustavo Adolfo; Charry Jiménez, Jorge Iván; Rocha Niño, Hernán Camilo; Cadavid Ruiz, Natalia
    Comprender los factores asociados con la salud mental de los estudiantes universitarios es de suma importancia en la sociedad actual. Con la intención de abordar este panorama, se realizó un estudio predictivo para identificar los determinantes sociales de la salud que inciden en la percepción de tres aspectos de salud mental negativa y tres de salud mental positiva de estudiantes de pregrado de una institución educativa en Cali. Para ello, se utilizó un enfoque basado en algoritmos en el cual se emplearon datos de 2.786 estudiantes universitarios, documentándose el desarrollo de cuatro modelos de clasificación y su ejecución para cada una de las variables a predecir
  • Loading...
    Thumbnail Image
    Item
    Modelo predictivo para la identificación de la enfermedad producida por la plaga Heilipus Lauri en el cultivo de aguacate Hass en Colombia, por medio del procesamiento y clasificación de imágenes con aplicación de técnicas de Machine Learning
    (Pontificia Universidad Javeriana Cali, 2024) Carvajal Jaramillo, Karen Andrea; Castro Collazos, Mauricio; Riveros Pulgarín, Ramón Siddartha; Arango Londoño, David
    Las enfermedades causadas por el insecto-plaga Heilipus Lauri son una de las principales causantes de los daños en los cultivos de aguacate Hass, adicionalmente reducen la calidad de los cultivos al generar problemas fitosanitarios que dificultan alcanzar el potencial exportador de este producto. Por lo cual, el presente proyecto plantea entrenar y evaluar un algoritmo de clasificación de imágenes con el uso de técnicas de aprendizaje automático, con el uso de un banco de imágenes recolectadas por Agrosavia, para la construcción de una herramienta que pueda ser usada por los pequeños y medianos productores de este fruto, que sirva para el control y monitoreo del daño causado por estas plagas. Además, se espera que este proyecto sirva como marco de referencia para futuras investigaciones en el sector agropecuario y académico en el ámbito de procesamiento y clasificación de imágenes.
  • Loading...
    Thumbnail Image
    Item
    Predicción de avistamientos de aves para la conservación de especies endémicas utilizando algoritmos de aprendizaje automático
    (Pontificia Universidad Javeriana Cali, 2025) López Arango, Paula Andrea; Escobar Martínez, María Victoria; Blandón Castaño, Juan Sebastián
    El presente proyecto muestra los resultados sobre predicción de avistamientos de aves para la conservación de especie endémicas mediante la aplicación de algoritmos de Aprendizaje de Automático. La región de América Latina y el Caribe tiene dos características que hacen que el estudio de los efectos del cambio climático sobre la biodiversidad resulte particularmente relevante: i) es una de las regiones más vulnerables frente al cambio climático y ii) es una de las regiones con mayor concentración de biodiversidad del planeta. En Colombia hay aproximadamente el 20 % de las especies de aves del planeta, convirtiéndose en el país con la mayor diversidad en este ámbito, con un número de especies registradas para el 2020 de 1954, y de las cuales 82 eran endémicas. De esta forma, se desarrolló una metodología de predicción de avistamientos de aves con el fin de aportar insumos para la conservación de especies endémicas a partir de algoritmos de ML. Los resultados de la investigación consistieron en implementar algoritmos en Python/R que aporten a la gestión de datos de avistamientos de aves, además permitiendo tratar datos georreferenciados de variables exógenas, para establecer correlaciones entre estas y datos de avistamientos de aves. El módulo de algoritmos de Modelos de Distribución de Especies permitió la identificación de áreas críticas para la conservación y el desarrollo y/o fortalecimiento del aviturismo para ciertos niveles de amenaza y departamentos específicos. Además, estos resultados llevaron a la generación de conocimiento que sirve de insumo para el desarrollo de planes de conservación y/o planificación del aviturismo en las regiones identificadas.
  • Loading...
    Thumbnail Image
    Item
    Predicción de tasa de interés y su relación con los indicadores económicos mediante Ciencia de Datos
    (Pontificia Universidad Javariana Cali, 2024) Meza Pastrana, Sebastián Javier; Arango Londoño, David
    El presente proyecto aborda la predicción de la Tasa de Intervención de Política Monetaria en Colombia, una variable crucial para la estabilidad macroeconómica y la toma de decisiones en política económica. Dada la relevancia de esta tasa para regular la liquidez, influir en las decisiones de inversión y financiamiento, y estabilizar los precios, se exploraron enfoques avanzados de predicción mediante modelos de Machine Learning, contrastándolos con un modelo econométrico tradicional de regresión lineal múltiple. La problemática identificada radica en las limitaciones de los enfoques econométricos lineales para capturar relaciones no lineales y manejar conjuntos de datos de alta dimensionalidad. Con base en esta problemática, el proyecto tuvo como objetivos principales identificar las variables macroeconómicas más relevantes, evaluar la precisión de diferentes algoritmos de Machine Learning (Ridge, Lasso, Random Forest, XGBoost y SVR) y comparar su desempeño con el modelo econométrico. Los resultados evidenciaron que los modelos de Machine Learning, en particular XGBoost y Random Forest, lograron un mejor desempeño predictivo con errores promedio más bajos (MSE de 0.11 y 0.16, respectivamente) y mayor capacidad explicativa (R² superior a 0.97 en prueba). Por otro lado, el modelo econométrico, aunque respaldado por fundamentos teóricos sólidos, se quedó corto en precisión y capacidad para capturar patrones complejos, presentando autocorrelación y heterocedasticidad en los residuos. Además, se implementaron herramientas como SHAP para mejorar la interpretabilidad de los modelos avanzados, identificando las variables macroeconómicas más influyentes en las predicciones. Este análisis integral no solo subraya la relevancia de la tasa de política monetaria para la estabilidad económica, sino que también demuestra la importancia de integrar métodos avanzados para lograr predicciones precisas y proporcionar herramientas útiles para la toma de decisiones en entornos de alta incertidumbre. Las aplicaciones de este trabajo incluyen el fortalecimiento de la planificación financiera y el diseño de políticas públicas más informadas, así como la mejora en la gestión de riesgos económicos en sectores como el financiero y el empresarial. Los hallazgos refuerzan la necesidad de métodos modernos en el análisis de variables clave para enfrentar los retos dinámicos de las economías modernas
logo-javeriana

Pontificia Universidad Javeriana Cali

Calle 18 No 118-250 Cali, Colombia

Teléfono:(+57) 602-321-82-00/602-485-64-00 - Línea gratuita nacional 01-8000-180556

Contacto repositorio Vitela: vitela@javerianacali.edu.co

  • Cookie settings
  • Privacy policy
  • End User Agreement
  • Send Feedback