Ingeniería de Sistemas y Computación
Permanent URI for this collection
Browse
Browsing Ingeniería de Sistemas y Computación by Author "Álvarez Vargas, Gloria Inés"
Now showing 1 - 14 of 14
Results Per Page
Sort Options
Item Agente inteligente para la elección de carrera de estudiantes de bachiller(Pontificia Universidad Javeriana Cali, 2023) Quimbayo Díaz, Dicson Ferney; Álvarez Vargas, Gloria InésEl proceso orientación vocacional consiste en la recolección de información del estudiante relacionado con sus actitudes, talentos, personalidad e intereses profesionales, esta información se analiza de forma cuantitativa por medio pruebas vocacionales; además de entrevistas que ayudan a los profesionales en orientación vocacional a darle una guía al estudiante de las posibilidades que tiene en la elección de carrera universitaria. En un país como Colombia donde solo el 39 % de los graduados de bachiller accede a educación superior, es vital la orientación vocacional. No obstante, brindar orientación vocacional a todos los bachilleres es una tarea qué requiere grandes recursos entre ellos: tiempo y capital humano que permita tener un gran alcance en las instituciones educativas de todo país. De aquí la importancia de poder aportar una forma de realizar una predicción automática de la información recolectada por el orientador vocacional desde una condición institucional a nivel nación para obtener el título de bachiller, como lo es la presentación de las pruebas saber 11. En este proyecto de grado se llevó a cabo el diseño, implementación y evaluación de un agente inteligente para predecir las posibles carreras a estudiar de un estudiante de bachillerato con la evaluación de distintas técnicas de inteligencia artificial. Al obtener los distintos modelos se realizó una evaluación del desempeño de los agentes. A partir de ello se analizaron los resultados y se obtuvo la técnica con mejor predicción de las carreras universitarias. Finalmente, se obtuvo una Accuracy de 0.62 utilizando la técnica k vecinos más cercanos sobre un dato set que corresponde solamente a las áreas de formación universitaria sin considerar los programas de nivel técnico o tecnológicoItem Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático(Pontificia Universidad Javeriana Cali, 2023) Londoño Cárdenas, Jhon Sebastián; Ortiz Morales, Luis Alberto; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésEl mercado de acciones es uno que cuenta con cierta antigüedad, es por esto que se han desarrollado y probado una gran variedad técnicas para intentar predecir el comportamiento del valor del precio de las acciones. Sin embargo, para estas predicciones se tienen en cuenta, en mayor medida, variables como el histórico del precio, dejando de lado otro tipo de información como el análisis de sentimientos. En este proyecto se quiso contribuir a la investigación sobre el aporte que puede hacer este tipo de variable menos usada en la predicción del precio de las acciones, por este motivo, se llevó a cabo una integración entre dos técnicas con diferente grado de exploración. Para la parte del análisis de sentimientos se usó un dataset de tweets de la empresa Apple al cual se le aplicó técnicas de Procesamiento de Lenguaje Natural para el preprocesa miento, 2 algoritmos de aprendizaje semi-supervisado para ayudar a etiquetar los sentimientos de todos los tweets y 3 modelos de aprendizaje automático para que pudieran etiquetar tweets nuevos, siendo este la Máquina de Soporte Vectorial. Para la parte del histórico del precio se usó un dataset de diferentes valores de las acciones de la empresa Apple, gracias al cual se en traron 3 modelos de aprendizaje automático de los cuales la LSTM tuvo los mejores resultados. Posteriormente, se integraron los sentimientos obtenidos al histórico del precio, obteniendo que el mejor modelo era el Random Forest, sin embargo, no conseguía superar al mejor modelo que únicamente usaba el histórico del precio. Con dicho modelo de Random Forest se realizaron pruebas en un mercado simulado, determinando que el uso tanto del histórico del precio como del análisis de sentimientos es posible y tiene resultados aceptables, no obstante, la estrategia de compra y venta debe examinarse con mayor rigurosidad para darle un uso a estos modelos en el mundo real.Item Apoyo en la compra y venta de acciones de la bolsa de valores estadounidense utilizando técnicas de aprendizaje por refuerzo(Pontificia Universidad Javeriana Cali, 2023) Narváez Paz, Elkin Jadier; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésEste proyecto de investigación se adentró en el desarrollo de un agente de trading basado en aprendizaje por refuerzo, con el objetivo de evaluar su desempeño en comparación con la estrategia buy-and-hold en el dinámico entorno de los mercados financieros. El problema central de esta investigación era evaluar si un agente entrenado mediante técnicas de aprendizaje por refuerzo podía navegar eficazmente por las complejidades de la compra y venta de activos, marcadas por la volatilidad del mercado, tendencias cambiantes e incertidumbres financieras. Nuestro enfoque implicó una progresión deliberada e iterativa de experimentos, comenzando con fases preliminares diseñadas para extraer información cualitativa e identificar tendencias. Estos primeros experimentos estaban limitados en términos de recursos computacionales y duración del entrenamiento, pero fueron fundamentales para dirigirnos hacia hiperparámetros óptimos y configuraciones de entrenamiento para el último experimento. Este último experimento, caracterizado por un período de entrenamiento extenso, se destaca como el punto central de nuestros hallazgos, exhibiendo la culminación de nuestros esfuerzos. Dentro de este entrenamiento extendido, el agente demostró una notable capacidad para adaptarse a las dinámicas cambiantes del mercado, lo que se tradujo en un desempeño que compite favorablemente con la estrategia buy-and-hold. Estos resultados destacan la adaptabilidad y las capacidades de aprendizaje del agente en el contexto de compra y venta de activos, revelando su potencial para su aplicación práctica en los mercados financieros reales. En conclusión, esta investigación arroja luz sobre la promesa del aprendizaje por refuerzo en el trading, enfatizando la importancia de un enfoque sistemático para la experimentación y dejando el camino para futuros refinamientos destinados a mejorar la robustez del modelo para aplicaciones financieras del mundo real.Item Desarrollo de un modelo de aprendizaje automático no supervisado para seleccionar noticias relevantes(Pontificia Universidad Javeriana Cali, 2024) Hernández Saavedra, Juan Camilo; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésLa forma en que las personas se informan ha evolucionado constantemente con la proliferación de la tecnología. La mayoría de todos los medios de comunicación han abandonado parcialmente sus formatos físicos para adaptarse al mundo digital, más precisamente al entorno web. Este cambio ha llevado a un gran aumento en el número de lectores, generando beneficios tanto a los noticieros como a los lectores. Uno de los tantos beneficios que podemos encontrar es la facilidad y la rapidez con la que la información es llevada a los lectores, permitiéndoles acceder a las noticias en el lugar y momento que quieran con solo hacer un par de clics. Aunque inicialmente los beneficios eran evidentes, con el tiempo surgieron desafíos que han afectado a los medios de comunicación que publican noticias en formato web. Entre los problemas más comunes podemos encontrar la combinación de noticias irrelevantes con noticias relevantes para el lector, lo cual puede influir en el pensamiento e interés que ellos reciben durante sucesos importantes, teniendo en cuenta que las noticias, al tener una gran influencia en la percepción y toma de decisiones en la población, son una parte fundamental de la sociedad. En este trabajo se presentó una solución haciendo uso de modelos de aprendizaje automático no supervisado, representación de textos haciendo uso de técnicas del procesamiento del lenguaje natural, junto con una estrategia que consiste en obtener noticias de varios portales web de noticias. Si una noticia aparece dentro de varios portales, es considerada relevante. Esto se logra gracias a los modelos de representación de textos que permiten extraer el sentido y contexto de un titular, para posteriormente ser agrupados haciendo uso de modelos de clustering. Por último, estos modelos de clustering son ajustados haciendo uso de búsqueda de hiperparámetros, permitiendo obtener su mayor precisión posible. Finalmente, se logró construir dos modelos de clustering que, haciendo uso de modelos, representación de texto, técnicas de procesamiento del lenguaje natural y búsqueda de hiperparámetros para ajustar al máximo su precisión, son capaces de discernir qué noticias son relevantes de un grupo de noticias. Para demostrar el funcionamiento, se diseñó un pequeño prototipo de portal web de noticias, que contiene estos modelos de clustering en funcionamiento.Item Diseño de un aplicativo para el análisis de sentimiento de reseñas de películas(Pontificia Universidad Javeriana Cali, 2024) Giraldo Mosquera, Juan Pablo; Álvarez Vargas, Gloria InésLas plataformas en línea han permitido que los individuos puedan compartir sus experiencias y opiniones sobre todo tipo de productos y servicios del mercado a nivel global. Esta información se convierte en un recurso de gran valor para las empresas siempre que éstas puedan identificar el sentimiento de sus consumidores sobre los productos y/o servicios que ofrecen. Es por eso que esta tarea representa uno de los intereses principales en la actualidad a nivel comercial. En el presente trabajo de grado se evaluará el desempeño de tres modelos de clasificación para la identificación del sentimiento de textos extraídos de reseñas de películas de la plataforma IMDB. En donde se seleccionará el más prometedor de ellos para la posterior implementación de una aplicación que permita a los usuarios aprovechar dicho modelo.Item Generador de resúmenes para términos y condiciones de servicios(Pontificia Universidad Javeriana Cali, 2021) Cardona Gil, Esteban; Álvarez Vargas, Gloria InésLos términos y condiciones son textos que contienen información sobre los compromisos y las limitaciones que la empresa y el usuario aceptan para ofrecer y recibir, respectivamente, los productos o servicios. Sin embargo, es bien sabido que muy pocas personas leen esto debido a la longitud de estos documentos y el lenguaje formal que suele llegar a utilizarse. Hay muchos aspectos en estos documentos que consideramos que los usuarios deberían conocer para determinar si verdaderamente están dispuestos a utilizar esos servicios o si prefieren buscar otra alternativa. En este documento se propone una solución a esta problemática desde un contexto regional, creando un sistema para generar resúmenes extractivos de textos de términos y condiciones en español utilizando métodos basados en la frecuencia de las palabras.Item Machine learning with data augmentation to predict glucantime effectiveness against cutaneous leishmaniasis(Pontificia Universidad Javeriana Cali, 2021) Hoyos Urcué, Juan José; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEnfrentar problemas de análisis de datos en pequeños conjuntos de datos es un problema común en la investigación médica; asimismo, es un problema que dificulta mucho la aplicación y el éxito de los algoritmos clásicos de aprendizaje automático. Muchas técnicas han abordado el problema de un pequeño conjunto de datos, principalmente para los campos de visión artificial y procesamiento de imágenes. Sin embargo, para los datos tabulares, se ha difundido muy poco. En este trabajo de grado se propone el uso de técnicas de aumento de datos tabulares para introducir instancias sintéticas bastante similares a las reales, particularmente en el contexto de un problema médico/social de predecir la efectividad de Glucantime como tratamiento contra la Leishmaniasis cutánea. Los experimentos muestran que el uso de estos algoritmos de aumento de datos mejora las características del conjunto de datos inicial y el rendimiento de los modelos de aprendizaje automático. El conjunto de datos utilizado en esta investigación tiene diez atributos y 18 registros.Item Modelo de red neuronal convolucional para la traducción de gestos en lenguaje de señas colombiano a texto enfocado en el sector hotelero colombiano(Pontificia Universidad Javeriana Cali, 2023) Naranjo Astaiza, Nicolle Dayana; Suárez Peña, María José; Linares Ospina, Diego Luis ; Álvarez Vargas, Gloria InésEl objetivo principal de este proyecto es apoyar a las personas con discapacidad sensorial auditiva, permitiéndoles llevar a cabo acciones básicas en entornos donde el personal no está debidamente capacitado para ofrecer una atención totalmente adecuada, como suele ser en el sector hotelero colombiano. Por lo tanto, es cada vez más necesario el desarrollo de una herramienta computacional capaz de reconocer y traducir gestos manuales del lenguaje de señas colombiano (LSC) a texto. Esta herramienta no solo busca cubrir una necesidad real en la sociedad, sino que también permitirá una atención inclusiva y una experiencia positiva para todos los involucrados. Los resultados obtenidos de este proyecto demuestran de manera concluyente la funcionalidad de la herramienta desarrollada. La identificación de los datos es efectiva, y la traducción a texto es precisa. La herramienta es capaz de reconocer los gestos manuales del LSC de acuerdo con el corpus utilizado.Item Predicción de avalúos catastrales en el municipio de Dagua, Valle del Cauca, utilizando modelos de aprendizaje automático(Pontificia Universidad Javariana Cali, 2025) Marín Ochoa, Juan José; Hurtado Gonzáles, Estefanía; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEl avalúo catastral es un elemento clave en la gestión territorial, utilizado para calcular impuestos prediales y proporcionar información sobre el valor de las propiedades. En el municipio de Dagua, Valle del Cauca, el proceso de valoración catastral enfrenta retos relacionados con la falta de sistematización de datos y la dependencia de métodos manuales, lo que limita su precisión y actualización. Este trabajo desarrolla un modelo predictivo basado en técnicas de aprendizaje automático para mejorar la estimación de avalúos catastrales. Durante la investigación, se evaluaron ocho modelos supervisados, entre ellos Random Forest, K-Nearest Neighbors, Gradient Boosting Machines y Redes Neuronales, siendo Random Forest seleccionado por su desempeño destacado, con un coeficiente de determinación (R²) del 87,15 \% y métricas de error más bajas en comparación con los demás. El desarrollo metodológico incluyó la preparación de los datos, selección de características relevantes como el área del terreno, la zona geoeconómica y la manzana/vereda, y la optimización de hiperparámetros. Además, se implementó una interfaz gráfica diseñada para usuarios especializados, como funcionarios o técnicos en gestión catastral, quienes cuentan con acceso a la información requerida. Esta interfaz solicita datos específicos necesarios para realizar predicciones precisas, tales como características físicas del predio y su ubicación, asegurando así que las estimaciones sean útiles y relevantes en su contexto profesional. Los resultados muestran que la integración de aprendizaje automático en la valoración catastral puede mejorar la precisión y eficiencia del proceso, específicamente, el modelo Random Forest destacó por su desempeño en comparación con otros modelos evaluados. con un error absoluto medio (MAE) de 14.5M el modelo alcanzó un coeficiente de determinación (R²) de 87.15\%, indicando una alta capacidad para explicar la variabilidad de los valores catastrales en el conjunto de prueba, proporcionando un enfoque práctico y replicable en otros contextos territoriales.Item Predicción del desenlace terapéutico de la leishmaniasis utilizando aprendizaje automático sobre SNPs(Pontificia Universidad Javeriana Cali, 2023) Bertín Sánchez, Alvaro José; Caicedo Rojas, Santiago; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisEl aprendizaje automático ha permitido avances significativos en el campo de la medicina, especialmente en la predicción del resultado del tratamiento de enfermedades. Este estudio de caso explora modelos y técnicas de aprendizaje automático para predecir el éxito o el fracaso del tratamiento de la leishmaniasis basándose en polimorfismos de nucleótido único (SNPs) en secuencias de ADN. Esto es crucial porque el tratamiento de la leishmaniasis puede tener efectos adversos para el cuerpo humano, lo que hace esencial predecir si los individuos con leishmaniasis deben someterse al tratamiento. Se emplearon técnicas de aprendizaje automático no supervisado para la selección de los SNPs más significativos. Posteriormente, se utilizaron técnicas de aprendizaje supervisado para la predicción y se evaluó el rendimiento del modelo. Este enfoque integral tiene como objetivo determinar la eficacia del tratamiento de la leishmaniasis y si los individuos deben o no someterse al régimen prescrito.Item Predicción del precio de acciones de la bolsa estadounidense utilizando técnicas de aprendizaje automático basadas en datos de análisis técnico y fundamental(Pontificia Universidad Javeriana Cali, 2022) García Gallego, Jeffrey Steven; Gutiérrez Uribe, Jose David; Linares Ospina, Diego Luis; Álvarez Vargas, Gloria InésLa predicción de acciones de la bolsa de valores ha sido una actividad que se ha venido realizando de distintas maneras desde la aparición de los mercados de acciones. En la actualidad, con la presente tendencia de la aplicación del aprendizaje automático en distintos campos, se avanza en la investigación de modelos de aprendizaje automático, atributos a tener en cuenta y datos utilizados para realizar una predicción sobre el precio o la volatilidad de una acción en específico. En lo que respecta a los datos utilizados, actualmente, los principales son los datos basados en análisis técnico, análisis fundamental y análisis de sentimientos. Según la literatura, la mayor parte de los estudios e investigaciones en este campo se basan en datos de análisis técnico. Por lo tanto, en este proyecto se buscó explorar el comportamiento de distintas técnicas de aprendizaje automático basadas en datos de análisis técnico y análisis fundamental utilizando un conjunto de acciones de la bolsa de valores estadounidense, pertenecientes a uno de los índices más importantes el S&P 500. También se exploraron distintos métodos como Análisis de Componentes Principales (PCA por sus siglas en ingles), ventana deslizante y una selección de atributos a través de la literatura. En este estudio se pusieron a prueba estos modelos a través de métricas como la del Error Cuadrático Medio y el Error Absoluto Medio. Estos modelos se sometieron a una prueba que simula una situación real de inversión conocida como backtesting, en el cual se hace uso de la estrategia de comprar bajo y vender alto. Se encontró que la técnica que presentó menor error para análisis técnico fue SVR y para análisis fundamental fue MLP. Sin embargo, en backtesting RF fue la que mayores beneficios obtuvo tanto para análisis técnico como para análisis fundamental. Se plantea que posiblemente las métricas de error en la predicción del precio de una acción no resultan lo suficientemente expresivas como para determinar el desempeño de un modelo en una situación real.Item Predicción del tratamiento para la leishmaniasis cutánea mediante datos génicos e inferencia gramatical(Pontificia Universidad Javeriana Cali, 2021) Peña Atencio, Josue; Álvarez Vargas, Gloria Inés; Linares Ospina, Diego LuisLa leishmaniasis es una enfermedad parasitaria usualmente transmitida por moscas de arena infectadas que suelen vivir en ambientes tropicales. La forma más común de leishmaniasis en Colombia es la leishmaniasis cutánea, la cual provoca úlceras en la piel. Para esta forma, el tratamiento actual mediante el medicamento Glucantime tiene un porcentaje de fracaso que varía entre el 19% y el 81%. Colombia y otros países afectados tienen poco interés en esta enfermedad que está profundamente relacionada con la pobreza, y no cuentan con el conocimiento médico para garantizar un tratamiento completamente seguro. La dificultad para tratar la enfermedad radica en la compleja interacción entre el parásito y el sistema inmunológico, el cual está relacionado con el estado de expresión génica de cada paciente En el presente trabajo, se hace uso de 7 conjuntos de datos provistos por el CIDEIM de Cali, los cuales recolectan la información de expresión génica de tres tipos de glóbulos blancos provenientes de 14 pacientes de leishmaniasis anónimos antes, durante y después del tratamiento para la enfermedad. Se utilizan dos algoritmos de inferencia gramatical llamados OIL y RPNI [6] para predecir el posible resultado del tratamiento y así ayudar a prevenir la falla y complicaciones del mismo o para establecer un tratamiento alternativo más adecuado. Estas técnicas han sido aplicadas con éxito en los campos como la biología computacional y el procesamiento del lenguaje natural [7]. Se realizan 54 experimentos para OIL y 54 experimentos para RPNI; en cada uno los experimentos cada algoritmo se entrena y evalúa mediante una validación cruzada 4 iteraciones. Se usan las métricas Accuracy, Precision, Recall y F1-Score para la evaluación. Se llegó a resultados satisfactorios en el trabajo, logrando en múltiples experimentos una tasa muy competitiva del 90% de Accuracy para RPNI y 68.8% de Accuracy para OIL.Item Técnicas de clustering aplicadas en un conjunto metabolitos perteneciente a pacientes de Leishmaniasis cutánea para predecir la efectividad del tratamiento glucantime a través de modelos de aprendizaje automático clásicos(Pontificia Universidad Javeriana Cali, 2023) Luna Mejía, Juan Pablo; Sadeghian Perskie, Naim Samuel; Linares Ospina, Diego Luis ; Álvarez Vargas, Gloria InésLos medicamentos usados para el tratamiento de la leishmaniasis pueden ser tóxicos y detrimentales para la salud. Peor aún, estos tratamientos no prometen curar al paciente en todos los casos. Para evitar recetar estos tratamientos a pacientes a quienes no van a recibir beneficios, se han hecho varios estudios [4][7] para tratar de predecir, por medio de muestras de metabolitos en la sangre, en qué pacientes el tratamiento será efectivo. En este proyecto se hizo una continuación de estos estudios, basados en los mismos datos usados. Estos datos observaron 535 atributos/metabolitos para solo 36 pacientes. El grueso de este proyecto estaba en reducir la dimensionalidad del conjunto de datos (2 a 5 metabolitos) y poder llegar a resultados cercanos o mejores a los ya existentes. Se entrenaron 4 diferentes modelos de clustering para encontrar posibles grupos y de cada uno escoger un representante. Para cada modelo se buscaron los parámetros los cuales llegaban a clusters con un mejor grado de separación. En la fase de escoger los representantes de cada cluster se usaron diferentes métricas como: cercanía al centro del cluster, o probabilidad de ser miembro del cluster, para decidir cuáles podrían ser los mejores representantes. Después de tener los representantes de cada grupo, se pasó a la fase de predicción, donde se observó qué tan buena era la predicción con este pequeño conjunto de atributos. Finalmente se llegó a un modelo con 3 metabolitos y un puntaje f1 de 0.82 el cual fue muy prometedor para una forma de reducción de la dimensionalidad tan particular y descriptiva como lo es ella selección por representantes de un agrupamiento.Item Técnicas de ensamble aplicadas a un conjunto de datos perteneciente a pacientes de leishmaniasis cutánea para predecir la efectividad del tratamiento Glucantime(Pontificia Universidad Javeriana Cali, 2021) Camacho Calderon, Katherine; Álvarez Vargas, Gloria Inés ; Linares Ospina, Diego LuisLa leishmaniasis es una enfermedad reemergente en Colombia. Catalogada por la Organización Mundial de la Salud como “enfermedad olvidada”, debido a que está asociada directamente con las personas que viven en regiones muy pobres. Por lo tanto, existe poco interés en invertir en el desarrollo de medicamentos y estrategias para controlar esta enfermedad. El glucantime es uno de los medicamentos usados para tratar la leishmaniasis cutánea, la cual ha sido una enfermedad reemergente en Colombia. La forma de administrar este medicamento en algunas ocasiones ha causado mucho dolor y el hecho de usarlo trae la posibilidad de causar efectos colaterales. El anterior panorama ha sido de inspiración para desarrollar modelos de aprendizaje automático que permitan predecir el desenlace terapéutico del tratamiento glucantime. Con este proyecto se obtuvieron cuatro modelos de aprendizaje automático, donde inicialmente se realizó́ un proceso de preparación de los datos, y luego con ayuda de las técnicas de ensamble se construyeron dichos modelos. Se realizaron evaluaciones de los distintos modelos construidos y se permitió inferir que ningún modelo presentó un desempeño que permita confiar en sus predicciones, esto dado que la cantidad de datos no fue suficiente para que los modelos construyeran hipótesis fuertes. Sin embargo, la técnica que permitió obtener el modelo con el mejor desempeño indica que probablemente con una cantidad mayor de datos se puedan obtener mejores predicciones. CIDEIM (Centro Internacional de Entrenamiento e Investigaciones Médicas) fue el ente que proporcionó el conjunto de datos con el cual se construyeron los modelos.