Identificación de lenguaje ofensivo en mensajes de texto, utilizando técnicas de aprendizaje automático

dc.contributor.advisorPabón Burbano, María Constanza
dc.contributor.authorOcampo Morales, Kevin Steven
dc.contributor.authorArango Salazar, Juan Sebastian
dc.date.accessioned2024-06-18T00:52:31Z
dc.date.available2024-06-18T00:52:31Z
dc.date.issued2023
dc.description.abstractEste proyecto de investigación se centró en el estudio y desarrollo de modelos de aprendizaje automático supervisado, incluyendo variantes de Naive Bayes, máquinas de soporte vectorial y redes neuronales convolucionales, con el propósito de identificar y clasificar tweets como ofensivos o no ofensivos. A lo largo de esta investigación, se siguieron varios pasos fundamentales que desempeñaron un papel importante en la creación de los modelos finales. Los diversos procesos experimentales desarrollados a lo largo de la investigación arrojaron resultados de relevancia. Inicialmente, se implementaron modelos base predeterminados disponibles en las librerías. A medida que avanzábamos e iteramos, además de la constante incorporación de métodos y técnicas más avanzadas que permitían enriquecer y perfeccionar los modelos. Al concluir la investigación tanto los modelos de Naive Bayes, junto con el modelo de máquinas de soporte vectorial, arrojaron resultados excelentes durante las fases de entrenamiento, pero al momento de comprobar con la fase de prueba los resultados fueron deficientes. A pesar de implementar diversas estrategias, métodos y técnicas para mejorar su eficacia en el proceso de la clasificación de tweets, no se logró un desempeño satisfactorio debido a problemas de sobreajuste. Además, el modelo de redes neuronales, junto con las técnicas implementadas para optimizar su rendimiento, demostró ser efectivo al proporcionar resultados satisfactorios. En resumen, este estudio facilitó la exploración de diversos métodos y técnicas en el desarrollo de modelos de clasificación, destacando la relevancia de la iteración continua para el constante perfeccionamiento de la investigación.
dc.description.abstractengSocial networks are digital applications or platforms that allow the exchange of information between individuals, the creation of communities, sites of expression, among others. Thanks to them, people have a means to share their ideas or opinions on a particular topic, thus exercising their universal right to free expression. These include websites such as Twitter, where users can express themselves through text, audiovisual content, images or emojis. Due to the freedom they offer, the anonymity and the increasingly marked polarization in society, they give rise to the use of offensive language and toxic or negative content that some subjects generate towards others with the inten tion of offending, hurting or discriminating. This is why sentiment analysis, in conjunction with machine learning, is presented as an area of study and a very useful tool to detect and counteract this problem. Techniques are used to determine the type of intention that has the content shared by people in this social network, distinguishing between positive or negative. In particular, our project seeks, through the use of this previously mentioned system, to develop models that allow classifying text messages coming from Twitter (tweets) into offensive and non-offensive, using sentiment analysis.
dc.format.extent59 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://vitela.javerianacali.edu.co/handle/11522/2855
dc.language.isospa
dc.publisherPontificia Universidad Javeriana Cali
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectRedes sociales
dc.subjectLibertad de expresión
dc.subjectLenguaje ofensivo
dc.subjectAnálisis de sentimientos
dc.subjectAprendizaje automático
dc.subjectClasificación
dc.thesis.disciplineFacultad de Ingeniería y Ciencias. Ingeniería de Sistemas y Computación
dc.thesis.grantorPontificia Universidad Javeriana Cali
dc.thesis.levelPregrado
dc.thesis.nameIngeniero(a)de Sistemas y Computación
dc.titleIdentificación de lenguaje ofensivo en mensajes de texto, utilizando técnicas de aprendizaje automáticospa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dc.type.redcolhttps://purl.org/redcol/resource_type/TP
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
Identificación_lenguaje_ofensivo.pdf.pdf
Size:
1.46 MB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
Articulo_cientifico.pdf
Size:
144.59 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Licencia_autorizacion.pdf
Size:
739.42 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: