Desarrollo de una herramienta para la detección y clasificación del grado de ambigüedad en requisitos de software mediante el uso de técnicas de inteligencia artificial

Loading...
Thumbnail Image
Date
2021
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Javeriana Cali
Abstract
El presente trabajo de grado propone el uso de técnicas de aprendizaje supervisado y supervisión débil para realizar la clasificación en tres grados de ambigüedad (baja, moderada y alta), de requisitos de software redactados en lenguaje natural. El conjunto de datos preparado contiene 5.291 requisitos redactados en inglés, que son etiquetados de acuerdo a su ambigüedad sintáctica usando el analizador de link grammar. Se evalúa el desempeño de la clasificación con diferentes modelos de aprendiza je automático que incluyen random forest y redes neuronales convolucionales, entre otros. Los mejores resultados se obtienen con los modelos de redes neuronales recurrentes LSTM y GRU, con un F1-Score de 80 % en la clase ambigüedad baja, 62 % en la clase ambigüedad moderada y 75 % en la clase ambigüedad alta, y un accuracy entre 69 % y 71 % de clasificaciones correctas del grado de ambigüedad.
Description
item.page.descriptioneng
The present work proposes the use of supervised learning techniques and weak supervision to classify three levels of ambiguity (low, moderate and high) in software requirements written in natural language. The prepared dataset contains 5.291 soft ware requirements in English, that are labeled according to their syntactic ambiguity using the link grammar parser. The classification performance of different learning models is evaluated, including random forest and convolutional neural networks. The best results are obtained using LSTM and GRU recurrent neural networks, with a F1-Score of 80 % in the low ambiguity class, 62 % in the moderate ambiguity class and 75 % in the high ambiguity class, and an accuracy between 69 % and 71 % of correct classifications of the level of ambiguity.
Keywords
Citation