Aplicación de técnicas de aprendizaje automático para la automatización de revisiones sistemáticas de literatura científica
Application of machine learning techniques for the automation of systematic reviews of scientific literature

View/ Open
Author
Torre, José de la
Director/es
Romero-Salguero, F.J.Ramírez Quesada, Aurora
Publisher
Universidad de Córdoba, UCOPressDate
2026Subject
SLRAprendizaje automático
Selección automática estudios
Clasificación asociativa
Machine learning
Automatic paper selection
Associative classification
METS:
Mostrar el registro METSPREMIS:
Mostrar el registro PREMISMetadata
Show full item recordAbstract
Las revisiones sistemáticas de literatura constituyen un tipo de estudio científico cuyo objetivo es sintetizar el conocimiento existente sobre un tema específico en un único documento, destacando por su rigurosidad y meticulosidad en la búsqueda, selección y análisis de las fuentes más relevantes. Sin embargo, esta tarea implica un considerable esfuerzo y tiempo por parte de los investigadores.
La presente tesis doctoral explora el potencial de la inteligencia artificial (IA) para automatizar diversas fases de las revisiones sistemáticas. Inicialmente, se realiza un exhaustivo análisis del estado del arte mediante la aplicación del propio proceso de revisión sistemática, con el fin de identificar las fases ya automatizadas, las técnicas de IA empleadas y el grado de intervención humana requerido.
Una hipótesis central propone que la utilización de información bibliométrica puede contribuir a mejorar la automatización de la selección de estudios relevantes. Para ello, se desarrolla un artefacto capaz de recopilar, unificar y normalizar automáticamente la información bibliométrica, generando conjuntos de datos que sirven como base para posteriores experimentos.
A partir de estos datos y del conocimiento adquirido, se diseña e implementa un modelo evolutivo de clasificación basado en reglas, denominado IRECS. Este modelo emplea gramáticas y algoritmos evolutivos para generar reglas asociativas que permiten automatizar la selección de estudios. Con las mejores reglas obtenidas, se construye un clasificador interpretable.
La propuesta IRECS se valida mediante un marco experimental riguroso, demostrando un rendimiento superior en comparación con la herramienta más avanzada del estado del arte. Los resultados confirman que el uso de información bibliométrica mejora la selección de estudios relevantes y que el modelo ofrece soluciones interpretables, facilitando la comprensión y confianza por parte de los investigadores. Systematic literature reviews are a type of scientific study aimed at synthesizing existing knowledge on a specific topic in a single document. They are characterized by their rigor and meticulousness in searching for, selecting, and analyzing the most relevant sources. However, this process demands considerable effort and time from researchers.
This doctoral thesis explores the potential of artificial intelligence (AI) to automate various phases of systematic reviews. Initially, a comprehensive analysis of the state of the art is conducted by applying the systematic review process itself, with the objective of identifying the phases that have already been automated, the AI techniques employed, and the extent of human intervention required.
A central hypothesis proposes that bibliometric information can contribute to improving the automation of the selection of relevant studies. To investigate this, an artifact capable of automatically collecting, unifying, and normalizing bibliometric data is developed, generating datasets that serve as the basis for subsequent experiments.
Based on these datasets and the acquired knowledge, an evolutionary rule-based classification model called IRECS is designed and implemented. This model uses grammars and evolutionary algorithms to generate associative rules that enable the automation of study selection. Using the best rules obtained, an interpretable classifier is built.
The IRECS proposal is validated through a rigorous experimental framework, demonstrating superior performance compared to the most advanced state-of-the-art tool. The results confirm that incorporating bibliometric information improves the selection of relevant studies and that the model offers interpretable solutions, thereby facilitating understanding and increasing confidence among researchers.
