A corpus-based study of 4-grams in the research article genre

View/ Open
Author
Jiménez Navarro, Eva Lucía
Date
2022Subject
Corpus especializado, 4-grama, función, artículo científico, estructuraMETS:
Mostrar el registro METSPREMIS:
Mostrar el registro PREMISMetadata
Show full item recordAbstract
El análisis de la fraseología en el discurso especializado de la ciencia ha despertado el interés de los/as investigadores/as en las últimas décadas, probablemente porque el uso de grupos de palabras en registros específicos puede informar de algunas características típicas del género. Por ejemplo, Gledhill (2009) explora las coligaciones de tiempos verbales en artículos científicos y descubre que el tiempo presente se usa para expresiones cualitativas y empíricas, mientras que el tiempo pasado proporciona descripciones cuantitativas y orientadas a la investigación; Pérez-Llantada (2014) investiga grupos léxicos de 4 palabras en artículos de investigación y descubre que estas combinaciones multilexémicas expresan significado referencial y organizan el texto; finalmente, Jiménez-Navarro (2019) analiza colocaciones de adjetivo + sustantivo en un corpus de artículos científicos y concluye que estas unidades fraseológicas aportan significados específicos cuando se usan en este género, puesto que representan los contenidos del artículo de investigación.
El objetivo de este estudio es contribuir al análisis de 4-gramas en el lenguaje de la ciencia. Para ello, se han definido dos objetivos específicos: en primer lugar, establecer la estructura de estas secuencias de palabras; en segundo lugar, analizar su función. La metodología empleada se basó en corpus y conllevó cinco pasos principales: (1) la construcción de un corpus especializado de artículos científicos, (2) la extracción de una lista de 4-gramas de manera automática usando el software Sketch Engine, (3) la verificación manual de esa lista para eliminar candidatos inadecuados, (4) la clasificación de las unidades seleccionadas dependiendo de su estructura, y (5) la categorización de las unidades seleccionadas según su función en el texto. Los resultados muestran que, con respecto al primer objetivo, los 4-gramas más típicos fueron sintagmas nominales; en relación con el segundo objetivo, las secuencias examinadas trataban principalmente con la investigación llevada a cabo y la autoría del texto. En conjunto, podemos decir que estas estructuras eran específicas del género estudiado, aunque también podrían ser usadas en otros dominios.