dc.contributor.author | González Fernández, Adela | |
dc.date.accessioned | 2019-11-15T13:09:53Z | |
dc.date.available | 2019-11-15T13:09:53Z | |
dc.date.issued | 2018 | |
dc.identifier.issn | 2255-3703 | |
dc.identifier.uri | http://hdl.handle.net/10396/19125 | |
dc.description.abstract | La unión entre la Informática y de la Lingüística es cada vez más frecuente en las investigaciones en el campo del lenguaje y de las lenguas. La Lingüística de corpus, en especial, se está viendo beneficiada por este emparejamiento, gracias a los avances a la hora de gestionar y procesar los corpora. En este trabajo damos un paso más y proponemos el trabajo en Lingüística de corpus a través de big data, en general, y de Twitter, en particular. Gracias a la creación de una herramienta informática diseñada específicamente para el trabajo lingüístico en big data, obtendremos una inmensa cantidad de información textual que nos servirá para la compilación de corpora mediante los que estudiaremos la diversidad léxica en el lenguaje de cuatro escritores españoles. Para ello, extraeremos los tuits publicados por ellos en sus cuentas de Twitter y los procesaremos a través de nuestra herramienta para obtener la información deseada. Intentaremos demostrar, también, la mejora que esta nueva metodología supone en este tipo de estudios. | es_ES |
dc.description.abstract | The merger of Computer Sciences and Linguistics is increasingly common in researches in the field of languages. Corpus linguistics, specially, is benefiting from this matching, due to the improvements in management and processing of corpora. In this work we go one step further and suggest working in Corpus linguistics with big data, in general, and Twitter, in particular. Thanks to the development of a software specifically designed for linguistic work with big data, we will obtain a vast amount of information which will be used to compile linguistic corpora through which we will study the lexical density in four Spanish writers. In order to do that, we will obtain the tweets published by them in their Twitter accounts and we will process them with our software tool. We also aim to prove the benefits that this methodology implies in this kind of research. | es_ES |
dc.format.mimetype | application/pdf | es_ES |
dc.language.iso | spa | es_ES |
dc.publisher | UCOPress | es_ES |
dc.rights | https://creativecommons.org/licenses/by/3.0/ | es_ES |
dc.source | Skopos 9, 107-122 (2018) | es_ES |
dc.subject | Lingüística de corpus | es_ES |
dc.subject | Densidad léxica | es_ES |
dc.subject | Diversidad léxica | es_ES |
dc.subject | Big Data | es_ES |
dc.subject | Twitter | es_ES |
dc.subject | Corpus linguistics | es_ES |
dc.subject | Lexical density | es_ES |
dc.subject | Lexical diversity | es_ES |
dc.title | Big data y corpus lingüísticos para el estudio de la densidad léxica | es_ES |
dc.title.alternative | Big data and linguistic corpora as a tool for the study of lexical density | es_ES |
dc.type | info:eu-repo/semantics/article | es_ES |
dc.relation.publisherversion | https://www.uco.es/ucopress/ojs/index.php/skopos/index | es_ES |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | es_ES |