¿Qué es un corpus?
1. Corpus
Es el recurso básico para la investigación en lingüística de corpus y el principal recurso para los métodos empíricos de investigación del lenguaje. Se puede utilizar para lexicografía, enseñanza de idiomas, investigación de idiomas tradicionales, estudios estadísticos o basados en casos en el procesamiento del lenguaje natural, y más.
2. Clasificación de corpus
Heterogéneos, homogéneos, sistemáticos y especiales.
3. Características del corpus
El corpus contiene materiales lingüísticos que realmente han aparecido en el uso real del lenguaje, por lo que la biblioteca de oraciones de ejemplo no debe contarse como un corpus. El corpus es un recurso básico que conlleva conocimiento del lenguaje, pero no es igual al conocimiento del lenguaje; el corpus real necesita ser procesado (analizado) antes de que pueda convertirse en un recurso útil.