¿Qué es un corpus?

El corpus almacena materiales lingüísticos que realmente aparecen en el uso real del lenguaje.

1. Corpus

Es el recurso básico para la investigación en lingüística de corpus y el principal recurso para los métodos empíricos de investigación del lenguaje. Se puede utilizar para lexicografía, enseñanza de idiomas, investigación de idiomas tradicionales, estudios estadísticos o basados ​​en casos en el procesamiento del lenguaje natural, y más.

2. Clasificación de corpus

Heterogéneos, homogéneos, sistemáticos y especiales.

3. Características del corpus

El corpus contiene materiales lingüísticos que realmente han aparecido en el uso real del lenguaje, por lo que la biblioteca de oraciones de ejemplo no debe contarse como un corpus. El corpus es un recurso básico que conlleva conocimiento del lenguaje, pero no es igual al conocimiento del lenguaje; el corpus real necesita ser procesado (analizado) antes de que pueda convertirse en un recurso útil.