Colección de citas famosas - Colección de firmas - Cómo hacer minería de texto, propósito de la minería de texto, minería web y propósito.

Cómo hacer minería de texto, propósito de la minería de texto, minería web y propósito.

1. Definición de minería de texto

La minería de texto se refiere a la obtención de información y conocimientos valiosos a partir de datos de texto. Es un método de minería de datos. La aplicación más importante y básica en la minería de textos es lograr la clasificación y agrupación de textos. El primero es un algoritmo de minería supervisado y el segundo es un algoritmo de minería no supervisado.

2. Pasos de la minería de texto

1) Leer la base de datos o el archivo de texto externo local.

2) Segmentación de texto

2.1) Diccionario personalizado

2.2) Palabras vacías personalizadas

2.3) Segmentación de palabras

2.4) La recuperación de qué palabras son inexactas y qué palabras no tienen sentido requiere los pasos 2.1, 2.2 y 2.3.

3) Cree una matriz de entrada de documento y conviértala en un marco de datos.

4) Establecer modelos estadísticos y de minería del data frame.

5) Comentarios sobre los resultados

En tercer lugar, las herramientas necesarias para la minería de texto

La minería de texto se implementará utilizando el lenguaje R y es necesario cargar varios paquetes de R. Son respectivamente el paquete tm, el paquete tmcn, el paquete Rwordseg y el paquete wordcloud.

Cuarto, combate real

El conjunto de datos utilizado en este artículo proviene de datos del laboratorio de Sogou.