Cómo hacer minería de texto, propósito de la minería de texto, minería web y propósito.
La minería de texto se refiere a la obtención de información y conocimientos valiosos a partir de datos de texto. Es un método de minería de datos. La aplicación más importante y básica en la minería de textos es lograr la clasificación y agrupación de textos. El primero es un algoritmo de minería supervisado y el segundo es un algoritmo de minería no supervisado.
2. Pasos de la minería de texto
1) Leer la base de datos o el archivo de texto externo local.
2) Segmentación de texto
2.1) Diccionario personalizado
2.2) Palabras vacías personalizadas
2.3) Segmentación de palabras
2.4) La recuperación de qué palabras son inexactas y qué palabras no tienen sentido requiere los pasos 2.1, 2.2 y 2.3.
3) Cree una matriz de entrada de documento y conviértala en un marco de datos.
4) Establecer modelos estadísticos y de minería del data frame.
5) Comentarios sobre los resultados
En tercer lugar, las herramientas necesarias para la minería de texto
La minería de texto se implementará utilizando el lenguaje R y es necesario cargar varios paquetes de R. Son respectivamente el paquete tm, el paquete tmcn, el paquete Rwordseg y el paquete wordcloud.
Cuarto, combate real
El conjunto de datos utilizado en este artículo proviene de datos del laboratorio de Sogou.