¿Qué es la minería de datos?
La minería de datos es el proceso de extraer de grandes cantidades de datos incompletos, ruidosos, borrosos y aleatorios información oculta que las personas no conocen de antemano pero que es un proceso de conocimiento potencialmente útil.
Proceso de minería de datos:
Defina el problema: defina claramente el problema empresarial y determine el propósito de la minería de datos.
Preparación de datos: la preparación de datos incluye: selección de datos: extracción de conjuntos de datos de destino para extracción de datos en grandes bases de datos y objetivos de almacenamiento de datos, preprocesamiento de datos: reprocesamiento de datos, incluida la verificación de la integridad y la coherencia de los datos, eliminación de ruido y llenado; en campos faltantes, borrando datos no válidos, etc.
Minería de datos: seleccione el algoritmo correspondiente según el tipo de función de datos y las características de los datos, y realice la minería de datos en el conjunto de datos purificados y convertidos.
Análisis de resultados: interpretar y evaluar los resultados de la minería de datos, y convertirlos en conocimiento que finalmente pueda ser entendido por los usuarios.
La tecnología de minería de datos se puede dividir a grandes rasgos en: métodos estadísticos, métodos de aprendizaje automático, métodos de redes neuronales y métodos de bases de datos. Los métodos estadísticos se pueden subdividir en: análisis de regresión (regresión múltiple, autorregresión, etc.), análisis discriminante (discriminante bayesiano, CBR, algoritmo genético, red de creencias bayesianas, etc.). Los métodos de redes neuronales se pueden subdividir en: redes neuronales directas (). Algoritmo BP, etc.), redes neuronales autoorganizadas (mapeo de características autoorganizadas, aprendizaje competitivo, etc.), etc. Los métodos de bases de datos se basan principalmente en análisis de datos visuales multidimensionales o métodos OLAP, y también existen atributos. Métodos de inducción orientados.