¿Las ocho mejores herramientas de minería de código abierto para centros de datos?
1. Weka
Como plataforma de minería de datos abierta, WEKA ha reunido una gran cantidad de algoritmos de aprendizaje automático que pueden realizar tareas de minería de datos en la nueva interfaz interactiva, incluido el preprocesamiento de datos. Clasificación, regresión, clustering, reglas de asociación y visualización.
2. RapidMiner
RapidMiner es la solución de minería de datos líder en el mundo y utiliza tecnología avanzada en gran medida. Sus tareas de minería de datos cubren una amplia gama, incluidas diversas artes de datos, que pueden simplificar el diseño y la evaluación de los procesos de minería de datos.
3. Orange
Orange es un paquete de software de aprendizaje automático y minería de datos basado en componentes. Su función es un front-end de programación visual amigable, potente, rápido y versátil para el análisis y visualización de datos de navegación. Python une los conceptos básicos del desarrollo de scripts. Contiene un conjunto completo de componentes de preprocesamiento de datos y proporciona funciones de contabilidad, transformación, modelado, evaluación de modelos y exploración de datos. Está desarrollado en C++ y Python, y su biblioteca de gráficos se desarrolla utilizando el marco Qt multiplataforma.
4. Knime
KNIME (KonstanzInformationMiner) es una plataforma de código abierto fácil de usar, inteligente y bien desarrollada para la integración, el procesamiento, el análisis y la exploración de datos.
5. Ingeniería
JHepWork es un marco completo de análisis de datos científicos orientado a objetos. Las macros Jython se utilizan para mostrar datos de histogramas unidimensionales y bidimensionales. El programa incluye muchas herramientas para interactuar con gráficos científicos bidimensionales y tridimensionales.
6. Apache Mahout
Apache Mahout es un nuevo proyecto de código abierto desarrollado por Apache Software Foundation (ASF). Su objetivo principal es crear algunos algoritmos de aprendizaje automático escalables que los desarrolladores puedan utilizar libremente bajo la licencia Apache. El proyecto se encuentra en su segundo año de desarrollo y actualmente solo cuenta con una versión pública. Mahout contiene muchas implementaciones, incluidos programas de agrupación, clasificación, CP y evolución. Además, Mahout se puede escalar eficientemente a la nube utilizando la biblioteca Apache Hadoop.
Elki
elki (entorno de desarrollo de aplicaciones gkdd compatible con estructuras de índice) se utiliza principalmente para agrupar y descubrir valores atípicos. ELKI es una plataforma de minería de datos similar a Weka, escrita en Java y tiene una interfaz gráfica GUI. Se puede utilizar para encontrar valores atípicos.