Colección de citas famosas - Slogan de motivación - ¿Puede clickhouse reemplazar a Hive?

¿Puede clickhouse reemplazar a Hive?

ClickHouse es un sistema de gestión de bases de datos en columnas (DBMS) para análisis en línea (OLAP). Desarrollado por Yandex, conocido como "Google ruso", fue de código abierto en 2016. Se considera una estrella en ascenso en los motores informáticos y es conocido como el más rápido en el campo de las bases de datos en memoria. Debido a que tiene varias veces la ventaja de rendimiento sobre motores como GreenPlum, muchas personas optan por instalarlo en servidores en la nube para su uso.

ClickHouse es una base de datos orientada a columnas y un motor de ejecución vectorizado nativo. No sigue el ecosistema de Hadoop en el campo de big data, sino que utiliza almacenamiento adjunto local como almacenamiento, por lo que es posible que todo IO no tenga las limitaciones de Hadoop. Su sistema se puede aplicar a una escala relativamente grande en entornos de producción porque su escalabilidad lineal y su garantía de confiabilidad pueden admitir de forma nativa soluciones de replicación y fragmentos. También proporciona algunas interfaces directas de SQL y tiene un conjunto relativamente rico de clientes nativos.

Las siguientes son las características de ClickHouse como base de datos analítica:

1 Velocidad rápida

El rendimiento de ClickHouse supera el de la mayoría de las bases de datos de almacenamiento en columnas. Es 100-1000 veces más rápido que los datos tradicionales. ClickHouse todavía tiene grandes ventajas.

100 millones de conjuntos de datos:

ClickHouse es aproximadamente 5 veces más rápido que Vertica, 279 veces más rápido que Hive y 801 veces más rápido que MySQL.

Conjunto de mil millones de datos:

ClickHouse es aproximadamente 5 veces más rápido que Vertica, MySQL y Hive ya no pueden completar la tarea.

2. Múltiples funciones

ClickHouse admite varios escenarios de análisis estadístico de datos:

1. Admite consultas similares a SQL;

2. Admite una variedad de funciones de biblioteca (como conversión de IP, análisis de URL, etc., cálculo estimado/HyperLoglog, etc.);

3. Admite matrices (Array) y estructuras de datos anidadas (Estructura de datos anidada). );

4. Admitir la implementación de replicación remota de bases de datos.

3. Estilo literario

Ignora el ecosistema Hadoop y sigue tu propio camino. Actualmente se ejecuta en cualquier Linux, FreeBSD o Mac OS X con arquitectura de CPU x86_64, AArch64 o PowerPC64LE.

Las desventajas de ClickHouse:

1. No admite Transaction: si quieres ser rápido, olvídate de Transaction.

2. ser más pequeño que la memoria de una máquina Tamaño: No es un gran problema;

3. Falta de operaciones completas de Actualización/Eliminación;

4.