Colección de citas famosas - Slogan de motivación - ¿Qué tipos de tablas colmena existen?

¿Qué tipos de tablas colmena existen?

¿Qué tipos de tablas colmena existen? Simplemente podemos dividirlas en cuatro tipos: tablas controladas, tablas externas, tablas particionadas y tablas de cubo. En rigor, conviene dividirlas en dos tipos, también conocidas como tablas internas y tablas externas. Las tablas de particiones y las tablas de depósitos son en realidad manifestaciones diferentes de tablas controladas.

1. Tabla controlada

La llamada tabla controlada, también conocida como tabla interna, corresponde a la tabla externa, lo que significa que el ciclo de vida de los datos de la tabla está controlado. . Cuando elimina una definición de tabla, los datos de la tabla también se eliminan. Cuando se crea una tabla, su registro de tabla correspondiente se encontrará en Hive y la definición de la tabla se encontrará en la tabla de metastore TBLS. Una vez que eliminemos la definición de la tabla de Hive, los datos de la tabla ya no existirán y la definición en el metastore ya no existirá.

2. Tabla externa

¿Cómo puede ser relativa a una tabla controlada? El ciclo de vida de los datos en las tablas internas se ve afectado por la definición de la tabla. No, la vida útil de los datos o si los datos existen no están sujetos a la definición de la tabla. Los datos de la tabla son solo la referencia de la tabla al archivo correspondiente en HDFS. Después de eliminar la definición de la tabla, los datos de la tabla aún existen.

3. Tabla de particiones

Supongamos que el clúster de servidores genera un archivo de datos de registro todos los días y almacena el archivo de datos en HDFS. Si queremos consultar datos de un día determinado, Hive escaneará todos los archivos para determinar si es la fecha especificada. Puede convertir las fechas en subdirectorios. Cuando Hive realiza consultas, el subdirectorio se determina en función de la fecha. Luego se analizan los archivos de datos en los subdirectorios elegibles.

4. Tabla de depósitos

La tabla de depósitos realiza hash y almacena datos en diferentes archivos. La flexión es otra técnica para dividir datos en partes más manejables. Si las tablas están unidas, se requiere un análisis completo de los datos de ambas tablas. Consume mucho tiempo. Puede optimizar los campos de unión. En el caso de los depósitos, es muy conveniente comparar datos en tablas similares, simplemente compare los datos en los depósitos correspondientes.