¿Qué significan gestión de datos, gobierno de datos, centro de datos, centro de datos y lago de datos? ¿Qué importa?
En pocas palabras, la gobernanza es la gestión de la gestión.
Para gestionar se debe seguir un determinado sistema estándar, un determinado proceso y una determinada división de roles, y estos contenidos deben estar claramente definidos a través del gobierno del dato. La dirección solo desempeña responsabilidades de gestión y supervisión de acuerdo con el sistema estándar de gobernanza de datos.
La base para la implementación de la gestión existente es el sistema estándar de gobernanza.
Centro de datos y lago de datos
Esto no es fácil de explicar, así que intentaré simplificarlo.
El lago de datos es generalmente un concepto propuesto por los proveedores de servicios de nube pública, es decir, todos los datos estructurados y no estructurados de una empresa se pueden recopilar y almacenar en mi lugar. Un lago de datos es una gran estación de almacenamiento. Este tipo de almacenamiento se distribuye y se puede ampliar infinitamente. Los datos almacenados no se limpiarán ni procesarán, así que intente mantenerlos como están.
Después de guardar, Data Lake proporciona algunas interfaces abiertas estándar para que usted use los datos, incluida la interfaz de consulta SQL, la interfaz del motor informático, la interfaz de procesamiento de flujo, etc. El propósito de proporcionar una interfaz también es muy simple, para que puedas utilizar cómodamente los datos que almacenas.
El almacenamiento de los lagos de datos es generalmente almacenamiento de objetos distribuidos o almacenamiento de archivos distribuidos. Incluso si recopila datos de una base de datos estructurada, se convierten en un método de almacenamiento unificado, lo que facilita su escalado.
En resumen, la capacidad de las empresas para disfrutar de los datos se está hundiendo y abriéndose al mundo exterior.
La plataforma intermedia de datos incluye la plataforma de tecnología de datos subyacente (que puede ser la plataforma de big data con la que estamos familiarizados), la capa de activos de datos de nivel medio y los datos de nivel superior están abiertos al exterior. mundo.
La capa de activos central en sí también es jerárquica, desde los datos de origen subyacentes hasta los datos de la aplicación del dominio, pasando por el almacén de datos de la capa superior y la biblioteca de etiquetas de datos. El lago de datos corresponde más a la capa de origen de pegado de datos en el concepto de centro de datos.
Las empresas rara vez utilizan el concepto de lago de datos cuando construyen centros de datos.
La comparación y mapeo entre los dos es la siguiente:
Centro de datos
La palabra centro de datos, a menudo aparece en la aplicación de sistemas de BI.
Pero ahora los centros de datos generalmente se refieren a infraestructura de TI, grandes salas de datos de nube pública, etc. , mientras que este término rara vez se utiliza en sistemas de BI o centros de datos. En otras palabras, el término centro de datos está sesgado hacia el nivel de infraestructura de hardware de TI.