¿Cuáles son las características de una base de datos distribuida?
La independencia de los datos es uno de los principales objetivos que persiguen los métodos de bases de datos. La transparencia de la distribución significa que los usuarios no tienen que preocuparse por la partición lógica de los datos, los detalles de la distribución de la ubicación física de los datos, la coherencia de las copias duplicadas (datos redundantes) y qué modelos de datos admite la base de datos en el sitio local. Las ventajas de la transparencia distribuida son obvias. Con transparencia distribuida, las aplicaciones de usuario se escriben como si los datos no estuvieran distribuidos. No es necesario reescribir su aplicación cuando los datos se mueven de un sitio a otro. Al agregar copias duplicadas de ciertos datos, no es necesario reescribir la solicitud. El sistema almacena información de distribución de datos en el diccionario de datos. Las solicitudes de los usuarios para acceder a datos no locales son interpretadas, transformadas y transmitidas por el sistema basándose en el diccionario de datos.
2. La combinación de centralización y autonomía del nodo
En una base de datos distribuida, los datos tienen dos niveles: uno es el intercambio local, es decir, el sitio local donde se almacenan los datos compartidos de cada usuario. en una base de datos local y es utilizado conjuntamente por los usuarios del sitio. En segundo lugar, el intercambio global **, es decir, todos los sitios en la base de datos distribuida también almacenan datos que los usuarios pueden compartir en otros sitios de la red para admitir aplicaciones globales en el sistema. Por tanto, la correspondiente estructura de control también tiene dos niveles: centralización y autonomía. Los sistemas de bases de datos distribuidas suelen adoptar una estructura de control centralizada y autónoma. Cada sistema de gestión de bases de datos local puede gestionar de forma independiente la base de datos local y tiene funciones autónomas. Al mismo tiempo, el sistema cuenta con un mecanismo de control centralizado para coordinar el trabajo del DBMS local y ejecutar aplicaciones globales. Además, el grado de centralización y autonomía varía en los diferentes sistemas.
3. Apoyar la coherencia y la recuperabilidad de la base de datos global.
Cada base de datos local en la base de datos distribuida no solo cumple con la consistencia, serialización y recuperabilidad de la base de datos centralizada, sino que también garantiza la consistencia global de la base de datos y la serialización de las operaciones paralelas y la recuperabilidad global. sistema. Esto se debe a que las aplicaciones globales involucran datos de más de dos nodos. Por lo tanto, en un sistema de base de datos distribuida, una empresa puede constar de múltiples operaciones en diferentes sitios. De esta forma, cuando falla uno de los nodos, ¿cómo hacer retroceder el negocio global? ¿Cómo hacer que otro nodo cancele una operación realizada (si la operación se ha completado o parcialmente completada) u otras operaciones que no requieren la ejecución del negocio (si la operación aún no se ha realizado)? Estas tecnologías son mucho más complejas y difíciles que las bases de datos centralizadas, y los sistemas de bases de datos distribuidas deben resolver estos problemas.
4. Transparencia de replicación
Los usuarios no necesitan preocuparse por la replicación de la base de datos en cada nodo de la red, y el sistema completa automáticamente los datos actualizados. En un sistema de base de datos distribuida, los datos de un sitio se pueden copiar a otros sitios para su almacenamiento, y las aplicaciones pueden usar los datos copiados para completar operaciones distribuidas localmente, evitando así la transmisión de datos a través de la red y mejorando la operación del sistema y la eficiencia de las consultas. Sin embargo, una operación de actualización de datos replicados implica una actualización de todos los datos replicados.
5. Fácilmente escalable
En la mayoría de entornos de red, un único servidor de base de datos finalmente no es suficiente. Si el software del servidor admite el escalado horizontal transparente, se pueden agregar varios servidores para distribuir aún más los datos y compartir tareas de procesamiento.