Descripción general del sistema de base de datos distribuida (DDBS)
¿Qué es una base de datos distribuida?
Los sistemas de bases de datos distribuidas se desarrollan sobre la base de sistemas de bases de datos centralizados y son el producto de una combinación de tecnología de bases de datos y tecnología de red
Hay dos tipos de sistemas de bases de datos distribuidas. Uno está físicamente distribuido pero lógicamente centralizado. Este tipo de base de datos distribuida solo es adecuado para unidades o departamentos pequeños con un solo propósito. distribuido lógicamente, que es el llamado sistema de base de datos distribuida federada. Dado que los sistemas de subbases de datos que componen la federación son relativamente autónomos, este sistema puede acomodar una variedad de bases de datos con diferentes propósitos y es más adecuado para bases de datos a gran escala. Integración
El sistema de base de datos distribuida (DDBS) incluye el sistema de gestión de base de datos distribuida (DDBMS) y la base de datos distribuida (DDB).
En un sistema de base de datos distribuida, una aplicación puede Para operaciones transparentes, los datos Los contenidos de la base de datos se almacenan en diferentes bases de datos locales, son administrados por diferentes DBMS, se ejecutan en diferentes máquinas, son compatibles con diferentes sistemas operativos y están conectados entre sí mediante diferentes redes de comunicación.
p>A La base de datos distribuida es lógicamente un todo unificado, es decir, es una única base de datos lógica frente al usuario. Físicamente, se almacena en diferentes nodos físicos. Una aplicación puede acceder a nodos distribuidos a través de una conexión de red. La base de datos de ubicación se refleja en el hecho de que los datos de la base de datos no se almacenan en la misma ubicación, más precisamente, no se almacenan en el dispositivo de almacenamiento de la misma computadora. Esta es la diferencia con una base de datos centralizada. , un sistema de base de datos distribuido Lógicamente, es lo mismo que un sistema de base de datos centralizado. Los usuarios pueden ejecutar aplicaciones globales en cualquier sitio, así como los datos se almacenan en la misma computadora y se administran mediante un único sistema de administración de bases de datos (DBMS). No me siento diferente.
Cada servidor de base de datos en una base de datos distribuida coopera para mantener la coherencia de la base de datos global
El sistema de base de datos distribuida es una arquitectura cliente/servidor
Cada servidor en el sistema Una computadora se llama nodo. Si un nodo tiene software que administra bases de datos, el nodo se llama servidor de base de datos. Si un nodo es una aplicación que solicita información del servidor, el nodo se llama cliente. Las aplicaciones de bases de datos ejecutadas por clientes ORACLE pueden acceder a los datos. La información y la interacción con los usuarios ejecutan el procesamiento del software ORACLE en el servidor. El acceso simultáneo y compartido de datos a la base de datos ORACLE permite que las dos partes anteriores estén en la misma computadora. más eficiente cuando la parte del cliente y la parte del servidor están en diferentes computadoras conectadas por la red
El procesamiento distribuido es un proceso en el que varios procesadores comparten una sola tarea. Ejemplos de procesamiento distribuido en el sistema de base de datos ORACLE.
El cliente y el servidor están ubicados en diferentes computadoras conectadas por la red
p>
Hay múltiples procesadores en una sola computadora, y diferentes procesadores ejecutan aplicaciones cliente por separado p>
Cada servidor que participa en una base de datos distribuida administra la base de datos por separado e independientemente, como si cada base de datos no estuviera en red. Cada base de datos de la base de datos se administra de forma independiente, lo que se denomina autonomía del sitio. La autonomía del sitio tiene los siguientes beneficios
◆Los nodos del sistema pueden reflejar la organización lógica de la empresa
◆Gestionado por bases de datos locales. Esto permite que cada administrador de base de datos controle los datos locales para que cada administrador de base de datos tenga un área más pequeña de responsabilidad de una mejor gestión
◆Siempre que una base de datos y una red estén disponibles, la base de datos global puede estar parcialmente disponible y no detendrá todo debido a una falla de la base de datos. La operación puede causar cuellos de botella en el rendimiento.
◆La recuperación de fallas generalmente se realiza en un solo nodo
◆Hay un diccionario de datos para cada base de datos local
◆Los nodos pueden ser independientes Se puede acceder al objeto de esquema desde todos los nodos en la base de datos distribuida. Por lo tanto, al igual que el DBMS local no distribuido, se debe proporcionar un mecanismo para hacer referencia a un objeto en la base de datos local. El DBMS distribuido debe proporcionar un patrón de nomenclatura para que un objeto en una base de datos distribuida pueda ser. utilizado en una aplicación
La identificación y las referencias únicas generalmente imponen la unicidad en cada nivel de la jerarquía. Los DBMS distribuidos simplemente extienden el modelo de nombres jerárquicos para implementar nombres de bases de datos únicos en la red, de modo que se garantice que el nombre de objeto global de un objeto sea único dentro de la base de datos distribuida. p>
ORACLE permite el uso de nombres de objetos globales en sentencias SQL para hacer referencia a objetos de esquema (vistas de tabla y procedimientos) en bases de datos distribuidas. En ORACLE, el nombre global de un objeto de esquema consta de tres partes, incluido el nombre de esquema de. el objeto, el nombre del objeto y el nombre de la base de datos. El formulario es como
SCOTT EMP@SALES DIVISION ACME
Una consulta remota es una consulta que selecciona información de uno o más remotos. tablas Estas tablas residen en el mismo nodo remoto
Una consulta distribuida puede recuperar datos de dos o más nodos. Una actualización distribuida puede modificar los datos de dos o más nodos.
La transacción remota es una transacción que contiene una o más declaraciones remotas, todas las cuales se refieren a una transacción distribuida en el mismo nodo remoto. Una transacción contiene una o más declaraciones que modifican datos en dos o más nodos diferentes de la base de datos distribuida. >
El control de transacciones en una base de datos distribuida debe garantizar la coherencia de los datos en la red. Un mecanismo de confirmación de dos etapas garantiza que todos los servidores de bases de datos que participan en transacciones distribuidas confirmen o reviertan todas las declaraciones de la transacción.
La estructura del sistema de base de datos distribuida ORACLE puede proporcionar transparencia de ubicación para los usuarios finales y las aplicaciones por parte de los administradores de bases de datos ORACLE. El proceso de visualización de sinónimos puede proporcionar transparencia de ubicación en el sistema de base de datos distribuida ORACLE.
ORACLE proporciona dos mecanismos para lograr la transparencia de la duplicación de tablas en distribución. Las instantáneas de tablas proporcionan duplicación de tablas asincrónica; los activadores implementan la duplicación de tablas sincrónica. En ambos casos, la transparencia de la duplicación de tablas se logra en un solo sitio o todas las transacciones en una base de datos distribuida se terminan con MIT o ROLLBACK. declaración
Dos clasificaciones de sistemas de bases de datos distribuidas
() DDBS isomorfos y homogéneos Cada sitio utiliza el mismo tipo El modelo de datos (por ejemplo, todos son relacionales) y el mismo modelo de DBMS
( ) DDBS isomorfos y heterogéneos Cada sitio utiliza el mismo tipo de modelo de datos pero el modelo DBMS es diferente, como DB ORACLE SYBASE SQL Server Etc.
() DDBS heterogéneo Los modelos de datos de cada sitio son diferentes e incluso diferentes. Con el desarrollo de la tecnología de redes informáticas, el problema de las redes de máquinas heterogéneas se ha resuelto mejor. En este momento, se puede acceder a datos en varios locales heterogéneos. bibliotecas en toda la red
Características principales de tres sistemas de bases de datos distribuidas
Características básicas de DDBS
( ) Los datos distribuidos físicamente no se almacenan en un sitio sino en múltiples sitios de la red informática
Los datos de integridad lógica se distribuyen físicamente en varios sitios pero lógicamente son un todo. Son utilizados por todos los usuarios (usuarios globales) *** compartidos y administrados de manera uniforme por un DDBMS.
( )Autonomía del sitio Los datos de cada sitio son administrados por el DBMS local y tiene capacidades de procesamiento autónomo para completar la aplicación del sitio local (aplicación local)
( )Colaboración entre sitios Aunque cada sitio tiene un alto grado de autonomía, coopera entre sí para formar un todo
Otras características de DDBS
( )Independencia de datos
p>( )Mecanismo de control que combina centralización y autonomía
( )Aumentar adecuadamente la redundancia de datos
( )Distribución de la gestión de transacciones
Cuatro ventajas de los sistemas de bases de datos distribuidas
( ) Más adecuado para gestión y control distribuidos
La estructura de los sistemas de bases de datos distribuidas es más adecuada para su uso por organizaciones o instituciones con características distribuidas geográficamente. Varios departamentos distribuidos en diferentes regiones y en. diferentes niveles implementan control local sobre sus propios datos, como lograr datos globales
Los datos se ingresan localmente para consulta y mantenimiento. En este momento, debido a que los recursos de la computadora están cerca del usuario, el costo de comunicación se puede reducir y la velocidad de respuesta es solo una pequeña cantidad. , lo que puede reducir en gran medida la cantidad de transmisión de información en la red; al mismo tiempo, también se puede mejorar la seguridad de los datos locales
() Tiene una arquitectura flexible
( )El sistema es económico, confiable, de alta disponibilidad y bueno
En comparación con una computadora grande que soporta una gran base de datos centralizada más algunos procesos y terminales remotos, una súper microcomputadora o una computadora súper pequeña. Los sistemas de bases de datos distribuidas respaldados por computadora tienden a ser más rentables y flexibles de implementar. mejor disponibilidad que los sistemas centralizados, por ejemplo, porque los datos se distribuyen en múltiples sitios y hay muchas copias de datos en individuos. La falla del sitio o de los enlaces de comunicación individuales no conducirá al colapso de todo el sistema, y las fallas locales del sistema sí lo harán. no causar pérdida global de control
() La velocidad de respuesta se acelerará bajo ciertas condiciones
Si los datos accedidos están en la base de datos local y pueden ser ejecutados por la computadora del usuario.
() Buena escalabilidad, fácil de integrar con sistemas existentes y fácil de expandir
Una empresa u organización puede utilizar tecnología de bases de datos distribuidas para desarrollar aplicaciones globales basadas en varias bases de datos establecidas y realizar ciertos cambios. al sistema de base de datos local original para formar un sistema distribuido. Esto es más simple y ahorra más tiempo que reconstruir un sistema de base de datos grande. Además de ahorrar recursos financieros y materiales, el sistema de base de datos distribuida existente se puede expandir rápidamente aumentando el número de. sitios
Cinco desventajas de los sistemas de bases de datos distribuidas
() Gran sobrecarga de comunicación y tasa de falla Alta
Por ejemplo, cuando la velocidad de transmisión de la comunicación de la red no es alta, la velocidad de respuesta del sistema es lenta. Los factores relacionados con la comunicación a menudo conducen a fallas del sistema. Al mismo tiempo, la complejidad del sistema en sí puede conducir fácilmente a una mayor tasa de fallas. Cuando ocurre una falla, la recuperación del sistema también es más compleja. es necesario mejorar la confiabilidad
()La estructura de acceso a los datos es compleja
En términos generales, acceder a los datos en la base de datos cuando está distribuida es mejor que acceder a los datos en la base de datos cuando está centralizada. y más caro
() La seguridad y la confidencialidad de los datos son difíciles de controlar
Cuando la base de datos se distribuye con un alto grado de autonomía del sitio, los administradores de bases de datos locales en diferentes sitios de la base de datos pueden El uso de diferentes medidas de seguridad no puede garantizar que los datos globales estén seguros. Los problemas de seguridad son inherentes a los sistemas distribuidos porque los sistemas distribuidos logran el control distribuido a través de las redes de comunicación, mientras que la propia red de comunicación protege la seguridad y la confidencialidad de los datos. los datos pueden ser robados fácilmente.
El diseño de bases de datos distribuidas, la división de sitios y la distribución de datos en diferentes sitios son relativamente complejos. La división y distribución de datos tiene un gran impacto en el rendimiento y la respuesta. velocidad y disponibilidad del sistema La velocidad de comunicación de diferentes sitios es muy lenta en comparación con la velocidad de acceso del componente de acceso del sistema de base de datos local. El costo de procesar la información de comunicación en la CPU es muy alto. En un sistema de base de datos distribuida, se debe prestar atención a resolver los problemas de distribución distribuida, procesamiento de consultas y optimización de la gestión de transacciones, control de concurrencia y gestión de directorios.
Seis fragmentación de datos del sistema de base de datos distribuida
p>Tipos
Fragmentación horizontal
Divida todas las tuplas de la relación global en varios subconjuntos separados de acuerdo con ciertas condiciones, y cada subconjunto es un fragmento de la relación
Fragmentación vertical
>
Divida el conjunto de atributos de una relación global en varios subconjuntos y realice operaciones de proyección en estos subconjuntos. Cada proyección se denomina fragmentación vertical
Exportación de fragmentación
También se denomina derivada. fragmentación horizontal, es decir, la condición de fragmentación horizontal no es la condición de este atributo de relación sino la condición de otros atributos de relación
Fragmentación mixta
Los tres métodos anteriores se pueden mezclar primero Fragmentación horizontal y luego fragmentación vertical o fragmentación vertical y luego fragmentación horizontal u otras formas, pero sus resultados son diferentes
Condiciones
( ) Condiciones de integridad
Todos los datos de la relación global debe ser mapeada a fragmentos. Nunca se permite tener datos que pertenezcan a la relación global pero que no pertenezcan a ninguno de sus fragmentos
()Condiciones reconfigurables
It. se debe garantizar que la relación global se pueda reconstruir a partir de cada fragmento de la misma relación global. Para la fragmentación horizontal, la operación se puede usar para reconstruir la relación global; para la fragmentación vertical, se puede usar la operación de unión para reconstruir la relación global; /p>
( ) Condición disjunta
Requiere que los fragmentos de datos obtenidos después de dividir una relación global no se superpongan entre sí (excepto la clave primaria de fragmentación vertical)
Siete métodos de asignación de datos del sistema de base de datos distribuida
() Tipo centralizado, todos los fragmentos de datos están organizados en el mismo sitio
() Tipo dividido
Hay solo una copia de todos los datos, que se divide en varios fragmentos lógicos. Cada fragmento lógico se asigna a un sitio específico
() Los datos completamente replicados se almacenan repetidamente en cada sitio, es decir, hay una copia completa de los datos en cada sitio
( )Híbrido Este es un método de distribución entre replicación dividida y completa
Arquitectura de sistema de ocho bases de datos distribuidas
Fragmentación y distribución de datos La separación de conceptos forma el concepto de distribución de datos independiente
Control explícito de la redundancia de datos La distribución de datos en cada sitio es clara de un vistazo en el modo de distribución para facilitar la gestión del sistema
Independencia del DBMS local Esta característica también se llama transparencia de mapeo local. Esta característica nos permite estudiar temas relacionados con la administración de DDB sin considerar el modelo de datos local específico del DBMS
Nueve sistemas de administración de bases de datos distribuidas
<. p > Aceptar una solicitud de usuario y determinar dónde enviarla o a qué computadoras se debe acceder para cumplir con la solicitudAcceda al Diccionario de datos de red para aprender cómo solicitar y utilizar la información allí
Si el almacén de datos de destino, el procesamiento distribuido debe realizarse en varias computadoras del sistema
La función de interfaz de comunicación coordina entre el DBMS local del usuario y el DBMS de otras computadoras
En un entorno heterogéneo distribuido El entorno de procesamiento también debe brindar soporte para la migración de datos y procesos. El tipo heterogéneo aquí se refiere a las diferencias entre el hardware y el software de cada sitio
Sistema de gestión de bases de datos distribuidas<. /p> p>
lishixinzhi/Article/program/Oracle/201311/16998