¿Qué es una base de datos?
La etapa de desarrollo de la base de datos se puede dividir a grandes rasgos en las siguientes etapas:
Etapa de gestión manual;
Etapa del sistema de archivos;
Etapa Sistema de Base de Datos;
Etapa Base de Datos Avanzada.
Cuando las personas describen este concepto desde diferentes perspectivas, tienen diferentes definiciones (descriptivas por supuesto). Por ejemplo, una base de datos se denomina "sistema de mantenimiento de registros" (esta definición enfatiza que una base de datos es una colección de registros). Para otro ejemplo, una base de datos es "una colección de datos relacionados que las personas almacenan juntos de cierta manera organizativa para resolver tareas específicas" (esta definición se centra en la organización de datos). Es más, las bases de datos se denominan "almacenes de datos". Por supuesto, aunque esta afirmación es vívida, no es rigurosa.
Estrictamente hablando, una base de datos es un "almacén que organiza, almacena y gestiona datos según la estructura de datos". En el trabajo diario de la gestión económica, a menudo es necesario colocar algunos datos relevantes en dicho "almacén" y procesarlos de acuerdo con las necesidades de la gestión. Por ejemplo, el departamento de recursos humanos de empresas e instituciones suele almacenar información básica de los empleados (número de empleado, nombre, edad, sexo, lugar de origen, salario, currículum, etc.). La Tabla 20.6.3 puede considerarse como una base de datos. Con este "almacén de datos", podemos consultar la situación básica de un empleado en cualquier momento según sea necesario, y también podemos consultar el número de empleados cuyo salario está dentro de un determinado rango, etc. Si estas tareas se pueden automatizar en los ordenadores, entonces nuestra gestión de personal podrá alcanzar un nivel muy alto. Además, en la gestión financiera, la gestión de almacenes y la gestión de producción, es necesario establecer muchas "bases de datos" de este tipo para utilizar computadoras para realizar la gestión automatizada de las finanzas, el almacén y la producción.
J. Martin dio una definición relativamente completa de la base de datos: una base de datos es una colección de datos relacionados almacenados juntos, está estructurada, no tiene redundancia dañina o innecesaria y sirve para una variedad de aplicaciones; se almacena independientemente del programa que lo utiliza; la inserción de nuevos datos en la base de datos, la modificación y la recuperación de datos originales se pueden realizar de forma general y controlada. Cuando en un sistema hay varias bases de datos estructuralmente completamente separadas, el sistema contiene una "colección de bases de datos".
Ventajas de las bases de datos
El uso de bases de datos puede traer muchos beneficios: como reducir la redundancia de datos, ahorrando así en gran medida espacio de almacenamiento de datos, aprovechando al máximo los recursos de datos, etc. Además, la tecnología de bases de datos también proporciona a los usuarios un medio de uso muy simple, lo que les permite escribir fácilmente aplicaciones de bases de datos. En particular, el sistema de gestión de bases de datos relacionales por microcomputadoras dBASELL, que ha surgido en los últimos años, tiene un funcionamiento intuitivo, un uso flexible, una programación conveniente y una amplia adaptabilidad ambiental (computadoras comunes de 16 bits, como IBM/PC/XT, Great Wall doméstica 0520, etc., pueden ejecutar varios programas) y sólidas capacidades de procesamiento de datos. Las bases de datos se están utilizando ampliamente en China y se convertirán en una poderosa herramienta para la gestión económica.
La base de datos realiza el almacenamiento, la gestión y el uso de datos a través del software del sistema de gestión de bases de datos DBMS. dBASELL es un software de sistema de gestión de bases de datos.
Estructura de bases de datos y tipos de bases de datos
Las bases de datos generalmente se dividen en tres tipos: bases de datos jerárquicas, bases de datos en red y bases de datos relacionales. Diferentes bases de datos están conectadas y organizadas según diferentes estructuras de datos.
1. Modelo de estructura de datos
(1) Estructura de datos
La llamada estructura de datos se refiere a la forma organizativa de los datos o la relación entre los datos. Si D representa datos y R representa un conjunto de relaciones entre objetos de datos, entonces DS = (d, R) se denomina estructura de datos. Por ejemplo, hay una guía telefónica que registra los nombres y números de teléfono correspondientes de n personas. Para que sea más fácil encontrar el número de teléfono de alguien, los nombres y números están ordenados en el diccionario, con el número de teléfono correspondiente seguido del nombre. De esta manera, si desea encontrar el número de teléfono de una persona (digamos que la primera letra de su nombre es Y), solo necesita encontrar los nombres que comienzan con Y. En este ejemplo, el conjunto de datos D es el nombre y el teléfono. Números, la relación R entre ellos está ordenada en el orden del diccionario y su estructura de datos correspondiente es DS = (d, R), que es una matriz. (2) Tipos de estructuras de datos
Las estructuras de datos se dividen en estructuras lógicas y estructuras físicas de datos. La estructura lógica de los datos consiste en observar y analizar datos desde una perspectiva lógica (es decir, la conexión y organización de los datos), independientemente de la ubicación de almacenamiento de los datos.
La estructura física de los datos se refiere a la estructura de los datos almacenados en la computadora, es decir, la forma de implementación de la estructura lógica de los datos en la computadora, por lo que la estructura física también se denomina estructura de almacenamiento. Esta sección solo estudia la estructura lógica de los datos. El método para reflejar y realizar la conexión de datos se denomina modelo de datos.
Actualmente existen tres modelos de datos populares: el modelo de estructura jerárquica y el modelo de estructura de red basados en la teoría de grafos, y el modelo de estructura de relaciones basado en la teoría de relaciones.
2. Sistemas de bases de datos jerárquicos, en red y relacionales
(1) Modelo de estructura jerárquica
El modelo de estructura jerárquica es esencialmente un árbol con nodos raíz Árbol ordenado dirigido (Matemáticamente "árbol" se define como un gráfico conectado acíclico). Por ejemplo, la Figura 20.6.4 es el organigrama de una institución de educación superior. Este organigrama es como un árbol. El departamento de la escuela es la raíz (llamado nodo raíz), el departamento, la especialidad, el maestro y el estudiante son las ramas (llamadas nodos). La conexión entre la raíz y la rama se llama la relación entre la raíz y la rama. la arista es 1:N, es decir, solo hay una raíz N. La estructura general de este modelo de estructura de datos se muestra en la Figura 20.6.5.
Figura 20.6.4 Organigrama de la universidad Figura 20.6.5 Modelo de estructura jerárquica
En la Figura 20.6.5, Ri (I = 1, 2,...6) representa Registros ( es decir, una colección de datos), donde R1 es el nodo raíz (si RI se considera una familia, R1 es el ancestro, el padre de R2, R3 y R4, y R2, R3 y R4. R2, R4, R5 y R6 también se llama nodo hoja (es decir, un nodo sin hijos). De esta manera, RI (I = 1, 2, ... 6) forma un árbol con R1 como raíz, que es jerárquico. modelo de estructura de datos.
El sistema de base de datos establecido según el modelo jerárquico se denomina sistema de base de datos de modelo jerárquico
(2) Modelo de estructura de red
En la figura. 20.6 En .6, se proporciona la relación entre médicos, salas y pacientes en un hospital. Es decir, cada médico es responsable de tratar a tres pacientes y cada sala puede albergar de uno a cuatro pacientes si se considera a los médicos como un conjunto de datos. , Los pacientes y las salas son otros dos conjuntos de datos, por lo que la relación proporcional entre médicos, pacientes y salas es M: N: P (es decir, M médicos, N pacientes, P salas). su modelo de estructura general se muestra en la Figura 20.6.7. En la figura, el registro ri (I = 1, 2, 8) satisface las siguientes condiciones:
① Puede haber múltiples nodos sin nodos principales (. Como R1, R2, R3).
② En el caso de "médico, paciente, sala", hay varios nodos en el "conjunto de médicos" (el nodo M) no tiene "padres". ", mientras que el conjunto "sala" tiene nodos P (salas) y múltiples "padres" (pacientes)
Figura 20.6.6 La relación entre médicos, salas y pacientes<. /p>
Figura 20.6.7 Modelo de estructura de red
El sistema de base de datos establecido de acuerdo con la estructura de datos de la cuadrícula se denomina sistema de base de datos de la cuadrícula y su representante típico es DBTG (Grupo de tareas de base de datos que se puede convertir en jerárquico). estructuras de datos a través de métodos matemáticos.
(3) Modelo de estructura relacional
Las estructuras de datos relacionales simplifican algunas estructuras de datos complejas en relaciones binarias simples (es decir, forma de tabla bidimensional). la relación de empleado de una determinada unidad es una relación binaria (consulte la Tabla 20.6.8). Cada columna de esta tabla de cuatro filas y seis columnas se denomina campo (es decir, atributo), y el nombre del campo es equivalente al título. bar. El título (nombre del atributo) en; cada fila de la tabla es una tupla de seis que contiene seis atributos (número de trabajo, nombre, edad, sexo, puesto, salario), que es un registro de una persona claramente reflejado en esta tabla.
Tabla 20.6.8 Información básica de los empleados
Por lo general, la estructura de una tabla bidimensional con m filas yn columnas es la que se muestra en la Tabla 20.6.9. p>
Cada fila de la tabla representa un valor de registro y cada columna representa un atributo (es decir, campo o elemento de datos). Hay m registros en la Tabla 1**. Cada registro contiene n atributos.
Como tabla bidimensional relacional, se deben cumplir las siguientes condiciones:
(1) Cada columna de la tabla debe ser un elemento de datos básico (es decir, no puede ser descompuesto). (2) Cada columna de la tabla debe tener el mismo tipo de datos (como tipo de carácter o numérico).
(3) El nombre de cada columna de la tabla debe ser único. (4) No debe haber filas con exactamente el mismo contenido en la tabla. (5) El orden de las filas y columnas no afecta el significado de la información expresada en la tabla.
Un sistema de base de datos compuesto por estructuras de datos relacionales se denomina sistema de base de datos relacional.
En una base de datos relacional, casi todas las operaciones sobre datos se basan en una o más tablas relacionales. La gestión de datos se logra clasificando, fusionando, conectando o seleccionando estas tablas relacionales. DBASEII es un representante típico de este tipo de sistema de gestión de bases de datos. Para un problema de aplicación práctica (como la gestión de personal), a veces se necesitan múltiples relaciones para lograrlo. La relación establecida con dBASEII se denomina base de datos (o archivo de base de datos), y varias bases de datos establecidas correspondientes a múltiples relaciones se denominan sistemas de bases de datos. Otra función importante de dBASEII es utilizar y administrar la base de datos mediante el establecimiento de archivos de comandos. El archivo de secuencia de comandos correspondiente al sistema de base de datos se denomina sistema de aplicación de base de datos. En pocas palabras, una relación se llama base de datos y varias bases de datos pueden formar un sistema de base de datos. El sistema de base de datos puede derivar varios tipos de archivos auxiliares para establecer su sistema de aplicación.
Requisitos y características de la base de datos
Para que varios sistemas de bases de datos aprovechen al máximo sus ventajas, es necesario presentar algunos requisitos claros para el uso de sistemas de gestión de bases de datos.
1. Requisitos para establecer archivos de bases de datos
(1) Minimizar la duplicación de datos para que los datos tengan una redundancia mínima. En los sistemas de administración de archivos utilizados en los primeros días de las computadoras, dado que los archivos de datos eran creados por los usuarios, varios usuarios tenían que colocarlos en sus propios archivos incluso si tenían muchos datos iguales, lo que resultaba en una gran cantidad de duplicación de datos. datos almacenados y un desperdicio de espacio de almacenamiento. La tecnología de bases de datos parece superar esta deficiencia, por lo que se debe evitar la redundancia al organizar el almacenamiento de datos.
(2) Mejorar la utilización de datos y permitir que muchos usuarios disfruten de los recursos de datos.
(3) Preste atención a mantener la integridad de los datos. Esto es particularmente importante para algunos departamentos (como oficinas de estadística, bancos, etc.). ) requiere datos históricos para la predicción y la toma de decisiones.
(4) Preste atención a la coherencia del mismo método de descripción de datos, para que las operaciones de datos no se confundan. Por ejemplo, las calificaciones académicas de una persona en el expediente de personal son un título universitario, pero en el archivo de ciencia y tecnología es un título universitario, lo que fácilmente puede causar confusión.
(5) Para algunos datos que deben mantenerse confidenciales, se deben agregar medidas de confidencialidad.
(6) La tasa de búsqueda de datos es alta y los datos se mantienen de manera oportuna según sea necesario.
2. Características de los archivos de bases de datos
No importa qué sistema de gestión de bases de datos se utilice, los archivos de bases de datos que crean pueden considerarse como una colección de registros con la misma naturaleza, por lo que estas bases de datos. archivos Todos tienen las mismas características:
(1) Los archivos tienen el mismo formato de registro e igual longitud.
(2) Filas diferentes son registros diferentes, por lo que tienen contenidos diferentes.
(3) Diferentes columnas representan diferentes nombres de campo y las propiedades (atributos) de los datos en la misma columna son las mismas.
(4) El contenido de cada fila y columna es inseparable, pero el orden de las filas y columnas no afecta la expresión del contenido del archivo.
3. Clasificación de archivos
Los archivos principales y los archivos de transacciones son los archivos más citados. Otras categorías de archivos incluyen archivos de tabla, archivos de respaldo y archivos de salida archivados. Estos archivos se describen a continuación.
(1) Archivo principal. Los archivos maestros son recursos de datos permanentes para un área de aplicación específica. El archivo maestro contiene registros a los que se accede periódicamente para proporcionar información y que se actualizan con frecuencia para reflejar el estado más reciente. Los archivos maestros típicos incluyen archivos de inventario, archivos maestros de empleados y archivos maestros de colecciones.
(2) Archivos de transacciones. Los archivos de transacciones contienen registros de actividades de datos (transacciones) como sistemas de información. Estas transacciones se agrupan para formar archivos de transacciones. Por ejemplo, los datos registrados en las tarjetas de nómina semanales se almacenan en lotes en archivos de transacciones y luego se procesan con los archivos de nómina para imprimir cheques de nómina y libros de registro de nómina.
(3) Archivo de formulario. Un archivo de formulario es un formulario. La razón por la que no diseñamos tablas en el programa sino que creamos archivos de tablas separados es para facilitar la modificación. Por ejemplo, el programa de tasas impositivas de una empresa de servicios públicos o la tasa impositiva del Servicio de Impuestos Internos podrían almacenarse en un archivo de tabla.
(4) Copias de seguridad de archivos. Los archivos en espera son copias de archivos de producción existentes. Una vez que se destruyen los archivos de producción, los archivos de respaldo se pueden usar para reconstruir los archivos de producción.
(5) Archivo.
Los archivos de almacenamiento no se proporcionan para el procesamiento actual, pero se guardan como referencia histórica. Por ejemplo, el IRS puede solicitar examinar los últimos 15 años del historial de una persona. De hecho, los archivos son sólo una "instantánea" de su trabajo en un momento determinado.
(6) Archivo de salida. El archivo de salida contiene una imagen digital de la información que se imprimirá en una impresora, se mostrará en una pantalla o se trazará en un trazador. Los archivos de salida se pueden poner en cola (almacenados en un dispositivo de almacenamiento secundario), y la salida real se realiza solo cuando el dispositivo de salida está disponible.