Colección de citas famosas - Frases motivadoras - ¿Para qué sirve la base de datos?

¿Para qué sirve la base de datos?

Definición

Definición 1

Cuando las personas describen este concepto desde diferentes perspectivas, tienen diferentes definiciones (descriptivas por supuesto). Por ejemplo, una base de datos se denomina "sistema de mantenimiento de registros" (esta definición enfatiza que una base de datos es una colección de registros). Otro ejemplo es que una base de datos es "una colección de datos relacionados que las personas almacenan juntos de alguna manera organizada para resolver una tarea específica" (esta definición se centra en la organización de los datos). Es más, las bases de datos se denominan "almacenes de datos". Por supuesto, aunque esta afirmación es vívida, no es rigurosa.

Estrictamente hablando, una base de datos es un "almacén que organiza, almacena y gestiona datos según la estructura de datos". En el trabajo diario de la gestión económica, a menudo es necesario colocar algunos datos relevantes en dicho "almacén" y procesarlos de acuerdo con las necesidades de la gestión. Por ejemplo, el departamento de personal de una empresa o institución a menudo almacena la información básica de sus empleados (número de empleado, nombre, edad, sexo, lugar de origen, salario, currículum, etc.) en una tabla, que puede considerarse como una base de datos. Con este "almacén de datos", podemos consultar la situación básica de un empleado en cualquier momento según sea necesario, y también podemos consultar el número de empleados cuyo salario está dentro de un determinado rango, etc. Si todas estas tareas se pueden automatizar en el ordenador, entonces nuestra gestión de personal podrá alcanzar un nivel muy alto. Además, en la gestión financiera, la gestión de almacenes y la gestión de producción, es necesario establecer muchas "bases de datos" de este tipo para utilizar computadoras para realizar la gestión automatizada de las finanzas, el almacén y la producción.

J. Martin dio una definición relativamente completa de una base de datos: una base de datos es una colección de datos relacionados almacenados juntos, que está estructurada, no tiene redundancia dañina o innecesaria y sirve para una variedad de servicios de aplicaciones. ; los datos se almacenan independientemente del programa que los utiliza; insertar nuevos datos en la base de datos, modificar y recuperar datos originales se puede realizar de forma común y controlable. Cuando hay varias bases de datos en un sistema que tienen una estructura completamente separada, el sistema contiene una "colección de bases de datos".

Definición 2

Una base de datos es una colección de datos organizados según un modelo de datos específico y almacenados en un almacenamiento secundario. Dichos conjuntos de datos se caracterizan por no estar duplicados en la medida de lo posible y servir de manera óptima a las diversas aplicaciones de una organización específica. Su estructura de datos es independiente de la aplicación que la utiliza, y la adición, eliminación, modificación y recuperación de datos se gestiona y controla mediante un software unificado. Desde la perspectiva de la historia del desarrollo, la base de datos es una etapa avanzada de la gestión de datos y se desarrolló a partir del sistema de gestión de archivos.

Definición 3 (Opiniones del Comité de Expertos sobre el Protocolo del Convenio de Berna)

Recopilación de toda la información (datos, hechos, etc.). ), ya sea en forma impresa, en unidad de almacenamiento informático o de otro modo, se considerará una "base de datos".

Existen muchas razones para elegir contenidos digitales, que se pueden resumir en las siguientes:

(1) Espacio de almacenamiento. Un gran número de usuarios acceden y utilizan productos digitales a través de Internet. Como todos sabemos, los productos digitales se almacenan en matrices de discos y se administran mediante servidores. El espacio en disco es limitado, al igual que la capacidad del servidor, por lo que no es posible el almacenamiento ilimitado de recursos digitales. Esto nos obliga a elegir el contenido digital de los recursos literarios.

(2) La necesidad de resolver el conflicto entre el alto coste de la producción digital y los fondos limitados de las bibliotecas. Pocas bibliotecas tienen recursos suficientes para digitalizar colecciones enteras y la selección de contenidos es inevitable.

(3) La necesidad de la gestión de recursos digitales. Con el rápido desarrollo de la tecnología, el ciclo de vida de los recursos digitales generados por proyectos digitales es cada vez más corto. Invertir fuertemente en migración digital es una manera importante de extender la vida útil de los recursos digitales, y se deben considerar costosos costos de mantenimiento en la selección de contenido digital.

Historia del desarrollo de bases de datos Desde su nacimiento hasta el presente, la tecnología de bases de datos ha formado una base teórica sólida, productos comerciales maduros y amplias aplicaciones en menos de medio siglo, atrayendo cada vez a más investigadores. El nacimiento y desarrollo de las bases de datos ha supuesto una gran revolución en la gestión de la información informática. Durante los últimos 30 años, se han desarrollado y construido miles de bases de datos en el país y en el extranjero, convirtiéndose en la infraestructura para el trabajo, la producción y la vida diaria de empresas, departamentos e incluso individuos.

Al mismo tiempo, con la expansión y profundización de las aplicaciones, el número y la escala de las bases de datos continúan aumentando y el campo de investigación de las bases de datos se ha ampliado y profundizado enormemente. En los últimos 30 años, tres Turing informáticos (C.W. Bachman, E.F. Codd y J. Gray) han sido premiados en el campo de las bases de datos, lo que demuestra plenamente que las bases de datos son un campo lleno de vitalidad y espíritu innovador. Sigamos el desarrollo de las bases de datos a lo largo de la trayectoria histórica.

[Editar este párrafo] Una breve historia del desarrollo de las bases de datos

1. El nacimiento de la gestión de datos

La historia de las bases de datos se remonta a hace cincuenta años. , cuando la gestión de datos es muy sencilla. Los datos se procesan pasando millones de tarjetas perforadas a través de una gran cantidad de máquinas para clasificarlas, compararlas y tabularlas, y los resultados de las tiradas se imprimen en papel o se convierten en nuevas tarjetas perforadas. La gestión de datos es el almacenamiento físico y el procesamiento de todas estas tarjetas perforadas. Sin embargo, en 1951, una computadora de Remington Rand Corporation llamada Univac I introdujo una unidad de cinta que podía ingresar cientos de registros en un segundo, lo que provocó una revolución en la gestión de datos. 1956 IBM produce la primera unidad de disco, el modelo 305 RAMAC. Esta unidad tiene 50 discos de 2 pies de diámetro y puede almacenar 5 MB de datos. La mayor ventaja de utilizar discos es que se puede acceder a los datos de forma aleatoria, mientras que las tarjetas perforadas y las cintas sólo pueden acceder a los datos de forma secuencial.

1951: El sistema Univac utiliza cinta magnética y tarjetas perforadas para el almacenamiento de datos.

El germen de los sistemas de bases de datos apareció en los años 60. En ese momento, las computadoras comenzaron a usarse ampliamente en la gestión de datos, lo que imponía requisitos cada vez mayores al disfrute de los datos. Los sistemas de archivos tradicionales ya no pueden satisfacer las necesidades de las personas. Surgieron sistemas de gestión de bases de datos que pueden gestionar y compartir datos de manera uniforme. El modelo de datos es el núcleo y la base del sistema de base de datos, y varios programas de sistemas de gestión de bases de datos se basan en un determinado modelo de datos. Por tanto, según las características del modelo de datos, los sistemas de bases de datos tradicionales suelen dividirse en tres categorías: bases de datos en red, bases de datos jerárquicas y bases de datos relacionales.

Apareció la primera base de datos en red, que fue IDS (Integrated DataStore) desarrollada con éxito por Bachman y otros de General Electric Company en los Estados Unidos en 1961. En 1961, Charles Bachman de General Electric Company desarrolló con éxito el primer DBMS de malla del mundo y el primer sistema de gestión de bases de datos: IDS de almacenamiento de datos integrado, que sentó las bases para la base de datos de malla y ganó gran popularidad en ese momento. IDS tiene las características de esquema y registro de datos. Pero solo se puede ejecutar en el host GE, la base de datos tiene un solo archivo y todas las tablas de la base de datos deben generarse mediante codificación manual. Más tarde, el cliente de GE, BF Goodrich Chemical, tuvo que reescribir todo el sistema. El sistema reescrito se denominó Sistema Integrado de Gestión de Datos (IDMS).

El modelo de base de datos en malla puede modelar naturalmente cosas jerárquicas y no jerárquicas. Antes de la aparición de las bases de datos relacionales, las bases de datos en red se utilizaban más que las bases de datos jerárquicas. En la historia del desarrollo de bases de datos, las bases de datos en malla ocupan una posición importante.

Después de la base de datos jerárquica está la base de datos de red. El sistema de base de datos jerárquico más famoso y típico es el IMS desarrollado por IBM en 1968.

(Sistema de Gestión de la Información), una base de datos jerárquica adaptada a su anfitrión. Este es el primer producto de programa de sistema de base de datos a gran escala desarrollado por IBM. Se produjo a finales de la década de 1960 y ahora se ha desarrollado en IMSV6, que brinda soporte para funciones avanzadas como agrupación en clústeres, intercambio de datos de N vías y uso compartido de colas de mensajes. Este producto de base de datos de 30 años ha asumido un nuevo papel en las aplicaciones de conectividad de aplicaciones WWW y de inteligencia empresarial de hoy.

En 1973, Cullinan Corporation (más tarde Cullinan Software Corporation) comenzó a vender una versión mejorada del IDMS de Goodrich y gradualmente se convirtió en la empresa de software más grande del mundo en ese momento.

2. [Editar este párrafo] Etapa de desarrollo de la base de datos

La etapa de desarrollo de la base de datos se puede dividir a grandes rasgos en las siguientes etapas:

Etapa de gestión manual

p >

Etapa del sistema de archivos;

Etapa del sistema de base de datos;

Etapa de base de datos avanzada.

[Editar este párrafo] La estructura básica de la base de datos

La estructura básica de la base de datos se divide en tres niveles, lo que refleja tres perspectivas diferentes de observación de la base de datos.

(1) Capa de datos físicos.

Es la capa más interna de la base de datos y es una colección de datos realmente almacenados en un dispositivo de almacenamiento físico. Estos datos son datos sin procesar procesados ​​por el usuario, que consisten en cadenas de bits, caracteres y palabras procesadas por las operaciones de instrucción descritas por el modo interno.

(2) Capa de datos conceptual.

Es la capa intermedia de la base de datos y la representación lógica general de la base de datos. Señalar la definición lógica de cada dato y la relación lógica entre los datos es una colección de registros almacenados. Implica la relación lógica de todos los objetos en la base de datos, más que sus condiciones físicas, y es una base de datos bajo el concepto de administrador de base de datos.

③Capa de datos lógica.

Es la base de datos que ven y utilizan los usuarios, y representa el conjunto de datos utilizados por uno o varios usuarios específicos, es decir, un conjunto de registros lógicos.

Las relaciones entre bases de datos en diferentes niveles se convierten mediante mapeo.

[Editar este párrafo] Las funciones principales de la base de datos

(1) Realizar el intercambio de datos.

El intercambio de datos incluye que todos los usuarios puedan acceder a los datos de la base de datos al mismo tiempo. Los usuarios pueden usar la base de datos de varias maneras a través de la interfaz y compartir datos.

(2) Reducir la redundancia de datos.

En comparación con el sistema de archivos, debido a que la base de datos permite compartir datos, evita que los usuarios creen archivos de aplicaciones por separado. Reduzca una gran cantidad de datos duplicados, reduzca la redundancia de datos y mantenga la coherencia de los datos.

(3) Independencia de los datos.

La independencia de los datos incluye que las estructuras lógicas de la base de datos y la aplicación son independientes entre sí, y los cambios en la estructura física de los datos no afectan la estructura lógica de los datos.

(4) Control centralizado de datos.

En el modo de administración de archivos, los datos están dispersos y diferentes usuarios o el mismo usuario no tienen nada que ver con sus archivos en diferentes procesos. Las bases de datos se pueden utilizar para el control y la gestión centralizados de datos, y los modelos de datos se pueden utilizar para expresar la organización de diversos datos y las relaciones entre datos.

(5) Coherencia y mantenibilidad de los datos para garantizar la seguridad y confiabilidad de los datos.

Incluyen principalmente: ① Control de seguridad: evita la pérdida de datos, actualizaciones incorrectas y uso no autorizado; ② Control de integridad: garantiza la exactitud, validez y compatibilidad de los datos; ③ Control de concurrencia: en el mismo período de tiempo dentro de la base de datos; , se permiten múltiples accesos a los datos para evitar interacciones anormales entre los usuarios; ④ Descubrimiento y recuperación de fallas: el sistema de administración de bases de datos proporciona un conjunto de métodos para detectar y reparar fallas de manera oportuna, evitando así la destrucción de datos.

⑹Recuperación de fallos.

El sistema de gestión de bases de datos proporciona un conjunto de métodos que pueden detectar y reparar fallas a tiempo para evitar que los datos se dañen. El sistema de base de datos puede recuperarse lo más rápido posible de fallas que ocurren durante la operación del sistema de base de datos, que pueden ser errores físicos o lógicos. Por ejemplo, errores de datos causados ​​por un mal funcionamiento del sistema.

[Editar este párrafo] Estructura de la base de datos y tipo de base de datos

Las bases de datos generalmente se dividen en tres tipos: bases de datos jerárquicas, bases de datos en red y bases de datos relacionales. Diferentes bases de datos están conectadas y organizadas según diferentes estructuras de datos.

1. Modelo de estructura de datos

(1) Estructura de datos

La llamada estructura de datos se refiere a la forma organizativa de los datos o la relación entre los datos. Si D representa datos y R representa el conjunto de relaciones entre objetos de datos, entonces DS = (D, R) se denomina estructura de datos. Por ejemplo, hay una guía telefónica que registra los nombres y números de teléfono correspondientes de n personas. Para que sea más fácil encontrar el número de teléfono de alguien, los nombres y números están ordenados en el diccionario, con el número de teléfono correspondiente seguido del nombre.

De esta manera, si quieres encontrar el número de teléfono de alguien (digamos que la primera letra de su nombre es Y), sólo necesitas encontrar aquellos nombres que comienzan con Y. En este ejemplo, el conjunto de datos D son nombres y números de teléfono, y la relación R entre ellos está organizada en orden lexicográfico y su estructura de datos correspondiente es DS = (D, R), que es una matriz.

②Tipos de estructuras de datos

Las estructuras de datos se dividen en estructuras lógicas y estructuras físicas de datos. La estructura lógica de los datos es la observación y el análisis de los datos desde una perspectiva lógica (es decir, la conexión y organización de los datos), independientemente de dónde se almacenen los datos. La estructura física de los datos se refiere a la estructura de los datos almacenados en la computadora, es decir, la forma de implementación de la estructura lógica de los datos en la computadora, por lo que la estructura física también se denomina estructura de almacenamiento. Aquí solo se estudia la estructura lógica de los datos, y el método para reflejar y realizar la conexión de datos se denomina modelo de datos.

Actualmente existen tres modelos de datos populares: el modelo de estructura jerárquica y el modelo de estructura de red basados ​​en la teoría de grafos, y el modelo de estructura de relaciones basado en la teoría de relaciones.

2. Sistemas de bases de datos jerárquicos, en red y relacionales

(1) Modelo de estructura jerárquica

El modelo de estructura jerárquica es esencialmente una estructura dirigida con un nodo raíz. Árbol ordenado (en matemáticas, un "árbol" se define como un gráfico acíclico conectado). El siguiente diagrama muestra la estructura organizativa de una institución de educación superior. Este organigrama es como un árbol. El departamento de la escuela es la raíz (llamado nodo raíz), los departamentos, especialidades, maestros y estudiantes son las ramas (llamadas nodos). La conexión entre la raíz y las ramas se llama la relación entre la raíz y el borde. El borde es 1: N, es decir, solo hay una raíz y N ramas.

El sistema de base de datos establecido según el modelo jerárquico se denomina sistema de base de datos de modelo jerárquico. Ims (Sistema de Gestión de la Información) es su representante típico.

②Modelo de estructura de red

Un sistema de base de datos establecido de acuerdo con una estructura de datos de red se denomina sistema de base de datos de red, y su representante típico es DBTG (Grupo de tareas de base de datos). Las estructuras de datos de cuadrícula se pueden convertir matemáticamente en estructuras de datos jerárquicas.

(3) Modelo de estructura relacional

La estructura de datos relacional simplifica algunas estructuras de datos complejas en relaciones binarias simples (es decir, forma de tabla bidimensional). Por ejemplo, la relación de los empleados en una determinada unidad es una relación binaria.

Un sistema de base de datos compuesto por estructuras de datos relacionales se denomina sistema de base de datos relacional.

En una base de datos relacional, casi todas las operaciones sobre datos se basan en una o más tablas relacionales. La gestión de datos se logra clasificando, fusionando, conectando o seleccionando estas tablas relacionales. DBASEII es un representante típico de este tipo de sistema de gestión de bases de datos. Para un problema de aplicación práctica (como la gestión de personal), a veces se necesitan múltiples relaciones para lograrlo. La relación establecida con dBASEII se denomina base de datos (o archivo de base de datos), y varias bases de datos establecidas correspondientes a múltiples relaciones se denominan sistemas de bases de datos. Otra función importante de dBASEII es utilizar y administrar la base de datos mediante el establecimiento de archivos de comandos. El archivo de secuencia de comandos correspondiente del sistema de base de datos se denomina sistema de aplicación de la base de datos. Por lo tanto, en pocas palabras, una relación se denomina base de datos y varias bases de datos pueden formar un sistema de base de datos. El sistema de base de datos puede exportar varios tipos de archivos auxiliares y establecer su sistema de aplicación.

[Editar este párrafo] Base de datos pública

1. IBM de IBM

Como pionero y pionero en el campo de las bases de datos relacionales, IBM completó System en 1977 A. prototipo de R y comenzó a ofrecer un servidor de base de datos integrado: System/38 en 1980, seguido de SQL/DS para VSE y VM. Su versión inicial estaba estrechamente relacionada con el prototipo de investigación del System R. El objetivo de esta versión es ofrecer la simplicidad, la independencia de los datos y la productividad del usuario prometidas por este nuevo enfoque. DB2 para MVS proporcionó un potente soporte de procesamiento de transacciones en línea (OLTP) en 1988 y soporte de bases de datos distribuidas en 1989 y 1993 respectivamente.

DB2 Universal Database 6.1, lanzado recientemente, es un modelo de base de datos universal. Es el primer sistema de gestión de bases de datos relacionales multimedia con funciones en línea y admite una serie de plataformas, incluido Linux.

2. Oracle

Oracle, anteriormente conocido como SDL, fue creado en 1977 por Larry Ellison y otros dos programadores. Desarrollan sus propios productos de éxito y los venden en grandes cantidades en el mercado. En 1979, Oracle lanzó el primer sistema comercial de gestión de bases de datos relacionales SQL. Oracle es uno de los primeros fabricantes en desarrollar bases de datos relacionales y sus productos admiten la más amplia gama de plataformas de sistemas operativos. Actualmente, los productos de bases de datos relacionales de Oracle tienen la mayor cuota de mercado.

3.Informix

Informix se fundó en 1980 y ofrece productos de bases de datos relacionales profesionales para Unix y otros sistemas operativos abiertos. El nombre de la empresa Informix se deriva de la combinación de Information y Unix. El primer producto de base de datos relacional de Informix que realmente soporta el lenguaje SQL es Informix SE (motor estándar). InformixSE era el principal producto de base de datos en el entorno de microcomputadoras Unix en ese momento. También es el primer producto de base de datos comercial portado a Linux.

4. Sybase

Sybase fue fundada en 1984. El nombre de la empresa "Sybase" proviene de la combinación de "sistema" y "base de datos". Bob Epstein, uno de los fundadores de Sybase, es el diseñador principal de Ingres University Edition (un producto modelo de base de datos relacional al mismo tiempo que System/R). El primer producto de base de datos relacional de la empresa fue Sybase SQLServer 1.0, lanzado en mayo de 1987. Sybase propuso por primera vez la idea de una arquitectura de base de datos cliente/servidor y fue el primero en implementarla en Sybase SQLServer.

5.SQL Server

En 1987, Microsoft cooperó con IBM para desarrollar OS/2, IBM incluyó OS/2Database Manager en su sistema OS/2 ExtendedEdition, pero la línea de productos de Microsoft. Todavía faltaban productos de bases de datos. Por lo tanto, Microsoft centró su atención en Sybase y firmó un acuerdo de cooperación con Sybase para utilizar la tecnología Sybase para desarrollar una base de datos relacional basada en la plataforma OS/2. En 1989, Microsoft lanzó la versión 1.0 de SQL Server.

6. Un sistema de base de datos

PostgreSQL es un sistema de gestión de bases de datos relacionales de objetos (ORDBMS) de software libre y completamente funcional. Muchas de sus funciones son las predecesoras de muchas bases de datos comerciales actuales. PostgreSQL comenzó originalmente como el proyecto Ingres de BSD. Las características de PostgreSQL cubren SQL-2/SQL-92 y SQL-3. Primero, incluye soporte para los tipos de datos más ricos del mundo. En segundo lugar, PostgreSQL es actualmente el único sistema de gestión de bases de datos de software gratuito que admite transacciones, subconsultas, sistemas de control paralelo de múltiples versiones y comprobaciones de integridad de datos.

7.mySQL

MySQL es un pequeño sistema de gestión de bases de datos relacionales desarrollado por la empresa sueca MySQL AB. Fue adquirida por Sun Company el 6 de junio y el 6 de octubre de 2008. Actualmente, MySQL se utiliza ampliamente en sitios web pequeños y medianos en Internet. Debido a su pequeño tamaño, alta velocidad y bajo costo total de propiedad, especialmente de código abierto, muchos sitios web pequeños y medianos eligen MySQL como su base de datos para reducir el costo total de propiedad. El sitio web oficial de MySQL es www.mysql.com.

8. La base de datos Access es un sistema de gestión de bases de datos para microcomputadores lanzado por Microsoft Corporation de Estados Unidos en 1994. Tiene las características de interfaz amigable, fácil de aprender y usar, desarrollo simple, interfaz flexible, etc. Es un típico sistema de gestión de bases de datos de escritorio de nueva generación.

Sus características principales son las siguientes:

(1) Gestiona perfectamente varios objetos de bases de datos, con potentes funciones de organización de datos, gestión de usuarios y control de seguridad.

(2) Potente función de procesamiento de datos. En un entorno de red a nivel de grupo de trabajo, el sistema de gestión de bases de datos multiusuario desarrollado por Access tiene una estructura cliente/servidor y los correspondientes mecanismos de seguridad de la base de datos que no pueden lograr los sistemas de bases de datos tradicionales XBASE (conocidos colectivamente como XBASE y FoxBASE). Access tiene muchas características de los sistemas avanzados de gestión de grandes bases de datos, como capacidades de procesamiento de transacciones/reversión de errores.

(3) Puede generar fácilmente varios objetos de datos y utilizar los datos almacenados para crear formularios e informes, con buena visibilidad.

(4) Como parte de la suite Office, se puede integrar con Office para lograr una conexión perfecta.

(5) Capacidad de utilizar la Web para recuperar y publicar datos y conectarse a Internet. Access es adecuado principalmente para sistemas de aplicaciones pequeños y medianos, o como base de datos de cliente en un sistema cliente/servidor.

9.Base de datos FoxPro

Fue lanzada originalmente por la American Fox Company en 1988. Después de que Microsoft adquiriera Fox Company en 1992, lanzó sucesivamente FoxPro 2.5, 2.6 y VisualFoxPro. Sus funciones y rendimiento se han mejorado enormemente. FoxPro2.5 y 2.6 se dividen en versiones DOS y Windows, ejecutándose en entornos DOS y Windows respectivamente. En comparación con FoxBASE, FoxPro ha mejorado enormemente sus funciones y rendimiento, principalmente mediante la introducción de controles como ventanas, botones, cuadros de lista y cuadros de texto, lo que mejora aún más las capacidades de desarrollo del sistema.