Colección de citas famosas - Slogan de motivación - ¿Cuáles son los pasos básicos del desarrollo de BI? Está diseñado para ayudar a los usuarios principales a acceder a datos sin procesar y no incluye herramientas de generación de informes terminados para profesionales. 2.Herramientas OLAP. Proporciona un entorno de gestión de datos multidimensional, sus aplicaciones típicas son el modelado de problemas empresariales y el análisis de datos empresariales. OLAP también se conoce como análisis multidimensional. 3. Software de minería de datos. Se utilizan técnicas como las redes neuronales y la inducción de reglas para descubrir relaciones entre datos y hacer inferencias basadas en los datos. 4. Mercados de datos y productos de almacenamiento de datos. Incluye software preconfigurado para la transformación, la gestión y el acceso a datos y, a menudo, algunos modelos de negocio, como los modelos de análisis financiero. 5. La definición de Sistema de Información Ejecutiva (EIS) debe ser académica y la mayoría de los clientes no la entienden. De hecho, BI consiste en recopilar y analizar información relevante para ayudarle a tomar decisiones. Los sistemas de inteligencia empresarial más exitosos utilizan tecnología de almacenamiento de datos. Luego, veamos qué es un almacén de datos: un almacén de datos es un almacén de datos de recopilación de datos orientado a temas, integrado, relacionado con el tiempo y no modificable para la gestión y la toma de decisiones empresariales. Su nombre en inglés es Data Warehouse, que puede abreviarse como DW. La definición propuesta por Bill Enmen, el padre del almacenamiento de datos, en su libro de 1991 "Building Data Warehouses" es ampliamente aceptada: un almacén de datos es un sistema orientado a temas, integrado, relativamente estable (no volátil) que refleja cambios históricos. ) conjunto de datos para apoyar la toma de decisiones. ◆Orientado a temas: la organización de datos de la base de datos operativa está orientada a tareas de procesamiento de transacciones, y cada sistema comercial está separado, mientras que los datos en el almacén de datos se organizan según ciertas áreas temáticas. ◆Integración: Los datos en el almacén de datos se obtienen mediante procesamiento, resumen y organización sistemáticos basados ​​en la extracción y limpieza de datos originales dispersos de la base de datos. Se deben eliminar las inconsistencias en los datos de origen para garantizar que la información en el almacén de datos sea consistente y correcta. información global sobre toda la empresa. Relativamente estable: los datos del almacén de datos se utilizan principalmente para el análisis de la toma de decisiones empresariales y las operaciones de datos involucradas son principalmente consultas de datos. Una vez que ciertos datos ingresan al almacén de datos, generalmente se almacenarán durante mucho tiempo, es decir, hay una gran cantidad de operaciones de consulta en el almacén de datos, pero hay muy pocas operaciones de modificación y eliminación. Por lo general, solo se necesitan operaciones periódicas. cargando y refrescando. ◆Reflejar cambios históricos: los datos en el almacén de datos generalmente contienen información histórica, que registra sistemáticamente la información de la empresa desde un cierto punto en el pasado (como el momento de la aplicación del almacén de datos) hasta la etapa actual. A través de esta información se pueden realizar análisis cuantitativos y predicciones sobre el proceso de desarrollo y las tendencias futuras de la empresa. El almacenamiento de datos es un proceso, no un proyecto. El sistema de almacén de datos es una plataforma que proporciona información. Obtiene datos de sistemas de procesamiento empresarial, los organiza principalmente mediante esquemas en estrella y modelos de copo de nieve y proporciona a los usuarios diversos medios para obtener información y conocimiento a partir de los datos. Desde un punto de vista estructural, un sistema de almacenamiento de datos debe incluir al menos tres partes clave: recopilación de datos, almacenamiento de datos y acceso a los datos. ¿Qué es un almacén de datos? Actualmente, no existe una definición unificada del término almacén de datos. El famoso experto en almacenes de datos W.H. Inmon dio la siguiente descripción en el libro "Building a Data Warehouse": Un almacén de datos es un conjunto de datos orientado a un tema, integrado, no volátil y que varía en el tiempo, que se utiliza para respaldar las decisiones de gestión. Podemos entender el concepto de almacén de datos desde dos niveles. En primer lugar, los almacenes de datos se utilizan para apoyar la toma de decisiones y el procesamiento de datos orientado al análisis, que son diferentes de las bases de datos operativas existentes de las empresas. En segundo lugar, el almacén de datos es una integración eficaz de múltiples fuentes de datos heterogéneas. Después de la integración, se reorganiza según temas y contiene datos históricos, y los datos almacenados en el almacén de datos generalmente no se modifican. Según el concepto de almacén de datos, el almacén de datos tiene las siguientes cuatro características: 1. Orientado al tema. La organización de datos de las bases de datos operativas está orientada a tareas de procesamiento de transacciones, y cada sistema empresarial está separado entre sí, mientras que los datos en el almacén de datos se organizan según determinadas áreas temáticas. Un tema es un concepto abstracto que hace referencia a aspectos clave que interesan a los usuarios a la hora de tomar decisiones utilizando un almacén de datos. Un tema suele ser relevante para más de un sistema de información operativa. 2. Integrado. Las bases de datos operativas orientadas a transacciones generalmente están asociadas con algunas aplicaciones específicas, y estas bases de datos son independientes entre sí y, a menudo, heterogéneas. Los datos en el almacén de datos se obtienen mediante procesamiento, resumen y organización sistemáticos sobre la base de la extracción y limpieza de los datos originales dispersos de la base de datos. Se deben eliminar las inconsistencias en los datos de origen para garantizar que la información en el almacén de datos sea consistente y global sobre toda la empresa. 3. Relativamente estable. Los datos de las bases de datos operativas normalmente se actualizan en tiempo real y los datos cambian según sea necesario.

¿Cuáles son los pasos básicos del desarrollo de BI? Está diseñado para ayudar a los usuarios principales a acceder a datos sin procesar y no incluye herramientas de generación de informes terminados para profesionales. 2.Herramientas OLAP. Proporciona un entorno de gestión de datos multidimensional, sus aplicaciones típicas son el modelado de problemas empresariales y el análisis de datos empresariales. OLAP también se conoce como análisis multidimensional. 3. Software de minería de datos. Se utilizan técnicas como las redes neuronales y la inducción de reglas para descubrir relaciones entre datos y hacer inferencias basadas en los datos. 4. Mercados de datos y productos de almacenamiento de datos. Incluye software preconfigurado para la transformación, la gestión y el acceso a datos y, a menudo, algunos modelos de negocio, como los modelos de análisis financiero. 5. La definición de Sistema de Información Ejecutiva (EIS) debe ser académica y la mayoría de los clientes no la entienden. De hecho, BI consiste en recopilar y analizar información relevante para ayudarle a tomar decisiones. Los sistemas de inteligencia empresarial más exitosos utilizan tecnología de almacenamiento de datos. Luego, veamos qué es un almacén de datos: un almacén de datos es un almacén de datos de recopilación de datos orientado a temas, integrado, relacionado con el tiempo y no modificable para la gestión y la toma de decisiones empresariales. Su nombre en inglés es Data Warehouse, que puede abreviarse como DW. La definición propuesta por Bill Enmen, el padre del almacenamiento de datos, en su libro de 1991 "Building Data Warehouses" es ampliamente aceptada: un almacén de datos es un sistema orientado a temas, integrado, relativamente estable (no volátil) que refleja cambios históricos. ) conjunto de datos para apoyar la toma de decisiones. ◆Orientado a temas: la organización de datos de la base de datos operativa está orientada a tareas de procesamiento de transacciones, y cada sistema comercial está separado, mientras que los datos en el almacén de datos se organizan según ciertas áreas temáticas. ◆Integración: Los datos en el almacén de datos se obtienen mediante procesamiento, resumen y organización sistemáticos basados ​​en la extracción y limpieza de datos originales dispersos de la base de datos. Se deben eliminar las inconsistencias en los datos de origen para garantizar que la información en el almacén de datos sea consistente y correcta. información global sobre toda la empresa. Relativamente estable: los datos del almacén de datos se utilizan principalmente para el análisis de la toma de decisiones empresariales y las operaciones de datos involucradas son principalmente consultas de datos. Una vez que ciertos datos ingresan al almacén de datos, generalmente se almacenarán durante mucho tiempo, es decir, hay una gran cantidad de operaciones de consulta en el almacén de datos, pero hay muy pocas operaciones de modificación y eliminación. Por lo general, solo se necesitan operaciones periódicas. cargando y refrescando. ◆Reflejar cambios históricos: los datos en el almacén de datos generalmente contienen información histórica, que registra sistemáticamente la información de la empresa desde un cierto punto en el pasado (como el momento de la aplicación del almacén de datos) hasta la etapa actual. A través de esta información se pueden realizar análisis cuantitativos y predicciones sobre el proceso de desarrollo y las tendencias futuras de la empresa. El almacenamiento de datos es un proceso, no un proyecto. El sistema de almacén de datos es una plataforma que proporciona información. Obtiene datos de sistemas de procesamiento empresarial, los organiza principalmente mediante esquemas en estrella y modelos de copo de nieve y proporciona a los usuarios diversos medios para obtener información y conocimiento a partir de los datos. Desde un punto de vista estructural, un sistema de almacenamiento de datos debe incluir al menos tres partes clave: recopilación de datos, almacenamiento de datos y acceso a los datos. ¿Qué es un almacén de datos? Actualmente, no existe una definición unificada del término almacén de datos. El famoso experto en almacenes de datos W.H. Inmon dio la siguiente descripción en el libro "Building a Data Warehouse": Un almacén de datos es un conjunto de datos orientado a un tema, integrado, no volátil y que varía en el tiempo, que se utiliza para respaldar las decisiones de gestión. Podemos entender el concepto de almacén de datos desde dos niveles. En primer lugar, los almacenes de datos se utilizan para apoyar la toma de decisiones y el procesamiento de datos orientado al análisis, que son diferentes de las bases de datos operativas existentes de las empresas. En segundo lugar, el almacén de datos es una integración eficaz de múltiples fuentes de datos heterogéneas. Después de la integración, se reorganiza según temas y contiene datos históricos, y los datos almacenados en el almacén de datos generalmente no se modifican. Según el concepto de almacén de datos, el almacén de datos tiene las siguientes cuatro características: 1. Orientado al tema. La organización de datos de las bases de datos operativas está orientada a tareas de procesamiento de transacciones, y cada sistema empresarial está separado entre sí, mientras que los datos en el almacén de datos se organizan según determinadas áreas temáticas. Un tema es un concepto abstracto que hace referencia a aspectos clave que interesan a los usuarios a la hora de tomar decisiones utilizando un almacén de datos. Un tema suele ser relevante para más de un sistema de información operativa. 2. Integrado. Las bases de datos operativas orientadas a transacciones generalmente están asociadas con algunas aplicaciones específicas, y estas bases de datos son independientes entre sí y, a menudo, heterogéneas. Los datos en el almacén de datos se obtienen mediante procesamiento, resumen y organización sistemáticos sobre la base de la extracción y limpieza de los datos originales dispersos de la base de datos. Se deben eliminar las inconsistencias en los datos de origen para garantizar que la información en el almacén de datos sea consistente y global sobre toda la empresa. 3. Relativamente estable. Los datos de las bases de datos operativas normalmente se actualizan en tiempo real y los datos cambian según sea necesario.

Los datos del almacén de datos se utilizan principalmente para el análisis de la toma de decisiones empresariales, y las operaciones de datos involucradas son principalmente consultas de datos. Una vez que ciertos datos ingresan al almacén de datos, generalmente se almacenarán durante mucho tiempo, es decir, hay una gran cantidad de operaciones de consulta en el almacén de datos, pero hay muy pocas operaciones de modificación y eliminación. para ser cargado y actualizado periódicamente. 4. Reflejar cambios históricos. Las bases de datos operativas se centran principalmente en los datos actuales en un período determinado, mientras que los datos en los almacenes de datos generalmente contienen información histórica, que registra sistemáticamente la información de la empresa desde un cierto punto en el pasado (como el momento de la aplicación del almacén de datos) hasta el actual. etapas. A través de esta información se pueden realizar análisis cuantitativos y predicciones sobre el proceso de desarrollo y las tendencias futuras de la empresa. La construcción del almacén de datos empresarial se basa en el sistema comercial existente de la empresa y la acumulación de grandes cantidades de datos comerciales. El almacén de datos no es un concepto estático. La información sólo puede ser útil y eficaz si se proporciona de manera oportuna a los usuarios que la necesitan para que puedan tomar decisiones para mejorar las operaciones comerciales. Organizar, resumir y reorganizar la información y proporcionarla a los responsables de la toma de decisiones de gestión correspondientes de manera oportuna es la tarea fundamental del almacén de datos. Por tanto, desde la perspectiva de la industria, la construcción de un almacén de datos es un proyecto y un proceso. Todo el sistema de almacenamiento de datos tiene una arquitectura de cuatro capas, como se muestra en la siguiente figura. Fuente de datos de la arquitectura del sistema de almacenamiento de datos: es la base del sistema de almacenamiento de datos y la fuente de datos de todo el sistema. Suele incluir información interna e información externa. La información interna incluye varios datos de procesamiento comercial y varios datos de documentos almacenados en RDBMS. La información externa incluye diversas leyes y regulaciones, información de mercado, información de la competencia, etc. Almacenamiento y gestión de datos: es el núcleo de todo el sistema de almacenamiento de datos. La verdadera clave de un almacén de datos es el almacenamiento y la gestión de datos. El modelo de organización y gestión del data warehouse determina que se diferencia de las bases de datos tradicionales y también determina su forma de expresión de datos externos. Para decidir qué productos y tecnologías utilizar para construir el núcleo del almacén de datos, es necesario analizar las características técnicas del almacén de datos. Extraiga, limpie, integre y organice eficazmente datos de sistemas empresariales existentes según temas. Según la cobertura de datos, los almacenes de datos se pueden dividir en almacenes de datos de nivel empresarial y almacenes de datos de nivel departamental (a menudo llamados data marts). Servidor OLAP: integra de manera efectiva los datos necesarios para el análisis y los organiza de acuerdo con modelos multidimensionales para realizar análisis de múltiples ángulos y niveles y descubrir tendencias. Su implementación específica se puede dividir en ROLAP, MOLAP y HOLAP. Los datos básicos y agregados de ROLAP se almacenan en RDBMS; los datos básicos y agregados de MOLAP se almacenan en bases de datos multidimensionales; los datos básicos de HOLAP se almacenan en RDBMS y los datos agregados se almacenan en bases de datos multidimensionales. Herramientas de front-end: incluyen principalmente varias herramientas de informes, herramientas de consulta, herramientas de análisis de datos, herramientas de minería de datos y diversas herramientas de desarrollo de aplicaciones basadas en almacenes de datos o mercados de datos. Entre ellas, las herramientas de análisis de datos están dirigidas principalmente a servidores OLAP, mientras que las herramientas de informes y de minería de datos están dirigidas principalmente a almacenes de datos. Actualmente, no existe una definición unificada del término almacén de datos. El famoso experto en almacenes de datos W.H. Inmon dio la siguiente descripción en su libro "Building Data Warehouses": Los almacenes de datos están orientados a temas, están integrados, son relativamente estables y reflejan cambios históricos (tiempo). Podemos entender el concepto de almacén de datos desde dos niveles. En primer lugar, los almacenes de datos se utilizan para apoyar la toma de decisiones y el procesamiento de datos orientado al análisis, que son diferentes de las bases de datos operativas existentes de las empresas. En segundo lugar, el almacén de datos es una integración eficaz de múltiples fuentes de datos heterogéneas. Después de la integración, se reorganiza según temas y contiene datos históricos, y los datos almacenados en el almacén de datos generalmente no se modifican. Composición del almacén de datos multidimensional La base de datos del almacén de datos es el núcleo de todo el entorno del almacén de datos y es el lugar donde se almacenan los datos y se proporciona soporte para su recuperación. En comparación con las bases de datos manipuladas, su característica sobresaliente es su soporte para datos masivos y tecnología de recuperación rápida. Las herramientas de extracción de datos extraen datos de varios métodos de almacenamiento, los transforman, los clasifican y los almacenan en un almacén de datos. Acceder a diferentes métodos de almacenamiento de datos es clave para las herramientas de extracción de datos. Estas herramientas deberían poder generar programas COBOL, MVS Job Control Language (JCL), scripts UNIX y declaraciones SQL para acceder a diferentes datos. La transformación de datos incluye eliminar segmentos de datos que no son significativos para las aplicaciones de toma de decisiones; convertirlos en nombres y definiciones de datos unificados; calcular estadísticas y datos derivados; asignar datos de valores predeterminados a valores predeterminados y unificar definiciones de datos dispares; Metadatos Los metadatos son datos que describen la estructura y los métodos de creación de datos en el almacén de datos. Según los diferentes usos, se pueden dividir en dos categorías, metadatos técnicos y metadatos comerciales.