Un informe poco común de análisis del mercado de bases de datos
-Dimensiones de clasificación de la base de datos: relacional/no relacional, transacción/análisis.
Clasificación adicional de las bases de datos NoSQL
-Tamaño del mercado OLTP: las bases de datos relacionales todavía representan una gran parte de los ingresos.
-Cuota de mercado de bases de datos: los servicios en la nube y los proveedores emergentes dominan NoSQL
-Bases de datos de código abierto versus bases de datos comerciales
-Tres campos de bases de datos: proveedores tradicionales y Proveedor de servicios en la nube.
Debido a limitaciones de tiempo, no he escrito mucho recientemente. He reimpreso varias obras maestras de amigos de la base de datos en la cuenta oficial de WeChat. Dicen que soy un aficionado y no estoy capacitado para emitir juicios en este ámbito. Después de ver el siguiente informe, inmediatamente me interesé en aprender y quise compartir algunas ideas que pudiera entender.
Quizás este artículo sea más adecuado para la lectura pública y haga reír a los amigos mayores en el campo de las bases de datos :)
Dimensiones de clasificación de la base de datos: relacional/no relacional, transacción/análisis.
La primera es la dimensión de clasificación. En la figura anterior, el eje vertical se clasifica en bases de datos relacionales (RDBMS) y bases de datos no relacionales (NoSQL), y el eje horizontal se clasifica en bases de datos operativas (OLTP) y bases de datos analíticas (OLAP).
Como de costumbre, echemos un vistazo primero a las bases de datos relacionales. La clase de transacción en la esquina superior izquierda incluye bases de datos comerciales familiares, como Oracle, MS SQL Server, DB2, Infomix, MySQL (MariaDB es una rama del mismo), PostgreSQL y SQL Azure y Amazon Aurora, que son populares al aire libre. campo fuente.
Curiosamente, SAP HANA se sitúa entre lo transaccional y lo analítico. No olvide que SAP también adquirió Sybase. Aunque este último no es lo suficientemente atractivo hoy en día, el servidor SQL de Microsoft surgió de Sybase hace muchos años. La base de datos Sybase ASE y el Sybase IQ analítico todavía existen.
Los productos de análisis en la esquina superior derecha incluyen varios almacenes de datos de columnas conocidos, Pivotal Greenplum, Teradata e IBM Netezza (se ha anunciado el soporte), Google Big Query y Amazon RedShift de gigantes de Internet. En cuanto a la máquina todo en uno del servidor en la nube de base de datos Oracle, también ejecuta la base de datos Oracle que fue diseñada originalmente para OLAP, pero también puede tener en cuenta OLTP en un desarrollo posterior, por lo que es un producto transfronterizo.
Veamos nuevamente las bases de datos no relacionales. Entre los productos transaccionales en la esquina inferior izquierda, hay varios con los que estoy familiarizado, como MongoDB, Redis, Amazon DynamoDB y DocumentDB. Los productos de análisis en la esquina inferior derecha incluyen la famosa rama de Hadoop, Cloudera, Hortonworks (estos dos han sido adquiridos), Bigtable (de Google, HBase en Hadoop es su implementación de código abierto), Elasticsearch, etc.
Obviamente, la clasificación de las bases de datos no relacionales es más compleja y la diferenciación de aplicaciones de los productos es mayor que la de las bases de datos relacionales tradicionales. Willian Blair responsablemente los categoriza aún más.
Clasificación adicional de las bases de datos NoSQL
El diagrama anterior debe ser muy claro. Las bases de datos no relacionales se pueden dividir en almacenamiento basado en documentos, almacenamiento de valores clave, bases de datos basadas en gráficos, series temporales y almacenamiento basado en columnas amplias.
Veamos los productos de cada subcategoría:
Almacenamiento de documentos: MongoDB, Amazon DocumentDB, Azure Cosmos DB y más.
Almacenamiento clave-valor: Redis Labs, Oracle Berkeley DB, Amazon DynamoDB, Aerospike, etc.
Base de datos de gráficos: Nivel 2, Neo4j.
Base de datos de series temporales: InfluxDB, etc.
Columna amplia: DataStax, Cassandra, Apache HBase y Bigtable, etc.
Base de datos multimodelo: NoSQL que admite más de una de las categorías anteriores, como MongoDB, Redis Labs, Amazon DynamoDB y Azure Cosmos DB.
Tamaño del mercado OLTP: las bases de datos relacionales todavía representan una gran parte de los ingresos.
La cuota de mercado de las bases de datos transaccionales mencionadas anteriormente basadas en datos IDC se puede dividir en tres categorías, entre las cuales las bases de datos relacionales Deep Blue (RDBMS, excluidas las bases de datos analíticas/de extracción de datos estadísticos) representan más del 80 % de la cuota de mercado.
La base de datos dinámica (DDMS) es la base de datos no relacional de la que hablamos anteriormente. Esta parte del mercado es muy pequeña (pero el impulso de desarrollo es prometedor). Creo que esto está relacionado con el hecho de que las grandes empresas como Internet utilizan código abierto + autoinvestigación en lugar de comprar productos comerciales.
Según la clasificación estadística de IDC, el “mercado de bases de datos no relacionales” en la parte gris de la figura anterior en realidad se define de manera diferente. Consulte los siguientes párrafos:
Cuota de mercado de bases de datos: los servicios en la nube y los proveedores emergentes dominan NoSQL
Tenga en cuenta que las estadísticas de bases de datos relacionales aquí también incluyen productos de análisis. La participación en los ingresos de Oracle sigue ocupando el primer lugar con un 42%, seguida de Microsoft, IBM, SAP y Teradata.
En la clasificación de DDMS que representa bases de datos no relacionales (aquí también se agregan Hadoop, etc.), los servicios en la nube y los proveedores emergentes se han vuelto dominantes. Debido a que Microsoft tiene la base de SQL Server en la nube, debería estar ligeramente por delante de AWS. Estas dos empresas representan más del 50% de la cuota de mercado, seguidas por Google, Cloudera y Hortonworks (13% combinados).
Las anteriores son "bases de datos no relacionales" en la clasificación tradicional de IDC. IBM y CA deberían centrarse principalmente en productos mainframe. InterSystems tiene una base de datos Caché, que se utiliza en sistemas HIS médicos nacionales (antes funcionaba en Power PC). Eso es todo lo que sé, no escribiré el resto.
Bases de datos de código abierto y bases de datos comerciales
Desde la perspectiva de la popularidad, las bases de datos de código abierto han ido creciendo desde 2013 y casi están alcanzando a las bases de datos comerciales.
La proporción de productos comerciales en bases de datos relacionales sigue siendo tan alta como el 60,5%. Las categorías de esta columna a la izquierda en la tabla anterior son principalmente de código abierto:
Widecloud: abierto. el código fuente representa el 81,8%;
Base de datos de series temporales: el código abierto representa el 80,7%;
Almacenamiento de documentos: el código abierto representa el 80,0%;
Clave- almacenamiento de valor: el código abierto representa el 72,2%;
Base de datos gráfica: el código abierto representa el 68,4%;
Motor de búsqueda: el código abierto representa el 65,3%
Según el modelo de autorización de la licencia de código abierto, el triángulo superior se afloja a medida que desciende. Por ejemplo, MySQL pertenece a GPL y tiene muchos usuarios en la industria de Internet. PostgreSQL está autorizado por BSD y los productos de muchas empresas de bases de datos nacionales se basan en PostgreSQL.
Los tres campos principales de las bases de datos: fabricantes tradicionales y proveedores de servicios en la nube
Al hablar anteriormente sobre la participación de mercado, mencioné que los cuatro gigantes de las bases de datos transaccionales siguen siendo Oracle y Microsoft, IBM y SAP, William Blair los coloca aquí en el primer campo.
Con el continuo aumento de las plataformas en la nube, AWS, Azure y GCP (Google Cloud Platform) han formado otro campo. Según analistas extranjeros, no existe BAT. Como dijo un amigo, los gigantes nacionales de Internet están más orientados a los negocios y existen ciertas ventajas en el desarrollo de nubes públicas en China. Debería ser difícil exportar tecnología a países extranjeros en un corto período de tiempo. (Por supuesto, no creo que a China le falten excelentes talentos en DBA e I+D).
La tercera alineación es más pequeña, pero más centrada en los jugadores de bases de datos.
A continuación, presentaré brevemente las dos primeras series para ver cuáles son los productos de bases de datos específicos.
Estoy relativamente familiarizado con los productos de Oracle, la base de datos Oracle, MySQL y Exadata.
IBM DB2 también es una gran familia. Además de las versiones tradicionales para minicomputadoras, x86 (que pocas personas parecen usar), mainframes z/OS y para i, también existen productos para la nube y la minería de datos. Recuerdo que el dueño de la almohada elogió la tecnología de Informix, pero parece que el desarrollo de este producto no es el ideal.
Además de ejecutar servidores SQL, Microsoft también puede proporcionar bases de datos de código abierto MySQL, PostgreSQL y MariaDB en la nube de Azure. Hay que decir que caminan sobre dos piernas utilizando licencias de software tradicionales + servicios PaaS.
Hoy en día, cuando la gente menciona la base de datos de SAP, piensa en HANA. ASE (Adaptive Server Enterprise) e IQ, adquiridos de Sybase, parecen estar menos desarrollados que antes.
Entre los tres gigantes de las bases de datos de proveedores de servicios en la nube, Microsoft tiene la ventaja inherente de SQL Server e incluso lo trasplantó a Linux para adoptar plataformas de código abierto. Las innovaciones de bases de datos relacionales que vale la pena mencionar son Amazon Aurora y Google Spanner (que también tienen características no relacionales). En cuanto a sus ventajas específicas, no lo fingiré:)
Las bases de datos no relacionales son el apogeo de Amazon, lo que está relacionado con el desarrollo temprano y las mayores ventajas de su negocio de computación en la nube. Los tres artículos clásicos de Google han tenido un profundo impacto en la industria. Basado en este código abierto, Yahoo alguna vez fue casi sinónimo de big data. HBase y Hive ya no son temas candentes, mientras que Bigtable y BigQuery todavía parecen servir al propio negocio de Google. Después de todo, GCP es mucho más pequeño que AWS.
Creo que muchos amigos están familiarizados con la clasificación final de DB-Engines. Los datos de marzo de este año no son los más recientes y solo se enumeran aquí para su referencia. Casi cada vez que se actualizan las clasificaciones, los expertos en bases de datos nacionales escribirán comentarios.
Lo anterior son mis notas de estudio del fin de semana. Espero que te ayude.
Consulte "Mercado de software de bases de datos: el gran cambio tan esperado"
/WP-content/uploads/2065 438+09/03/Database-Software-Market-White Paper .pdf
Lectura adicional: Base de datos y almacenamiento: lo que más queremos saber.
Respete el conocimiento, conserve el texto completo al reimprimir.
¡Gracias por leer y apoyar!