Caso real|¿Cómo construir un sistema de indicadores de datos con referencia a Alibaba OneData?
Antes del establecimiento de OneData, Alibaba Data tenía más de 30.000 indicadores, incluso con el mismo nombre, las definiciones eran inconsistentes. Incluso para las empresas medianas, a medida que aumenta la cantidad de datos, habrá cada vez más indicadores de datos y surgirán varios problemas en la gestión sin un sistema de indicadores.
1. Problemas causados por indicadores no estándar
Cuando el concepto de indicadores de datos = 0, es difícil medir el efecto del fin del negocio actuando según "Creo" .
Los estudiantes de diseño y operaciones de productos suelen decir: Creo que a los usuarios les gustarán nuestras nuevas funciones, creo que las nuevas actividades tendrán buenos efectos... Entonces el líder preguntará si hay alguna base para esto. sentimiento"? ? ¿Cómo medir si a los usuarios les gusta esta nueva característica? ¿Cómo juzgar la efectividad de una actividad, cuántas personas participaron o cuántas conversiones hubo?
De hecho, los diseñadores están confundidos acerca de este tipo de problema y parecen desconcertados. No preguntes por los motivos del diseño, solo responde que otros productos de la competencia también tienen esta función, por eso nosotros también la hacemos... ¿Sientes que te han engañado?
Sin embargo, una gran cantidad de personal de productos se ha dado cuenta de que la era del diseño ciego tradicional y el diseño plagio ha pasado y ha llegado la era de los productos digitales. Han comenzado a intentar utilizar indicadores de datos para ayudar. decisiones de negocios. Entonces comencé a pasar a la siguiente etapa...
En este momento, el concepto del indicador de datos = 0.5 Hay un solo punto en el indicador de datos, pero es difícil ver el problema comercial general.
En este caso, qué indicadores de negocio se utilizan generalmente. Por ejemplo, vemos que los proveedores de análisis de datos como Toilet God y Umeng generalmente usan GMV, usuarios activos diarios, usuarios activos mensuales, PV, UV, tiempo de permanencia en la página y otros datos, por lo que el diseñador del producto primero copia estos datos y luego Ven. Cree algunos indicadores basados en el uso específico y luego agréguelos uno por uno.
Tomemos como ejemplo el transporte online. El GMV de hoy ha bajado un 50%. ¿Cuál es la razón? Respuesta del analista: Afectados por la epidemia, los pedidos de pasajeros cayeron un 20%.
Este es el indicador actual de la plataforma. ¿Qué pasa con el 30%? ¿Cuál es el problema? Entonces, los analistas descubrieron que el número de conductores que solicitaban viajes en línea y tomaban pedidos había disminuido en un 30%, por lo que describieron tentativamente el significado comercial de estos dos indicadores. Después de una serie de comunicación y coordinación, agregaron temporalmente I + D.
¿Qué hay de malo en este enfoque? 1) El costo de la modificación del índice es alto. El equipo de I+D necesita recopilar, limpiar y almacenar los datos nuevamente. 2) Los valores no están claramente definidos y los datos son inexactos. 3) Los indicadores carecen de definiciones estandarizadas y son difíciles de entender para varios departamentos. Habrá algunos indicadores duplicados, como indicadores con el mismo nombre pero diferentes sinónimos. Por ejemplo, a todos se les llama conductores registrados. Una definición es que un registro exitoso de un número de teléfono móvil es un conductor registrado. Una definición es que el conductor registrado se une exitosamente. 4) Altos costos de almacenamiento, computación e I + D: no existe una gestión unificada y estandarizada, lo que resulta en un desperdicio de recursos debido a cálculos repetidos, el nivel y la granularidad de los datos no están claros, lo que genera un almacenamiento duplicado grave.
En segundo lugar, comprenda las especificaciones del indicador OneData.
Dado que habrá muchos problemas si el sistema de indicadores no se diseña de antemano, ¿cuál es el proceso de diseño del cuerpo del indicador? ¿Cómo garantizar la estandarización del diseño del sistema de indicadores? Echemos un vistazo a cómo Alibaba formula las especificaciones de índice.
Sobre la base del modelado dimensional, cree una matriz de bus y defina dominios comerciales, dominios de datos, procesos comerciales, métricas/índices atómicos, dimensiones, atributos de dimensión, modificadores, tipos de modificadores, períodos de tiempo e índice de derivación. etc.
Dominio empresarial
El método de división empresarial con una dimensión más alta que el dominio de datos es adecuado para sistemas empresariales muy grandes, y los indicadores o la superposición empresarial entre sectores empresariales son pequeños. Por ejemplo, el segmento de negocios de automóviles privados incluye terminales de pasajeros y terminales de conductores, y el segmento de negocios de comercio electrónico incluye centros comerciales y módulos de reembolsos.
Proceso de negocio
El proceso de negocio se puede resumir como eventos de comportamiento indivisibles, como facturación, pago, evaluación y otros procesos/eventos de negocio. Los acontecimientos aquí son similares a los del lugar del entierro. Ver detalles.
Diseño de eventos enterrados
Al ver esta serie de términos, muchas personas pueden confundirse, pero el ámbito empresarial aún puede entenderlos. En resumen, es la clasificación de diferentes negocios; el proceso de negocio también es fácil de entender, lo que equivale a dibujar un diagrama de flujo de negocio.
Entonces, ¿dónde está el carácter sagrado del dominio de datos?
Dominio de datos
: es una colección de temas de datos estrechamente relacionados y una clasificación conceptual muy general de objetos comerciales. El propósito es facilitar la gestión y aplicación de datos. En resumen, el dominio de los datos es similar al escritorio de nuestra computadora. Necesitamos crear diferentes carpetas para almacenar datos. Estas carpetas se denominan campos de datos.
¿Cómo entender las dimensiones, los atributos de las dimensiones y la decoración? ¿De qué sirve?
Dimensión
: Es un entorno de medición utilizado para reflejar un atributo empresarial. El conjunto de estos atributos forma una dimensión que puede verse en términos de quién-dónde-cuándo-qué.
Atributos de dimensión
: Los atributos de dimensión pertenecen a la dimensión y son equivalentes a la descripción específica de la dimensión. Por ejemplo, el género en la dimensión del usuario es masculino o femenino.
Calificador
: Se refiere a escenarios de negocio para indicadores distintos a las dimensiones estadísticas.
Tipo de modificación
División abstracta de modificadores.
En resumen, las dimensiones y modificaciones pueden entenderse como algunas condiciones restrictivas de los indicadores atómicos. Las personas que conocen SQL pueden comprender mejor cuando escriben SQL, generalmente se colocan después de la declaración donde.
Índice Métrico/Atómico
: Indicador atómico y medida tienen el mismo significado. Las mediciones de eventos de comportamiento empresarial son indicadores integrales en la definición de negocio, como el número de registros.
Período
: Se utiliza para especificar el rango de tiempo o punto de tiempo para las estadísticas de datos, como los últimos 30 días, semanas naturales, a partir de hoy, etc.
Tipos de indicadores
: incluidos indicadores atómicos e indicadores derivados. Indicador atómico = evento de comportamiento + indicador derivado de medición = un indicador atómico + múltiples modificaciones + período de tiempo.
Por ejemplo, índice atómico = pedidos completados, índice derivado = pedidos completados para pasajeros de iOS la semana pasada, donde período de tiempo = la semana pasada, modificación = iOS, dimensión = pasajeros, índice atómico = volumen de pedidos completado.
En tercer lugar, formule sus propias especificaciones del sistema de indicadores.
A continuación, consulte el estándar de datos onedata de Alibaba para crear indicadores de datos en el sistema de transporte compartido en línea.
Antecedentes empresariales: el negocio del automóvil es el núcleo del negocio general de vehículos compartidos en línea. En el proceso de múltiples iteraciones, existen problemas como definiciones de indicadores no estándar, introducción frecuente de nuevos indicadores por parte de las partes comerciales y dificultades en las modificaciones técnicas. Por tanto, es necesario reconstruir el sistema de indicadores desde la perspectiva del negocio en general.
Objetivo empresarial: Estandarizar el sistema de indicadores y mejorar la eficiencia de la extracción de indicadores.
Acción: En el proceso de construcción de un sistema de indicadores, la primera acción es aclarar la clasificación de los indicadores y el método de denominación de los indicadores vinculantes, de modo que se pueda entender el significado de cada indicador y reducir los costos de comunicación. ser reducido. Aquí nos referimos a la división de indicadores de Alibaba para estandarizar la construcción del sistema de indicadores.
Paso 1: Investigar las necesidades del negocio y analizar los procesos de negocio.
1. Investigar las necesidades empresariales
Una investigación empresarial adecuada es la base para construir un sistema de indicadores. Antes de comenzar el proyecto de construcción del sistema de indicadores de datos, es necesario comprender el negocio específico y clasificar en detalle los procesos comerciales clave con cada parte comercial.
La recopilación de requisitos se divide en dos tipos: recopilación cuantitativa y recopilación cualitativa. Se utilizan cuestionarios cuantitativos para recopilar requisitos comerciales extensos; se realizan entrevistas cualitativas a los usuarios para explorar en profundidad los escenarios de aplicaciones comerciales y los requisitos básicos. Métodos detallados de recopilación y análisis de requisitos.
Recopilación de requisitos y análisis de demanda
Este artículo ya está escrito, por lo que no lo ampliaré aquí como referencia.
2. Analizar los procesos de negocio
Según las mejores prácticas de Alibaba onedata, los procesos de negocio se pueden resumir como eventos de comportamiento indivisibles. Para aclarar la relación lógica y la dirección del flujo entre los datos, primero debemos comprender el proceso comercial del usuario y los sistemas de datos involucrados en el proceso comercial.
Tomemos el sistema de transporte en línea como ejemplo para clasificar los procesos comerciales y los indicadores de datos de conductores y pasajeros.
El flujo de clientes se puede dividir en: registro/inicio de sesión, pedidos, servicio, pago, evaluación/quejas de servicio al cliente.
Indicadores de negocio generados por el proceso central: 1) Etapa de registro/inicio de sesión: número de nuevos usuarios, número de usuarios de diferentes canales 2) Etapa de pedido: número de pedidos, número de pedidos realizados por nuevos usuarios, número de pedidos realizados por usuarios antiguos, datos sobre el número de pedidos realizados en diferentes ciudades, datos sobre el número de pedidos realizados en diferentes modelos y el número de usuarios exitosos 3) Etapa de toma de decisiones: el número de pedidos negociados, el número de pedidos no negociados, número de pedidos cancelados activamente por los usuarios en la etapa de toma de decisiones, etc. Número de pedidos completados con aumento de precio y número de pedidos completados con reducción de precio 4) Etapa de servicio: número de usuarios que realizaron pedidos con éxito, duración del pedido, tasa de éxito del pedido, monto de finalización del pedido, tasa de finalización del pedido y número de usuarios que completaron pedidos 5 ) Etapa de pago: monto del pedido, monto promedio del pedido, monto de descuento del pedido y diferencia de la factura 6) Etapa de evaluación: tasa positiva y tasa negativa.
El proceso de negocio del conductor se puede dividir en:
Indicadores de negocio centrales generados en el proceso de negocio: 1) Etapa de registro/inicio de sesión: número de usuarios registrados, número de nuevos usuarios 2) Etapa de incorporación: número de usuarios que se presentaron para revisión, número de usuarios que aprobaron la revisión, número de conductores recién registrados, registros acumulados, número de conductores antiguos, número de conductores nuevos 3) Etapa de recepción: número de conductores en línea, número de conductores que participan pedidos, número de conductores válidos que reciben pedidos, número de conductores ganadores de ofertas, tasa de número de ofertas ganadoras, número promedio diario de postores ganadores 4) Etapa de toma de decisiones: número de pedidos cancelados por los conductores en la etapa de toma de decisiones 5) Servicio: distancia promedio de servicio, duración promedio, distancia promedio de ralentí, duración promedio de ralentí 6) Evaluación: calificación positiva del conductor, calificación negativa del conductor, calificación promedio de estrellas Nivel 7) Retiro: saldo del conductor, número de retiros y monto del retiro.
Después de definir el proceso comercial del usuario, es necesario dividir el dominio de datos de acuerdo con el negocio determinado por el análisis y desarmar el proceso comercial específico en el dominio de datos correspondiente.
Paso 2: Dividir dominios de datos
Dominio de datos: una colección de temas de datos estrechamente relacionados, así como una clasificación conceptual altamente generalizada de objetos comerciales, con el propósito de promover la gestión de datos. y aplicación.
Esto equivale a clasificar datos, similar a crear diferentes carpetas en el escritorio de nuestro ordenador para almacenar datos. Nuestros datos son para diferente personal empresarial, como marketing, operaciones, atención al cliente, control de riesgos, etc., pero los módulos empresariales en los que se centran son muy diferentes.
Y nuestro personal técnico también tiene que proporcionarles varios indicadores de datos, la eficiencia de búsqueda es baja, el costo de computación del servidor es alto (piense si es muy lento buscar un nombre de archivo en la computadora cuadro de búsqueda) y el personal de la empresa. Es difícil obtener datos de manera oportuna. No hay otra manera, así que clasificaré los datos para que podamos buscarlos rápidamente y expandirlos horizontalmente en el futuro.
Por lo tanto, al dividir los dominios de datos, también debemos prestar atención a: 1) poder cubrir todas las necesidades comerciales actuales; 2) poder extender nuevos servicios a los dominios de datos existentes o expandir nuevos dominios de datos.
Esto equivale a nombrar una carpeta en su computadora, que debe contener todos los archivos (datos) actuales. Cuando se genera un archivo nuevo, se puede colocar dentro de un archivo existente o se puede crear cómodamente un archivo nuevo.
El dominio de datos se puede dividir según los requisitos comerciales de cada módulo y el análisis de los procesos comerciales. Por lo general, el dominio de datos se puede dividir según departamentos empresariales, como servicio al cliente, operaciones, marketing, etc. También se puede dividir según procesos de negocio o módulos funcionales de sectores de negocio.
Por ejemplo, el dominio del negocio de automóviles en el sistema de transporte de automóviles en línea se puede dividir en dominios de datos como se muestra en la siguiente tabla. Los dominios de datos se pueden resumir y abstraer en función del proceso comercial real.
Paso 3: Definir la especificación del índice: construcción de la matriz de bus
Seleccionamos el marco general del dominio comercial, el dominio de datos y el proceso comercial, y luego diseñamos la especificación del índice.
En pocas palabras, es equivalente a diseñar las especificaciones de la estructura de directorios de primer, segundo y tercer nivel de la carpeta. Ahora es necesario diseñar la especificación de la estructura de nombres de archivos.
Los indicadores de uso común se denominan básicamente según la comprensión personal y no hay especificaciones especiales, como la cantidad de usuarios diarios/mensuales, la cantidad de pedidos realizados en el último mes y la cantidad de pedidos completados. órdenes. Sin embargo, con el aumento de los indicadores de datos, hay muchos indicadores en condiciones limitadas, como el volumen de pedidos de Beijing Express en siete días. ¿Cómo está diseñado este indicador? ¿Existe un conjunto de indicadores diseñados de forma estandarizada?
Como se muestra en la figura anterior, al diseñar indicadores, es necesario aclarar el dominio de negocios = negocio de automóviles, dominio de datos = dominio de servicios, proceso de negocios = orden, dimensión = ciudad, atributo = Beijing, tiempo período = últimos 7 días, Cantidad modificada = a través del tren, medición/indicador atómico = cantidad del pedido. Al agregar restricciones a los indicadores atómicos y estandarizar los indicadores derivados generados = volumen de pedidos de Beijing Express en los últimos 7 días, se proporciona un conjunto de estándares comunes de definición de indicadores para facilitar que el personal de diferentes departamentos comerciales comprenda el significado de los indicadores.
Tomando como ejemplo el dominio de servicio en el sistema de transporte en línea, se formula la siguiente matriz de autobús, que divide el proceso de negocio en recepción de pedidos, programación, toma de decisiones, inicio del viaje, y completar el pedido.
Los arquitectos de almacenes suelen utilizar matrices de bus, que son difíciles de entender para el personal de productos. De hecho, es similar a las matrices y permutaciones en matemáticas. La combinación de restricciones de dimensión de un índice atómico es diferente y se pueden obtener miles de índices derivados.
Resumen
Este artículo presenta principalmente cómo construir un sistema de indicadores de transporte en línea basado en Alibaba OneData desde la perspectiva de los productos de datos. A través del análisis de negocios, la división del dominio de datos y la construcción de una matriz de bus, se estableció un conjunto de especificaciones de diseño de indicadores. Al establecer especificaciones de indicadores, se puede mejorar la eficiencia de la adquisición de indicadores por parte de I+D y las partes comerciales, sentando las bases para un análisis de autoservicio posterior.
En el proceso de diseño de especificaciones de indicadores, descubrimos que se generarán miles de indicadores. ¿Cuál de estas métricas realmente proporciona orientación al sector empresarial?
El siguiente artículo explicará cómo determinar los indicadores comerciales centrales basados en el modelo OSM y el modelo AARRR, y cómo diseñar un diccionario de indicadores.