Preparación técnica para la migración de datos
El proceso de conversión y migración de datos se puede dividir a grandes rasgos en tres pasos: extracción, conversión y carga. La extracción y conversión de datos se basan en la relación de mapeo entre las bases de datos del sistema antiguo y nuevo, y el análisis de diferencias de datos es el requisito previo para establecer la relación de mapeo, que también incluye el análisis de diferencias de datos de código. Por lo general, el paso de conversión también incluye el proceso de limpieza de datos, que limpia principalmente datos en la base de datos de origen que son ambiguos, repetitivos, incompletos y violan reglas lógicas o comerciales. Antes de la limpieza, se debe realizar un análisis de la calidad de los datos para identificar los datos problemáticos; de lo contrario, la limpieza de datos no será posible. La carga de datos consiste en cargar los datos de resultados extraídos y transformados en la base de datos de destino a través de una herramienta de carga o un programa SQL escrito por usted mismo.
La inspección de datos incluye los siguientes seis aspectos.
(1) Comprobación del formato de datos. Compruebe si el formato de los datos es coherente y está disponible, y si es necesario que los datos de destino sean de tipo numérico.
(2) Verificación de la longitud de los datos. Comprobar la longitud efectiva de los datos, prestando especial atención a la conversión de campos de tipo char a campos de tipo varchar.
(3) Verifique el rango de intervalo. Comprueba si los datos están contenidos dentro del rango de valores máximo y mínimo definido. Por ejemplo, si la edad es 300 o la fecha de incorporación es 4000-1-1, obviamente esto es un problema.
④ Comprueba los valores nulos y los valores predeterminados. Compruebe si los valores nulos y los valores predeterminados definidos por el sistema antiguo y el nuevo son los mismos. Diferentes sistemas de bases de datos pueden tener diferentes definiciones de valores nulos, lo que requiere atención especial.
(5) Verificación de integridad. Verifique la integridad de los datos relevantes. Por ejemplo, si el valor del código al que se hace referencia existe, es especialmente importante tener en cuenta que algunos sistemas han eliminado las restricciones de clave externa para mejorar la eficiencia después de un período de uso.
⑹Comprobación de coherencia. Verifique si hay datos que lógicamente violen la coherencia, especialmente si hay sistemas que confirman operaciones por separado.