¿Conversión del código de ubicación al código estándar nacional y al código de máquina?
1. Código de área
Utilice el código de área 01~94 y el número de bit 01~94 para representar la codificación de caracteres chinos. Es un número decimal de 4 dígitos. Los dígitos representan el código de área. Los dos últimos dígitos representan el número de bit. Cada fila se denomina "área" y se numera del 01 al 94. Cada columna se denomina "bit" y se numera del 01 al 94. Representa la posición de cada personaje. Se llama "mapa de ubicación".
El código que utiliza la posición del personaje en el mapa de ubicación para representar al personaje se llama "código de ubicación". Por ejemplo, el código de ubicación de "ah" es 1601.
2. ¿Código estándar nacional?
El resultado de codificar estos números es el "Código estándar nacional", denominado "Código estándar nacional", también conocido como "Intercambio de caracteres chinos". ¿Código"?
El código estándar nacional consta de dos bytes, los bits más altos del byte alto y del byte bajo son 0, similar al código ASCII estándar de 7 bits. ?
El método de codificación consiste en convertir el código de área y el código de bits expresados en decimal al código de área y el código de bits expresados en hexadecimal, y luego hablar sobre el byte alto (primer byte) de este código. Agregue 20H (100000B) al byte bajo (segundo byte) respectivamente para obtener el código estándar nacional. El motivo para agregar 20H a cada byte es evitar los 32 caracteres de control en la tabla de códigos ASCII. ?
Por ejemplo, el código de área de "ah" es 1601. Para calcular el código estándar nacional de "ah", primero agregue 32 al código de área y al código de bits de "ah" respectivamente, y el El código de área es 16+32=48= 30H, código de bits 01+32=33=21H, por lo que el código estándar nacional de "Ah" es 3021H.
3. ¿Código en la máquina?
Para resolver la ambigüedad entre el código ASCII y el código estándar nacional cuando los colegas lo usan, el byte alto y el bit más alto del byte bajo. Se analiza el código estándar nacional. B7 se cambia a 1 o se agrega 0x80 a cada byte. El código resultante se denomina código interno, que a menudo se abrevia como "código interno".
Se sabe que el código estándar nacional de "ah" es 3021H y el código binario es: (0011000) (00100001). Establezca el bit más alto de cada byte en 1 y obtenga (10110000). (10100001) como binario El código incorporado se convierte a hexadecimal y es B0A1H (código incorporado).
Código en la máquina = código estándar nacional + 8080H
Información ampliada:
Promover la aplicación del Pinyin chino y realizar la transición gradual a la coexistencia y el uso de Caracteres chinos y caracteres chinos Pinyin. Este es un sistema de doble vía. En el campo del procesamiento de información de caracteres chinos, la coexistencia y uso de códigos fonéticos y códigos gráficos también es un sistema de doble vía. Por lo tanto, muchas personas creen que es mejor adoptar un sistema de doble vía por las siguientes cinco razones:
Para las personas que dominan el mandarín, usar códigos fonéticos es más conveniente y rápido que los códigos gráficos. Aunque el código de forma es más lento, puede ingresar cualquier carácter chino (incluidos los caracteres antiguos). Usando pistas duales, los caracteres que el operador conoce se pueden ingresar según el sonido, y los caracteres que no conoce se pueden ingresar según la forma. Las personas que saben mandarín pueden ingresar según el sonido, y las personas con una buena pronunciación del mandarín pueden ingresar. según la forma.
Para unidades que usan una pequeña cantidad de palabras, la entrada fonética no es un problema, pero para unidades que usan muchas palabras, la entrada fonética no es tan buena como la entrada fonética porque la mayoría de las personas solo pueden pronunciar parte de los caracteres chinos.
La entrada de formas (especialmente la entrada general) es muy adecuada para ciertos tipos de trabajo de procesamiento de información china, como contar caracteres chinos, pero es impotente para otros tipos de trabajo, como contar sonidos chinos (fonología y escritura); tonos). La entrada de tono es todo lo contrario. Las dos pistas simplemente se complementan.
Algunos códigos gráficos pueden ocuparse de una variedad de caracteres chinos (como los kanji japoneses y los kanji surcoreanos), mientras que los códigos fonéticos pueden segmentar palabras y concatenarlas para facilitar un mayor procesamiento de información.
Una solución de doble vía adecuada no aumentará los problemas del equipo. Si no se considera la entrada de palabras completas, generalmente se puede utilizar el pequeño teclado existente.
Enciclopedia Baidu: codificación de caracteres chinos