¿Cuántos bytes ocupa un carácter chino en codificación GBK?
El nombre completo de GBK es "Especificación de extensión del código interno chino" (GBK es la primera letra del Pinyin chino "Estándar nacional" y "Extendido", nombre en inglés: Especificación del código interno chino), establecido por República Popular China * * * Formulado por el Comité Técnico Nacional de Normalización de Tecnologías de la Información de China en junio de 1995 + 65438 el 1 de febrero. El Departamento de Normalización de la Administración Estatal de Supervisión Técnica y el Departamento de Supervisión de Calidad de Ciencia y Tecnología del Ministerio de Industria Electrónica lo determinaron conjuntamente como documento de orientación de especificaciones técnicas con la Carta de Supervisión Técnica N° 2001. 1995 229 del 5 de febrero de 1995. Esta versión de la especificación GBK es la versión 1.0.
GBK también se expresa en bytes dobles. El rango de codificación total es 8140-FEFE, el primer byte está entre 81-FE y el último byte está entre 40-FE, excluyendo una línea. Un total de 23,940 puntos de código, * * contiene 265,438+0,886 caracteres chinos y símbolos gráficos, incluidos 265,438+0,003 caracteres chinos (incluidos radicales y componentes) y 883 símbolos gráficos.
Todos los códigos se dividen en tres partes:
1. Área de caracteres chinos. Incluyendo:
A.GB 2312 Área de caracteres chinos. Ese es GBK/2: B0A1-F7FE. Hay un total de 6763 caracteres chinos en GB 2312, ordenados en el orden original.
B.GB 13000.1 amplió el área de caracteres chinos. Incluye:
GBK/3: 8140-A0FE. Incluyendo 6080 caracteres chinos CJK en GB 13000.1.
GBK/4: AA40-FEA0. Incluye caracteres chinos CJK y 8160 caracteres chinos suplementarios. Los caracteres chinos CJK ocupan el primer lugar y se organizan según el tamaño del código UCS; los caracteres chinos complementarios (incluidos los radicales y las partes) se organizan al final según el número/posición de página del "Diccionario Kangxi".
2. Área de símbolos gráficos. Incluyendo:
A.GB 2312 área de símbolo de caracteres no chinos. Eso es gbk/1:a 1a 1-a9fe. Además de los símbolos de GB 2312, hay 10 números romanos en minúscula y símbolos complementados por GB 12345. Hay 717 símbolos.
B.GB 13000.1 amplía el área de caracteres no chinos. Es GBK/5: A840-A9A0. En esta área se organizan los 5 símbolos BIG-5 no chinos, los símbolos estructurales y "○". Hay 166 símbolos.
3. Áreas definidas por el usuario: divididas en tres comunidades (1), (2) y (3).
(1) AAA 1-AFFE, con 564 bits de código.
(2) f8a 1-FEFE, con 658 bits de código.
(3)a 140-a7a 0, 672 bits de código.
Aunque el área (3) está abierta a los usuarios, su uso está restringido, no se descarta la posibilidad de añadir nuevos personajes a esta área en el futuro.