¿Qué es la fuente GBK? ¿Cuál es la diferencia con las fuentes normales?
GBK es compatible con la codificación GB 2312 y es compatible con el estándar internacional ISO 10646.1.
O 10646 es un estándar de codificación emitido por ISO, a saber, Universal Multi-octet Coded Character Set (UCS). Se traduce como Universal Multi-octet Coded Character Set (UCS) en China continental y se traduce como Universal. Juego de caracteres codificados de varios octetos en la provincia de Taiwán. Juego de caracteres codificados de ocho bits. Es totalmente compatible con la codificación Unicode de la organización Unicode. ISO 10646.1 es la primera parte de las normas, arquitectura y plano multilingüe básico. El año 1993 de China fue reconocido mediante la norma nacional GB 13000.1 (es decir, GB 13000.1 equivale a 00646.1 de ISO 65438).
O 10646 es un sistema de codificación que incluye formas escritas y símbolos adicionales para todos los idiomas del mundo. La parte del carácter chino se llama "Caracteres chinos unificados CJK" (C se refiere a China, J se refiere a Japón y K se refiere a Corea del Norte). Entre ellos, la parte china incluye caracteres y símbolos chinos estándar legales como GB 2312, GB 12345 y la "Lista de caracteres universales del chino moderno" de China continental, así como los valores literales 1 y 2 en CNS 11643 de la provincia de Taiwán. China (básicamente equivalente al Código de los Cinco Grandes).
1. Vocabulario
La especificación GBK incluye todos los caracteres y símbolos chinos CJK en ISO 10646.1, con algunas adiciones. Incluyendo específicamente:
Todos los caracteres chinos y no chinos en 1. GB 2312.
Otros caracteres chinos CJK en 2.GB 13000.1. Lo anterior suma un total de 20902 GB de caracteres chinos.
3. Los 52 caracteres chinos en GB 13000.1 no están incluidos en la "Lista de caracteres simplificados".
4. Hay 28 radicales y partes importantes en el "Diccionario Kangxi" y "Cihai" que no están incluidos en GB 13000.1.
5.13 Símbolos de estructura de caracteres chinos.
6. Hay 139 símbolos gráficos en Big-5 que no están incluidos en GB 2312, pero existen en GB 13000.1.
7. Los seis símbolos pinyin adicionales de GB 12345.
8. El carácter chino "○".
9. 19 signos de puntuación verticales agregados en GB 12345 (en comparación con GB 2312, 29 signos de puntuación verticales agregados en GB 10, 10 de los cuales no están incluidos en GB 13000.1, por lo que GBK no se aceptará.
p>
10.21 Los caracteres chinos se seleccionan del área de compatibilidad CJK de GB 13000.1. Los ingresos de GB 13000.1 son 31 símbolos especiales de IBM OS/2, la asignación y secuencia de códigos
GBK también se expresa en. bytes dobles El rango de codificación total es 8140-FEFE, el primer byte está entre 81-FE y el último byte está entre 40-FE, excluyendo una línea de xx7F. Un total de 23,940 puntos de código, ** contiene 265,438. 0,886 caracteres chinos y símbolos gráficos, incluidos 265,438 0,003 caracteres chinos (incluidos radicales y partes) y 883
Todos los códigos se dividen en tres partes:
Área de caracteres chinos que incluye: <. /p>
A.GB 2312 Área de caracteres chinos: B0A1-F7FE.
Hay un total de 6763 caracteres chinos en GB 2312, ordenados en el orden original.
B.GB 13000.1 amplió el área de caracteres chinos. Incluye:
GBK/3: 8140-A0FE. Incluyendo 6080 caracteres chinos CJK en GB 13000.1.
GBK/4: AA40-FEA0. Incluye caracteres chinos CJK y 8160 caracteres chinos suplementarios. Los caracteres chinos CJK ocupan el primer lugar y se organizan según el tamaño del código UCS; los caracteres chinos complementarios (incluidos los radicales y las partes) se organizan al final según el número/posición de página del "Diccionario Kangxi".
2. Área de símbolos gráficos. Incluyendo:
A.GB 2312 área de símbolo de caracteres no chinos. Eso es gbk/1:a 1a 1-a9fe. Además de los símbolos de GB 2312, hay 10 números romanos en minúscula y símbolos complementados por GB 12345. Hay 717 símbolos.
B.GB 13000.1 amplía el área de caracteres no chinos. Es GBK/5: A840-A9A0. En esta área se organizan los 5 símbolos BIG-5 no chinos, los símbolos estructurales y "○". Hay 166 símbolos.
3. Área definida por el usuario: dividida en tres comunidades (1), (2) y (3).
(1) AAA 1-AFFE, con 564 bits de código.
(2) f8a 1-FEFE, con 658 bits de código.
(3)a 140-a7a 0, 672 bits de código.
Aunque el área (3) está abierta a los usuarios, su uso está restringido, no se descarta la posibilidad de añadir nuevos personajes a esta área en el futuro.
En tercer lugar, fuentes
GBK tiene las siguientes disposiciones para fuentes:
1. En principio, es consistente con GB 13000.1 G (es decir, lo legal). estándar derivado de China continental) caracteres chinos) las fuentes/trazos de las columnas son los mismos.
2. Dentro del marco general de las reglas de reconocimiento de caracteres chinos CJK, todos los caracteres chinos codificados en GBK deben ser "formales sin códigos repetidos" ("estándar nacional"); .
3. Para los caracteres chinos que exceden las reglas de reconocimiento de caracteres chinos CJK o que aún no tienen reglas de reconocimiento claramente definidas, los glifos antiguos se colocarán temporalmente en el código GBK. De esta manera, en muchos casos, GBK absorbe glifos antiguos y nuevos del mismo carácter chino.
4. Los glifos de caracteres no chinos incluidos en GB 2312 son consistentes con GB 2312; las partes posteriores a GB 2312 son consistentes con GB 100038 0.
5. Las letras Pinyin con tonos están en forma de medio ancho.