Colección de citas famosas - Frases motivadoras - ¿Qué significa GBK en el libro "Song_GBK" de Fang Zheng?

¿Qué significa GBK en el libro "Song_GBK" de Fang Zheng?

GBK es otro estándar de codificación de caracteres chinos. Su nombre completo es "Especificación de expansión del código interno chino (GBK)" y su nombre en inglés es "Especificación del código interno chino". Fue aprobado por la República Popular China y la Estandarización Nacional de Tecnología de la Información. Comité Técnico el 1 de junio de 1995. formulado. El Departamento de Normalización de la Administración Estatal de Supervisión Técnica y el Departamento de Supervisión de Calidad de Ciencia y Tecnología del Ministerio de Industria Electrónica lo determinaron conjuntamente como un documento guía de especificaciones técnicas y lo emitieron en forma de documento No. [1995] El 5 de febrero de 1995 fue promulgado y puesto en vigor el No. 229. Esta versión de la especificación GBK es la versión 1.0. GB es el "estándar nacional" y K es la primera letra del Pinyin chino "extendido".

GBK es compatible con la codificación GB 2312 y admite hacia arriba el estándar internacional ISO 10646.1. Es el vínculo entre el primero y el segundo.

罛O 10646 es el estándar de codificación publicado por ISO, a saber, Universal Multi-8-bit Coded Character Set (UCS). Se traduce como Universal Multi-8-bit Coded Character Set en China continental y como. Juego de caracteres codificados universales de 8 bits en la provincia de Taiwán. Juego de caracteres codificados en bits. Totalmente compatible con la codificación Unicode de la organización Unicode. O 10646.1 es la primera parte de las normas, arquitectura y plano multilingüe básico. El año 1993 de China fue reconocido mediante la norma nacional GB 13000.1 (es decir, GB 13000.1 equivale a ISO 10646.1).

La parte del carácter chino se llama "caracteres chinos unificados CJK" (C se refiere a China, J se refiere a Japón y K se refiere a Corea del Norte). Entre ellos, la parte china incluye caracteres y símbolos chinos estándar legales como GB 2312, GB 12345 y la "Lista de caracteres universales del chino moderno" de China continental, así como 1 y 2 valores literales en CNS 11643 de la provincia de Taiwán. (básicamente equivalente a la codificación BIG-5).

1. Vocabulario

La especificación GBK incluye todos los caracteres y símbolos chinos CJK en ISO 10646.1, con algunas adiciones. Incluyendo específicamente:

Todos los caracteres chinos y no chinos en 1. GB 2312.

Otros caracteres chinos CJK en 2.GB 13000.1. Los caracteres chinos anteriores suman 20902 GB.

3. Los 52 caracteres chinos en GB 13000.1 no están incluidos en el resumen de caracteres simplificados.

4. Hay 28 radicales y partes importantes en el "Diccionario Kangxi" y "Cihai" que no están incluidos en GB 13000.1.

5.13 Símbolos de estructura de caracteres chinos.

6. Hay 139 símbolos gráficos en Big-5 que no están incluidos en GB 2312, pero existen en GB 13000.1.

7. Los seis símbolos pinyin adicionales de GB 12345.

8. El carácter chino "○".

9. Se agregaron 19 signos de puntuación verticales en GB 12345 (en comparación con GB 2312, se agregaron 29 signos de puntuación verticales en GB 10, de los cuales 10 no están incluidos en GB 13000.1 y no se incluirán en GBK Aceptado).

10.21 Los caracteres chinos se seleccionan del área de compatibilidad CJK de GB 13000.1. GB 13000.1 incluye 31 símbolos especiales de IBM OS/2

2. /p>

GBK también se expresa en bytes dobles. El rango de codificación general es 8140-FEFE, el primer byte está entre 81-FE y el último byte está entre 40-FE. Incluyendo una línea de xx7F. de 23.940 puntos de código, * * * contiene 265.438 0.886 caracteres chinos y símbolos gráficos, de los cuales 265.438 0.003 caracteres chinos (incluidos radicales y partes) y 883 símbolos gráficos.

Todos los códigos se dividen en tres partes: <. /p>

1. Área de caracteres chinos que incluye:

A.GB 2312 Área de caracteres chinos: B0A1-F7FE tiene un total de 6763 caracteres chinos, ordenados en el orden original. /p>

B.GB 13000.1 amplía el área de caracteres chinos.

Incluyendo:

(1) GBK Incluyendo 6080 caracteres chinos CJK en GB 13000.1.

(2) GBK/4: AA40-FEA0. Incluye caracteres chinos CJK y 8160 caracteres chinos suplementarios. Los caracteres chinos CJK tienen prioridad y están ordenados según el tamaño del código UCS; los caracteres chinos suplementarios (incluidos los radicales y las partes) están ordenados al final según el número de página/posición del "Diccionario Kangxi".

2. Área de símbolos gráficos. Incluyendo:

A.GB 2312 área de símbolo de caracteres no chinos. Eso es gbk/1: a 1a 1-a9fe. Además de los símbolos de GB 2312, hay 10 números romanos en minúscula y símbolos complementados por GB 12345. Hay 717 símbolos.

B.GB 13000.1 amplió el área de caracteres no chinos. Es GBK/5: A840-A9A0. En esta área se organizan los 5 símbolos BIG-5 no chinos, los símbolos estructurales y "○". Hay 166 símbolos.

3. Área personalizada: dividida en tres comunidades (1) (2) (3).

(1) AAA1-AFFE, con 564 bits de codificación.

(2) F8A1-FEFE, con 658 puntos de código.

(3) A140-A7A0, 672 puntos de código.

Aunque el área (3) está abierta a los usuarios, su uso está restringido, ya que no se puede descartar la posibilidad de añadir nuevos personajes a esta área en el futuro.

En tercer lugar, fuentes

GBK tiene las siguientes disposiciones para fuentes:

1. En principio, es consistente con GB 13000.1 G (es decir, lo legal). estándar derivado de China continental) Las fuentes/trazos bajo la columna de caracteres chinos (caracteres chinos) son los mismos.

2. Dentro del marco general de las "Reglas de reconocimiento de caracteres chinos CJK", todos los caracteres chinos codificados en GBK deben ser "formales sin duplicación" ("GB"); duplicación de códigos, se deben utilizar códigos nuevos tanto como sea posible.

3. Para los caracteres chinos que exceden las reglas de reconocimiento de caracteres chinos CJK, o las reglas de reconocimiento no se han estipulado claramente, los glifos antiguos se colocarán temporalmente en el código GBK. De esta manera, en muchos casos, GBK absorbe glifos antiguos y nuevos del mismo carácter chino.

4. Los glifos de símbolos no chinos se han incluido en GB 2312 y son consistentes con GB 2312; las partes más allá de GB 2312 son consistentes con GB 100038 0.

5. Las letras Pinyin con tonos están en forma de medio ancho.