Juego de caracteres GB2312.
En GB2312, los caracteres chinos recibidos se dividen y cada partición contiene 94 caracteres/símbolos chinos. Esta representación también se denomina código de ubicación.
Los caracteres incluidos en cada área son los siguientes: las áreas 01-09 son símbolos especiales; las áreas 16-55 son caracteres chinos de primer nivel, ordenados por pinyin; las áreas 56-87 son caracteres chinos de segundo nivel; , ordenados por clasificación de radicales/trazos; 10-15 y 88-94 no están codificados.
(2) Representación de doble byte
Entre los dos bytes, el primer byte es el primer byte y el último byte es el segundo byte. Es habitual llamar al primer byte "byte alto" y al segundo "byte bajo".
El "byte alto" usa 0xa 1-0xf 7 (el código de área de 01-87 más 0xA0), y el "byte bajo" usa 0xa 1-0x Fe (01-94 más 0xA0). También conocida como Big Five o Big Five, fue fundada en 1984 por el Consejo de Política de la Industria de la Información, un Consorcio Provincial de Taiwán y cinco empresas de software: Acer, Mitac, OnePlus, Zero One y FIC, por lo que se llama Big Five.
El código Big5 se creó porque diferentes fabricantes en la provincia de Taiwán introdujeron códigos diferentes, como Eternal Code, IBM PS55, Wang An Code, etc. , que son mutuamente excluyentes. Por otro lado, el gobierno provincial de Taiwán aún no ha lanzado una codificación oficial de caracteres chinos, y la codificación GB2312 de China continental no incluye caracteres chinos tradicionales. El código Big5 utiliza almacenamiento de doble byte, utilizando dos bytes para codificar una palabra. El primer byte se denomina "byte alto" y el segundo byte se denomina "byte bajo". El rango de codificación del byte de orden superior es 0xA1-0xF9 y el rango de codificación del byte de orden inferior es 0x40-0x7E y 0xA1-0xFE.
Los tipos de caracteres correspondientes a cada rango de codificación son los siguientes: 0xA140-0xA3BF son signos de puntuación, letras griegas y símbolos especiales. Además, 0xA259-0xA261 es una palabra de dos sílabas con una unidad de medida. : 乲乲鲁奶. 0xA440-0xC67E son caracteres chinos de uso común, ordenados primero por trazos y luego por radicales; 0xC940-0xF9D5 son los segundos caracteres chinos más utilizados, también ordenados primero por trazos y luego por radicales. Aunque el código Big5 contiene más de 10.000 caracteres, no tiene en cuenta nombres personales, topónimos, dialectos, caracteres químicos y biológicos, ni incluye letras japonesas hiragana y katakana.
Por ejemplo, la provincia de Taiwán considera "zu" como una variante de "zu", por lo que la palabra "zu" no está incluida. Algunas palabras radicales en el "Diccionario Kangxi" (como "子", "比", "比", "比", etc.), así como nombres personales comunes (como "Yi", "Xuan", "Bi ", etc.