¿Cuáles son los conjuntos de caracteres chinos más utilizados?
Texto es un término general para diversos textos y símbolos, incluidos caracteres nacionales, signos de puntuación, símbolos gráficos, números, etc. Un conjunto de caracteres es una colección de caracteres.
Hay muchos conjuntos de caracteres, cada uno de los cuales contiene un número diferente de caracteres. Los nombres de juegos de caracteres comunes incluyen ASCII, GB2312, BIG5, GB18030, Unicode, etc.
Para poder manejar con precisión varios conjuntos de caracteres, la computadora necesita codificar los caracteres para que pueda reconocerlos y almacenarlos. Existe una gran cantidad de caracteres chinos, divididos en chino simplificado y chino tradicional, con diferentes reglas de escritura. Las computadoras se diseñaron originalmente basándose en caracteres ingleses de un solo byte. Por lo tanto, la codificación de caracteres chinos es la base técnica para el intercambio de información china.
GB2312, también conocido como juego de caracteres GB2312-80, el nombre completo es "Conjunto básico de codificación de caracteres chinos para el intercambio de información", que fue publicado por la antigua Administración Estatal de Estándares e implementado en mayo de 1981. 2005.
El nombre completo de GB18030 es GB18030-2000 "Extensión del conjunto básico de conjuntos de caracteres de codificación de caracteres chinos para el intercambio de información", que es un nuevo estándar nacional para la codificación de caracteres chinos publicado por el gobierno chino en marzo. 6, 2000. El software lanzado en el mercado chino después del 31 de agosto de 2006 debe cumplir con este estándar.
Características de GB2312 y GB18030:
GB2312 es el conjunto de caracteres chinos simplificados estándar nacional de China. Sus caracteres chinos han cubierto el 99,75% de las frecuencias de uso, satisfaciendo básicamente las necesidades de las computadoras para procesar caracteres chinos. Se utiliza ampliamente en China continental y Singapur.
GB2312 incluye caracteres chinos simplificados y símbolos comunes, números de serie, números, letras latinas, kana japonesa, letras griegas, letras rusas, símbolos fonéticos chinos y letras pinyin chinas, un total de 7445 caracteres gráficos.
Incluye 6763 caracteres chinos, incluidos 3755 caracteres chinos de primer nivel y 3008 caracteres chinos de segundo nivel; incluidas letras latinas, letras griegas, letras japonesas hiragana y katakana y letras cirílicas rusas.
Después de una amplia participación y demostración, el estándar de juego de caracteres GB18030 fue implementado conjuntamente por reconocidas empresas de tecnología de la información nacionales y extranjeras, el Ministerio de Industria de la Información y la antigua Administración Estatal de Calidad y Supervisión Técnica.
El estándar de conjunto de caracteres GB18030 resuelve el problema de la codificación informática de grandes conjuntos de caracteres compuestos por caracteres chinos, kana japonés, coreano y idiomas minoritarios chinos. El espacio de codificación total de este estándar supera los 654,38+0,5 millones de puntos de código, incluidos 27484 caracteres chinos, que abarcan el chino, el japonés, el coreano y los idiomas minoritarios chinos.
Cumple con los requisitos de intercambio de información en formato de codificación unificada, multilingüe, de caracteres grandes y multipropósito de China continental, Hong Kong, la provincia de Taiwán, Japón y Corea del Sur. También es compatible con Unicode versión 3.0 y completa el vocabulario de caracteres extendido Unicode "Extensión de caracteres chinos unificados A". Y es compatible con estándares nacionales de codificación de caracteres anteriores (GB2312, GB13000.1).