Colección de citas famosas - Mensajes de felicitación - ¿Cuál es el estándar de codificación para los caracteres chinos tradicionales utilizados en China, la provincia de Taiwán y Hong Kong?

¿Cuál es el estándar de codificación para los caracteres chinos tradicionales utilizados en China, la provincia de Taiwán y Hong Kong?

El estándar de codificación de los caracteres chinos tradicionales utilizados en China, la provincia de Taiwán y Hong Kong es el Big Five.

Big5, también conocido como Big Five o Big Five, es el estándar de conjunto de caracteres chinos informáticos más utilizado en la comunidad de chino tradicional (chino normal). * * * Contiene 65.438+03.060 caracteres chinos. Big5 se utiliza ampliamente en campos de comunicaciones tradicionales en China, como la provincia de Taiwán, Hong Kong y Macao.

En 2003, Big5 se incluyó en el Apéndice del Código de Intercambio Estándar Chino CNS11643 y obtuvo un estatus más formal. Esta última versión se llama Big5-2003.

Datos extendidos

Introducción a la estructura de bytes del código Big5

El código Big5 es un conjunto de caracteres de doble byte, que utiliza un método de almacenamiento de doble octeto. se almacena una palabra Dos bytes. El primer byte se denomina "byte alto" y el segundo byte se denomina "byte bajo".

El "byte alto" usa 0x81-0xFE, el "byte bajo" usa 0x40-0x7E, 0xA1-0xFE. En la partición de Big5:

Cabe señalar que Big5 contiene dos palabras idénticas: "Wu, Wu" (0xa 461[U+5140] y 0xC94A[U+FA0C]) y "à,β " (0x DCD 1). Además, "diez" y "treinta" también aparecen repetidamente en el área de símbolos, lo que a menudo provoca que el sistema de recuperación no encuentre la palabra.