Colección de citas famosas - Colección de poesías - ¿Cuál es la relación entre el juego de caracteres y la codificación de caracteres chinos?

¿Cuál es la relación entre el juego de caracteres y la codificación de caracteres chinos?

BG18030 es un juego de caracteres. Los juegos de caracteres admitidos por una impresora representan el texto que puede imprimir. Si hay comercio exterior, simplemente verifique el soporte de idiomas extranjeros (generalmente no dejará de ser compatible). Por ejemplo, si es raro, es posible que no esté impreso en sánscrito o algo así.

La siguiente es una explicación del principio:

La capa inferior de la computadora solo puede reconocer códigos digitales. ¿De dónde vino el texto? Depende del conjunto de caracteres.

La gente establece un estándar de antemano y utiliza algunos códigos para referirse a los personajes. Por ejemplo, para los códigos Unicode más comunes en Internet, el código para "hola" es "\u4f60\u597d" y "u4f60" es el código Unicode para "tú". Con base en este código, el sistema informático encuentra la fuente correspondiente (puede considerarlo como una búsqueda en un diccionario) y selecciona "Hola" de esa fuente.

Las fuentes también están bien implementadas por personas, como Microsoft Yahei y Songti, y los sistemas operativos hacen lo mismo. Todas las fuentes admiten un determinado estándar de juego de caracteres (equivalente a admitir un determinado diccionario).

Los códigos GB comúnmente utilizados para juegos de caracteres chinos incluyen GB18030 y GB2312, como mencionaste. Los países extranjeros también tienen sus propios conjuntos de caracteres, como el inglés, el alemán y el árabe. Algunos juegos de caracteres contienen caracteres de varios idiomas, concretamente juegos de caracteres internacionales y códigos Unicode. Sin un juego de caracteres, lo que significa que no hay un diccionario en la mano, el código no se puede interpretar. Las palabras que vemos en este momento están desordenadas (debido a que no hay un diccionario correspondiente, el sistema solo las traducirá aleatoriamente), y así es como se genera el "código confuso".