¿Cuál es la forma de almacenamiento de datos de caracteres en la memoria en lenguaje C?
En lenguaje C, los datos de caracteres consisten en poner una constante de carácter en una variable de carácter. No se trata de poner el carácter en sí en la unidad de memoria, sino de poner el código ASCII correspondiente al carácter en la memoria. unidad.
En la codificación, un carácter chino requiere 2 bytes para almacenarse. En la codificación UTF-8, una memoria de caracteres alfabéticos en inglés requiere 1 byte y una memoria de caracteres chinos requiere de 3 a 4 bytes. En la codificación UTF-16, se requieren dos bytes para almacenar un carácter alfabético en inglés o un carácter chino. En la codificación UTF-32, se necesitan 4 bytes para almacenar cualquier carácter del mundo.
Datos ampliados:
¿Por el estándar ASCII? La cantidad de caracteres en el conjunto de caracteres es limitada y, a menudo, no puede cumplir con los requisitos en aplicaciones prácticas. Para ello, la Organización Internacional de Normalización ha formulado la norma ISO2022, que especifica ASCII? Un método unificado para ampliar los juegos de caracteres a códigos de 8 bits. ?
ISO ha desarrollado múltiples ASCII extendidos para diferentes regiones. Conjunto de caracteres, cada conjunto de caracteres ASCII extendido se puede ampliar a 128 caracteres. La codificación de estos caracteres extendidos son todos códigos de 8 bits de orden superior de 1 (es decir, números decimales 128 ~ 255), que se denominan códigos ASCII extendidos.
Enciclopedia Baidu: codificación de caracteres