Colección de citas famosas - Consulta de diccionarios - ¿Cómo funcionan los archivos comprimidos?

¿Cómo funcionan los archivos comprimidos?

La información procesada por la computadora se expresa en forma de números binarios, por lo que el software de compresión utiliza caracteres especiales para marcar la misma cadena en la información binaria para lograr el propósito de la compresión. Para ayudarle a comprender la compresión de archivos, imagine en su mente una imagen de un cielo azul y nubes blancas. Para miles de monótonos píxeles azules, en lugar de definir una larga lista de colores "azul, azul, azul...", es más conciso decirle a la computadora: "Almacena 1117 píxeles azules desde esta ubicación" y puede ahorrar mucho dinero. espacio de almacenamiento. Este es un ejemplo muy simple de compresión de imágenes. En última instancia, todos los archivos informáticos se almacenan en forma de "1" y "0". Al igual que los píxeles azules, mediante fórmulas de cálculo matemático razonables, el tamaño del archivo se puede comprimir en gran medida para lograr el efecto de "datos densos y sin pérdidas". En términos generales, la compresión se puede dividir en compresión con pérdida y compresión sin pérdida. Si la pérdida de datos individuales no tendrá mucho impacto, es una buena idea ignorarlos. Esto es compresión con pérdida. La compresión con pérdida se utiliza ampliamente en archivos de animación, sonido e imagen, siendo los representantes típicos MPEG, MP3 y JPG.

Principio de compresión

Muchas personas quedan sorprendidas por la magia de la tecnología de compresión. Los archivos se comprimen a la mitad de su tamaño. ¿Cómo puedo recuperarme sin pérdida?

Las primeras tecnologías de compresión se basaban en modelos estadísticos. Las nuevas tecnologías basadas en la compresión de diccionarios no se hicieron populares hasta principios de los años 1980.

La compresión de datos incluye muchas tecnologías de software y hardware, que varían, pero la mayoría del software de compresión se modifica en función de los algoritmos LZ77 y LZ88, y LZ77 es el origen de la compresión de diccionario. Como todos sabemos, un archivo de texto se compone de algunas palabras e inevitablemente habrá repeticiones. Por ejemplo, aquí suele aparecer la palabra "software de compresión". El principio de compresión es crear algo similar a un diccionario en el encabezado del archivo, poner la palabra "software de compresión" en el diccionario y asignar un código que ocupe una pequeña cantidad de bytes a la palabra "software de compresión". el artículo es Este código se utiliza en su lugar para implementar la compresión. Por supuesto, el software de compresión no es tan simple en la operación real y existen algunos métodos de cálculo que le causarán dolor de cabeza, por lo que no entraré en detalles aquí. Alguien puede preguntar, los archivos de texto pueden usar tecnología de diccionario, pero ¿qué pasa con otros archivos? No se preocupe por esto, porque para el software de compresión, la palabra "compresión de datos" en un archivo es lo mismo que "@ #%". La clave está en la cantidad de códigos redundantes (partes repetidas).

Conocimientos de compresión

Según el método de compresión, existen las llamadas "compresión transparente" y "compresión empaquetada".

Generalmente se busca la "compresión transparente". exe y. com y comprimirlos directamente. Si tiene éxito, el tamaño del archivo será más pequeño, la funcionalidad no cambiará y potencialmente más rápido. Sin embargo, este método de compresión tiene una superficie de objeto muy estrecha. Si la compresión falla, el archivo también quedará inutilizable. Por lo tanto, estos programas siempre exigen encarecidamente a los usuarios que realicen una copia de seguridad de los archivos antes de comprimirlos.

La "compresión de paquetes" es el método de compresión utilizado por el software de compresión que a menudo se menciona ahora. Comprime uno o más archivos en un archivo comprimido. Para utilizar un archivo comprimido, primero debe descomprimirlo y restaurarlo. Se caracteriza por su bajo riesgo y es adecuado para reducir el espacio ocupado por archivos que se utilizan con poca frecuencia y transferir datos. Por supuesto, también podemos dividir la compresión en muchos tipos según el algoritmo de compresión.

Generalmente cuando hablamos de compresión, mencionaremos muchos términos relacionados. Propongamos algunos términos comunes para explicarlos.

Formato de compresión: se utilizan diferentes métodos de codificación de compresión al comprimir archivos, y las estructuras de archivos generadas por la compresión también son diferentes. Esta estructura de archivo comprimido se llama formato comprimido.

Relación de compresión: La relación entre el espacio en disco ocupado por un archivo comprimido y el archivo original se denomina relación de compresión. Entre los formatos de compresión más utilizados, el formato RAR tiene una relación de compresión más alta y el formato ZIP tiene una relación de compresión más baja. Sin embargo, las operaciones con archivos en formato ZIP son más rápidas.

Descompresión: Restaurar un archivo comprimido a su formato de archivo original, también conocido como liberar y expandir.

Paquete comprimido: Generalmente, los archivos en un formato de compresión común se denominan paquetes comprimidos, como los archivos comprimidos ZIP. Este archivo puede administrar los archivos comprimidos en el paquete bajo la administración de la herramienta de compresión, como verlos, eliminarlos, agregarlos, etc.

Empaquetado: comprimir un archivo en un archivo de paquete comprimido con un formato de compresión universal se llama empaquetado, que también se refiere a agregar compresión de archivos al paquete comprimido.

Compresión multivolumen: dividir un paquete de archivos comprimidos en varios archivos comprimidos se denomina compresión multivolumen. Generalmente se utiliza para almacenar archivos comprimidos en varios disquetes o facilitar la transmisión en línea.

Archivo autoextraíble: comprima el archivo en un archivo ejecutable y luego descomprima y restaure su propio archivo fuente ejecutando el archivo comprimido sin utilizar una herramienta de compresión.

Formatos de archivos comprimidos

Actualmente, existen muchos formatos de archivos comprimidos populares. ¡Descubramos cuáles son!

ZIP: actualmente el formato de archivo comprimido más popular (en Internet, los archivos ZIP han logrado una victoria absoluta. En las operaciones diarias, además del software de compresión especializado, muchos programas de gestión de archivos, como Windows Commander, también admite formato ZIP. Podemos usar WinZip para descomprimir y publicar archivos Zip, y también podemos usarlo para procesar archivos comprimidos en diferentes formatos como ARJ, ARC, CAB y LZH, lo que facilita enormemente las operaciones del usuario. p>RAR: Es un formato de compresión de archivos rápido y eficiente, pero la mayoría de los programas de compresión de archivos no lo admiten. WinRAR es la mejor herramienta para procesar archivos en formato RAR en Windows.

ARJ: El único. El popular software de compresión ARJ se utiliza en DOS. Tiene las ventajas de funciones potentes y una alta tasa de compresión. En la era actual de Windows, ha perdido su antigua gloria. un archivo comprimido especial agregado por Windows 98. Formato, utilizado principalmente para comprimir archivos en discos de instalación de software relacionados. Se caracteriza por una alta tasa de compresión (probablemente la más alta actualmente), pero una vez comprimido, no se puede agregar, eliminar ni reemplazar. , lo que significa que su paquete comprimido tiene el atributo "Solo lectura". También podemos usar WinZip para operar archivos CAB _: el método de compresión de archivos utilizado en el disco de instalación del software, como *.ex_, *.d3. Por lo general, el sistema los descomprime directamente y el trabajo de instalación se completa sin que el usuario tenga que preocuparse por ello. Por supuesto, también podemos usar el comando EXPAND de DOS para * liberar el archivo operativo. UU/UUE: el método de codificación se usó originalmente en sistemas Unix y luego se adaptó a DOS. Solo necesitamos usar este método para codificar previamente los correos electrónicos chinos, y luego podremos pasar con éxito al servidor de correo que solo puede manejar. Codificación de 7 bits, solucionando así el problema de la transmisión de caracteres chinos.

ACE: un nuevo programa de compresión con alta relación de compresión.

Además, archivos de formato de imagen y audio. como MP3, MPEG y JPG también utilizan tecnología de compresión. En teoría, también deberían ser archivos comprimidos, pero los métodos de compresión que utilizan son diferentes. Aquí hay una breve introducción:

JPEG: el completo. El nombre de JPEG es Joint Photographic Experts Group (Joint Photographic Experts Group), que es una organización de estándares internacionales (un comité dedicado al desarrollo de estándares de compresión de imágenes fijas según ISO. Formuló el primer estándar nacional para la compresión de imágenes fijas: ISO 10918 -1, también conocido como JPEG Por su excelente calidad, JPEG ha logrado un gran éxito en tan solo unos años. Actualmente, el 80% de las imágenes del sitio web utilizan el estándar de compresión JPEG 2000. : El nombre oficial es "ISO 15444" y también está formulado por la organización JPEG. La mayor diferencia entre JPEG 2000 y JPEG tradicional es que abandona el estándar de compresión. El método de codificación de bloques basado en transformada de coseno discreto se cambia a uno. Método de codificación multiresolución basado en transformada wavelet. Su relación de compresión es aproximadamente un 30% mayor que la de JPEG y admite compresión con y sin pérdida. La compresión sin pérdidas es muy útil para guardar algunas imágenes importantes.

MP3: Todo el mundo debería saberlo. El nombre completo de MP3 es MPEG 1 Layer 3, que es un esquema de codificación de compresión de sonido de alto rendimiento. Puede producir archivos de música de "volumen" ultrapequeños, cuyo tamaño es sólo de 1/10 a 1/12 de los datos de audio originales. Pero para el oído humano el efecto no es muy diferente. Ha ocupado el campo de la música por ordenador casi desde su nacimiento. Gracias a la aparición del MP3, una canción que podía descargarse online en media hora ahora puede "completarse" en sólo unos minutos utilizando el formato MP3.

MPEG: MPEG es la abreviatura de Moving Picture Experts Group.

Hay cuatro versiones en uso: MPEG-1, MPEG-2, MPEG-3 y MPEG-4.