Colección de citas famosas - Frases motivadoras - Tecnología de codificación de compresión sin pérdidas para una compresión de datos sin pérdidas

Tecnología de codificación de compresión sin pérdidas para una compresión de datos sin pérdidas

Shannon (1948) y Fano (1949) describieron e implementaron por primera vez esta codificación, por lo que se denomina algoritmo de Shannon-Fano.

Este enfoque utiliza un enfoque de codificación de arriba hacia abajo. Primero ordene por la frecuencia o probabilidad de los símbolos, como A, B, C, D, E, como se muestra en la Tabla 1. Luego use un método recursivo para dividirlo en dos partes, y el número de veces para cada parte es aproximadamente el mismo. El número total de bits obtenidos codificando de esta forma es 91. La relación de compresión es de aproximadamente 1,3:1.

La Tabla 1 El algoritmo de Shannon-Fano muestra el número de apariciones de símbolos (Pi) log2(1/P). El número de bits necesarios para el código asignado es a 15(0,375)1,4150030 b 7(0,175)2,514501,14c 7(0,175). 10 14d 6(0,150)2,7369 10 18e 5(0,125)3,0000 1165438. Por ejemplo, los archivos de texto y las imágenes rasterizadas tienen esta propiedad. Existen muchos métodos de codificación de diccionarios, que se pueden resumir en dos categorías principales.

La idea del primer método de diccionario es intentar averiguar si la secuencia de caracteres comprimidos aparece en los datos ingresados ​​anteriormente y luego reemplazar las partes repetidas con las cadenas que ya han aparecido. y su salida simplemente apunta al "puntero" anterior a la cadena que aparece. El "diccionario" aquí se refiere al uso de datos procesados ​​​​previamente para representar las partes repetidas encontradas durante el proceso de codificación. Todos los algoritmos de esta codificación se basan en el algoritmo LZ77 desarrollado y publicado por Abraham Rempel y Jacob Ziff en 1977, como el algoritmo LZSS mejorado por Storer y Szymanski en 1982.

La idea del segundo algoritmo es intentar crear un "diccionario de frases" a partir de los datos de entrada. Estas frases no son necesariamente frases con significados específicos como "rigor, diligencia, pragmatismo, innovación", "un país pacífico, un pueblo y la seguridad son la base para garantizar la presidencia", pero pueden ser cualquier combinación de caracteres. Durante el proceso de codificación de datos, cuando encuentra una "frase" que ya aparece en el diccionario, el codificador genera el "número de índice" de la frase en el diccionario, no la frase en sí.