¿Qué es MPEG4?

Descripción general de las principales tecnologías y codificación del estándar MPEG-4

Resumen: Una breve introducción a los principales contenidos del estándar MPEG-4, y en base a esto, se centra en la codificación de objetos de audio y objetos de vídeo.

Palabras clave: MPEG-4; Marco de integración de transmisión multimedia; Prefacio de codificación de vídeo 0

¿Es el estándar de codificación MPEG-4 el último estándar de codificación internacional? ¿Este artículo resume brevemente su contenido principal? Sobre esta base se centra la codificación de objetos de audio y de vídeo característicos.

1 Marco de integración de transmisión multimedia

El marco de integración de transmisión multimedia (DMIF) resuelve principalmente los problemas de operación de aplicaciones multimedia en redes interactivas, entornos de transmisión y discos. Transmite información de bits multiplexados para establecer un protocolo de enlace. y transmisión entre cliente y servidor. La diferencia con el pasado es que, dado que el flujo de código MPEG-4 contiene muchos objetos AV, en términos generales, estos objetos AV tienen sus propios buffers, no solo buffers de video y audio.

2 Descripción de sintaxis

MPEG-4 define un lenguaje de descripción de sintaxis para describir la representación del flujo de bits y la información de descripción de escenas de objetos AV. Este lenguaje de descripción de sintaxis es una extensión de C++, que no solo es fácil de expresar las características de sus objetos AV, sino que también es fácil de implementar la simulación de software y la verificación de modelos. En comparación con MPEG-4, MPEG-1 y MPEG-2 utilizan un lenguaje similar a C para describir objetos. El lenguaje de descripción MPEG-4 incorpora tecnología orientada a objetos para describir objetos.

3 Codificación de objetos de audio

La codificación de compresión de vídeo y audio sigue siendo el núcleo de MPEG-4. Pero a diferencia de los MPEG-1 y MPEG-2 anteriores, MPEG-4 no solo admite sonidos naturales (como voz y música), sino que también admite sonidos sintéticos basados ​​​​en lenguajes de descripción y admite las características del objeto de audio. Es decir, en una escena hay voces y música de fondo, y pueden ser objetos de audio codificados de forma independiente.

3.1 Codificación de sonido natural

La investigación MPEG-4 compara varios algoritmos de codificación de audio existentes y admite codificación de sonido natural de 2 ~ 64K. Por ejemplo, la codificación de voz de 2 ~ 4 kbit/s con una frecuencia de muestreo de 8 kHz y la codificación de audio de 4 ~ 16 kbit/s con una frecuencia de muestreo de 8 o 16 kHz generalmente utilizan codificación paramétrica en la codificación de voz de 6 ~ 24; kbit/s, que generalmente utiliza tecnología de codificación de predicción lineal excitada por código (CELP); la tecnología de codificación por transformación de tiempo-frecuencia (T/F) se puede utilizar para codificar con velocidades de código superiores a 16 kbit/s. estándares, como G .723, G.728, MPEG-1, MPEG-2, etc. La Figura 1 es un diagrama esquemático del codificador de audio natural escalable de MPGE4, que incluye tres tecnologías de codificación.

3.2 Sonido sintético

En la codificación de sonido sintético, MPEG-4 introduce dos tecnologías de codificación convincentes: codificación de texto a voz y codificación de síntesis basada en partituras. Esto allana el camino para los juegos interactivos basados ​​en voz de baja tasa de bits en la web. La tecnología de codificación de voz sintética es en realidad una codificación de parámetros basada en una base de conocimientos. Particularmente digno de mención es la tecnología de síntesis basada en partituras de MPEG-4. En esta tecnología, el decodificador funciona mediante un lenguaje sintético especial: el lenguaje orquestal de audio estructurado (SAOL). Una "orquesta" está formada por diferentes "instrumentos". Cuando el decodificador no tiene un "instrumento", MPEG-4 también permite que el decodificador descargue el "instrumento" del codificador al decodificador para restaurar correctamente el sonido sintetizado. Se puede ver que MPEG-4 no proporciona un conjunto de "instrumentos" en el estándar de música MIDI, sino una "orquesta" que se puede ampliar en cualquier momento, por lo que sus partituras de "interpretación" son naturalmente más coloridas.

Codificación de 4 objetos visuales

Del mismo modo, MPEG-4 también admite la codificación de objetos visuales naturales y sintéticos. Sintetice objetos visuales como animaciones 2D y 3D, animaciones de expresiones faciales y más. , están todos codificados individualmente, lo que no solo permite una compresión efectiva, sino que también es fácil de operar.

La codificación de objetos visuales naturales sigue siendo el foco de MPEG-4.

En comparación con las imágenes fijas, MPEG-4 utiliza un algoritmo wavelet de árbol cero para proporcionar una alta relación de compresión y al mismo tiempo proporciona resolución espacial y escalabilidad de calidad hasta 11.

Para la codificación de objetos de vídeo en movimiento, MPEG-4 utiliza el diagrama de bloques de codificación que se muestra en la Figura 2 para admitir la codificación de imágenes.

Como puede verse, MPEG-4 introduce un módulo de codificación de formas para admitir la codificación basada en objetos. Para admitir una compresión eficiente, MPEG-4 todavía utiliza el marco de codificación híbrido de transformación y predicción en MPEG-1 y MPEG-2.

Para objetos de vídeo generales de formas arbitrarias, la estructura del flujo de código después de la codificación MPEG-4 se muestra en la Figura 3.

Para aplicaciones en tiempo real con velocidades de bits muy bajas, como videoteléfonos, la codificación de vídeo MPEG-4 utiliza el núcleo de vídeo de velocidad de bits muy baja (VLBV) para la codificación, similar a la codificación directa H.263 de la UIT. de video rectangular, no utiliza el módulo de codificación de formas. La estructura del flujo de codificación se muestra en la Figura 4.

Se puede ver que MPEG-4 adopta compatibilidad directa con H.263 y también proporciona algunas funciones de alto nivel, como codificación basada en contenido. El modo extendido se muestra en la Figura 5.

MPEG-4 admite la solidez de la transmisión de canales propensos a errores y proporciona mejores mecanismos de sincronización y recuperación de errores.

5 Descripción de la escena

La descripción de la escena se utiliza principalmente para describir cómo los objetos AV individuales mencionados anteriormente se organizan y sincronizan bajo coordenadas de escena AV específicas. Al mismo tiempo, también existen cuestiones como la protección de la propiedad intelectual de objetos y escenas audiovisuales.

6 perspectivas del mpeg-4

La aplicación del MPEG-4 será extensa y de gran alcance. Este nuevo estándar será aplicable al menos a las siguientes ocasiones:

a) Monitorización multimedia en tiempo real;

b) Comunicación multimedia móvil de muy baja velocidad binaria;

c) Sistemas multimedia basados ​​en almacenamiento y recuperación de contenidos;

d) Video streaming y juegos visuales en Internet/Intranet;

e) Reuniones virtuales basadas en simulación de expresiones faciales;

Aplicaciones multimedia interactivas en DVD;

g) Aplicaciones de escenas de laboratorio colaborativas visuales basadas en red informática;

h) Programas de estudio y TV.

Introducción a la serie MPEG (30 de mayo de 2005)

MPEG es la abreviatura de Moving Picture Coding Experts Group. MPEG se estableció en junio de 1988+0. Es una organización dedicada a investigar y desarrollar estándares de compresión digital y comprimir velocidades de transmisión garantizando al mismo tiempo la calidad de las imágenes en movimiento. La primera reunión de MPEG se celebró en mayo de 1988, con la participación de 25 expertos en codificación y compresión de audio y vídeo. Ahora MPEG se ha convertido en una organización que celebra tres reuniones periódicas al año (marzo, julio y 165438+octubre), en las que participan alrededor de 350 expertos de más de 200 empresas de 20 países. Los estándares desarrollados por MPEG han sido aprobados como estándares internacionales por la Organización Internacional de Normalización (ISO) y la Comisión Electrotécnica Internacional (IEC), formando la serie MPEG.

MPEG-1

MPEG-1 comenzó la investigación en julio de 1989 y fue aprobado como estándar oficial por ISO/IEC en 1992. El número de estándar oficial es ISO/IEC 1172 y MPEG-1 estipula que las imágenes en movimiento y los archivos de vídeo se pueden grabar en medios de almacenamiento digital. La velocidad de transmisión es de 1,5 Mbits/s, reproduce 30 cuadros por segundo, calidad de CD y el nivel de calidad es básicamente equivalente a VHS (cinta de video de transmisión). La velocidad máxima de codificación de MPEG puede alcanzar 4-5 mbit/s, pero a medida que aumenta la velocidad, la calidad de la imagen decodificada disminuirá. El formato de compresión de audio es el conocido formato MP3, que proporciona un método de compresión de audio independiente de la compresión de vídeo. El producto de mayor éxito que utiliza la tecnología MPEG-1 es el VCD, que se utiliza y promociona ampliamente como dispositivo de reproducción de vídeo de bajo coste. MPEG-1 se utiliza para la transmisión de vídeo a través de redes telefónicas digitales como ADSL, VOD y redes educativas.

MPEG-2

MPEG-2 se estudió en julio de 1991. Es una especificación detallada del esquema de compresión y la capa del sistema de televisión digital estándar y televisión de alta definición en diversas aplicaciones. . Fue aprobado como estándar oficial por ISO/IEC en 1992 y el número de estándar oficial es ISO/IEC13818. MPEG-2 no es una simple actualización de MPEG-1.

MPEG-2 ha realizado disposiciones más detalladas y mejoras adicionales en el sistema y la transmisión. MPEG-2 puede proporcionar transmisión de video y calidad de sonido de CD. La codificación de audio MPEG-2 puede proporcionar canales izquierdo, derecho, central y dos canales envolventes, así como un canal de énfasis de graves y hasta siete canales. Otra característica de MPEG-2 es que puede proporcionar una amplia gama de relaciones de compresión variables para satisfacer diferentes requisitos de calidad de imagen, capacidad de almacenamiento y ancho de banda. MPEG-2 es particularmente adecuado para codificar y transmitir televisión digital a nivel de transmisión y es un estándar de codificación reconocido para SDTV y HDTV. MPEG-2 también especifica los métodos de multiplexación y demultiplexación de programas multicanal. Además, MPEG-2 también considera el problema de adaptación de las células ATM.

El estándar MPEG-2 actual se divide en 9 partes, de las cuales las primeras 6 partes se denominan colectivamente estándar internacional ISO/IEC13818. El contenido de cada parte se describe a continuación:

Parte 1 - ISO/IEC 13818-1, Sistema: Sistema, describe el método de sintetizar múltiples flujos básicos de video, audio y datos en flujos de transporte y flujos de programa. .

Parte 2 - ISO/IEC 13818-2, Vídeo: describe los métodos de codificación de vídeo.

Parte 3: ISO/IEC 13818-3, Audio: describe métodos de codificación de audio que son compatibles con versiones anteriores del estándar de audio MPEG-1.

Parte 4: ISO/IEC 13818-4, Pruebas de conformidad, describe métodos para probar si una secuencia codificada se ajusta a una secuencia MPEG-2.

Parte 5 - ISO/IEC 13818-5, Software: Describe los métodos de implementación de software de las Partes 1, 2 y 3 del estándar MPEG-2.

Parte 6 - ISO/IEC 13818-6, DSM-CC: Medios de almacenamiento digital - Comando y control, describe la señalización de sesión establecida entre servidores y usuarios en redes multimedia interactivas.

La Parte 7 estipula que la codificación de audio multicanal MPEG-1 no es compatible con versiones anteriores. ?

Originalmente se planeó usar la octava parte para codificación de muestreo de video de 10 bits, pero se suspendió. ?

La Parte 9 especifica la transmisión en tiempo real de flujos de código.

La tecnología MPEG-2 es la tecnología estándar para realizar DVD y se utiliza para proporcionar vídeo digital con calidad de transmisión para transmisiones, redes de televisión por cable, redes de cable y transmisiones en vivo por satélite.

MPEG-3

Debido al excelente rendimiento de MPEG-2, se puede aplicar a HDTV (televisión de alta definición), lo que hizo que MPEG-3 originalmente diseñado para HDTV fuera Utilizado antes de su nacimiento.

MPEG-4

La investigación sobre MPEG-4 comenzó en julio de 1995 y fue aprobado como estándar oficial por ISO/IEC en octubre. El número de estándar oficial es ISO/IEC14496, que no solo apunta a la codificación de video y audio a una determinada velocidad de bits, sino que también se centra en la interactividad y flexibilidad de los sistemas multimedia. Este estándar se utiliza principalmente para videoteléfonos, correos electrónicos con video, etc. Se requiere que la velocidad de transmisión sea baja, 4800-6400 bits/segundo, y la resolución sea 176 * 144. MPEG-4 utiliza un ancho de banda muy estrecho y utiliza tecnología de reconstrucción de cuadros y compresión de datos para obtener la mejor calidad de imagen con la menor cantidad de datos. Aprovechando la alta tasa de compresión y la alta calidad de reproducción de imágenes de MPEG-4, los archivos de vídeo MPEG-2 en DVD se pueden convertir en archivos de vídeo más pequeños. Después de este procesamiento, la calidad de vídeo de la imagen no se reduce mucho, pero el tamaño se puede reducir varias veces, por lo que es muy conveniente utilizar CD-ROM para guardar programas en DVD. Además, MPEG-4 también es muy útil en fotografía doméstica y grabación de vídeo, así como en la reproducción de vídeo en red en tiempo real.

MPEG-7

MPEG-7 (su origen es 1+2+4=7, porque no existe MPEG-3, MPEG-5, MPEG-6) en 1996 + Empieza a aprender a las 00. Para ser precisos, MPEG-7 no es un método de codificación por compresión. Su nombre oficial es "Interfaz de descripción de contenido multimedia". Su propósito es producir un estándar para describir contenido multimedia. La norma proporcionará un cierto grado de libertad en la interpretación del significado de la información que puede transmitirse y acceder a dispositivos y programas informáticos. MPEG-7 no está dirigido a una aplicación específica, sino a los elementos de imagen estandarizados por MPEG-7, y admitirá tantas aplicaciones como sea posible.

El punto de partida para establecer el estándar MPEG-7 fue clasificar imágenes y sonidos según muchos parámetros y consultar sus bases de datos, tal como consultamos las bases de datos de texto hoy. Se puede aplicar a bibliotecas digitales como catalogación de imágenes, diccionarios musicales, etc. Servicios de consulta multimedia, como guías telefónicas; selección de medios de difusión, como canales de radio y televisión, edición multimedia, como servicios de noticias electrónicas personalizadas, creación de medios, etc.

MPEG-21

MPEG propuso el concepto de "núcleo abierto" en la Conferencia MPEG de junio de 1999, y la Conferencia MPEG del 19 de febrero determinó el nombre oficial de MPEG-21. "Open Core" o "Digital Audiovisual Framework" tiene como objetivo integrar estándares para apoyar la coordinación de tecnologías y la gestión de negocios multimedia, con el objetivo de entender cómo integrar diferentes tecnologías.

A medida que la tendencia de la digitalización se vuelve cada vez más evidente hoy en día, los expertos en MPEG nos traerán nuevas series MPEG para resolver los problemas que siguen surgiendo en el camino hacia la digitalización.