Imagen de referencia

Una imagen de referencia es un término en compresión de video para denotar una imagen ya codificada que puede usarse como base para la predicción de imágenes futuras . La técnica de predicción implica buscar contenido en una imagen de referencia que sea similar al contenido de la imagen actual. Esta es una predicción temporal. Una vez que se ha identificado el contenido similar, el algoritmo deduce el vector de movimiento que conecta los dos bloques. Este tipo de imagen se utiliza para la compresión de entre imágenes durante los pasos de estimación de movimiento y compensación de movimiento del esquema de codificación. En los estándares de codificación más antiguos, como MPEG-2 , solo se usa un marco de referencia para los marcos P que coinciden con el marco anterior y se necesitan dos marcos para codificar los marcos B , un marco pasado y un marco futuro . En el estándar H.264 , el algoritmo de estimación de movimiento se puede realizar en múltiples imágenes de referencia pasadas para tipos entre imágenes.

Múltiples marcos de referencia o múltiples marcos de referencia

En algunos estándares modernos de compresión de video, como H.264, se permite la elección de un número múltiple de cuadros de referencia. Esto permite que el codificador de video elija entre más de una imagen decodificada previamente, el mejor bloque correspondiente al bloque o macrobloque actual. Aunque la mejor imagen para este propósito suele ser la anterior, otras imágenes de referencia pueden mejorar la eficiencia de compresión y / o la calidad del video. En H.264, el número máximo de imágenes de referencia admitidas es 16 y cada macrobloque puede usar varias de estas imágenes para codificarse, todo depende del modo de predicción utilizado. Por ejemplo, si un macrobloque (bloque de tamaño 16x16 píxeles ) se divide en 4 bloques de 8x8 píxeles, entonces cada uno de estos cuatro bloques puede usar una imagen de referencia diferente. Otro formato de video admite esta opción: es el códec de video Snow que puede manejar hasta 8 imágenes. El códec Theora proporciona un conjunto limitado de marcos de referencia, lo que permite referencias tanto al marco anterior como al intra-marco más reciente.

Varias referencias.jpg

La imagen de arriba representa un ejemplo de estimación de movimiento de varias imágenes de referencia. Uno de los dos bloques de la imagen actual utiliza 3 imágenes para codificar mientras que el segundo solo necesita una.

Defaults

En términos de codificación

Varias imágenes de referencia pueden aumentar drásticamente el tiempo de codificación, ya que muchas decisiones, como la estimación de movimiento, solo funcionan fotograma a fotograma y, por lo tanto, deben repetir su algoritmo en otros fotogramas de referencia antes de tomar su decisión final. Las heurísticas se pueden utilizar para reducir este costo de tasa a expensas de la calidad.

A nivel de decodificación

Durante la decodificación, las imágenes de referencia deben almacenarse en la memoria hasta que ya no sean necesarias para la decodificación de cuadros posteriores. Por lo tanto, para un gran número de imágenes de referencia, es necesario proporcionar un espacio de almacenamiento bastante grande, especialmente si las imágenes están en formato HD . El uso de múltiples imágenes de referencia también tiene un impacto negativo en el rendimiento temporal de la decodificación.

Referencias

  • (en) EG Richardson, Compresión de video H.264 y MPEG-4: Codificación de video para multimedia de próxima generación , Chichester, John Wiley & Sons Ltd.,Septiembre de 2003( ISBN  0-470-84837-5 )
  • (fr) Este artículo está tomado parcial o totalmente del artículo de Wikipedia en inglés titulado Marco de referencia (video)  " ( consulte la lista de autores ) .

Apéndices

Artículos relacionados