¿Cómo funciona la codificación de la transmisión en vivo? | Codificación de video

La codificación de la transmisión en vivo divide un video en vivo en fragmentos más pequeños, los comprime y distribuye los datos de video a través de un CDN. Las actualizaciones de este proceso están haciendo que la transmisión en vivo sea más rápida.

Share facebook icon linkedin icon twitter icon email icon

Codificación de la transmisión en vivo

Metas de aprendizaje

Después de leer este artículo usted podrá:

  • Comprender por qué los archivos de video están codificados
  • Aprender cómo funciona la codificación de la transmisión en vivo
  • Aprender cómo las mejoras en el proceso de codificación de la transmisión en vivo pueden reducir la latencia

¿Qué es la transmisión en vivo?

La transmisión es un método para entregar datos a través de Internet sin que los usuarios finales descarguen completamente los datos. La transmisión en vivo es un tipo de transmisión en la que la transmisión se envía a través de Internet en tiempo real, sin que sea grabada y almacenada antes.

La transmisión de videojuegos, las transmisiones en redes sociales, como Periscope y Facebook Live, y las transmisiones deportivas profesionales a través de Internet son ejemplos de transmisión en vivo. Aunque tanto el audio como el video pueden transmitirse en vivo, este artículo se centrará en la transmisión de video en vivo.

¿Qué es la codificación de video?

La codificación de video es el proceso de comprimir datos de video para que puedan enviarse a otra ubicación de manera eficiente. El dispositivo en el extremo receptor de una transmisión, por ejemplo, una tableta en la que un usuario está viendo su programa de televisión favorito, decodifica los datos codificados. La codificación de video sigue estándares conocidos públicamente para que una variedad de dispositivos puedan interpretar la transmisión codificada.

La codificación de video es necesaria por dos razones principales:

  1. Los archivos de video sin comprimir tardan demasiado en enviarse por Internet para que la transmisión sea práctica.
  2. El video debe estar en un formato que cualquier dispositivo de usuario (teléfonos inteligentes, computadoras portátiles, PC, etc.) pueda interpretar.

En una transmisión de video en vivo, un dispositivo toma entradas audiovisuales, las codifica y se las envía al público, todo al mismo tiempo. La parte de codificación de este proceso es esencial para permitir que una variedad de dispositivos de usuario reciban y reproduzcan el video.

¿Cómo funciona la codificación de la transmisión en vivo?

Una transmisión en vivo desde una fuente que captura video, por ejemplo, una cámara web, se envía a un servidor, en el que un protocolo de transmisión, como HLS o MPEG-DASH dividirá la transmisión de video en segmentos más pequeños, cada uno de unos pocos segundos de duración.

El contenido de video se codifica utilizando un estándar de codificación. El estándar de codificación de uso general hoy en día se llama H.264, pero los estándares, como VP9, AV1 y HEVC también están creciendo en uso. Este proceso de codificación comprime el video al eliminar información visual redundante. Por ejemplo, en una secuencia de alguien hablando con el cielo azul de fondo, no es necesario volver a mostrar el cielo azul por cada segundo de video, ya que no cambia mucho. Por lo tanto, el cielo azul se puede quitar de la mayoría de los cuadros del video.

Los datos de video segmentados y comprimidos se distribuyen luego usando una red de entrega de contenido (CDN). Sin una CDN, muy pocos espectadores podrán cargar la transmisión en vivo; la sección final de este artículo explica por qué.

La mayoría de los dispositivos móviles tienen un codificador incorporado, lo que facilita a los usuarios normales la transmisión en vivo en plataformas de redes sociales y a través de aplicaciones de mensajería. Las marcas y las empresas que desean una transmisión de mayor calidad utilizan su propio software de codificación, hardware o ambos.

¿De qué manera las nuevas tecnologías hacen que la transmisión en vivo sea más rápida?

Con muchas transmisiones en vivo, los espectadores aún experimentan de 20 a 30 segundos de latencia, en otras palabras, el contenido que ven está 20 a 30 segundos atrasado en relación con el tiempo real. Esto se debe en parte a que cada segmento de video debe cargarse completamente antes de que pueda reproducirse, y cada segmento de video puede tardar varios segundos en cargarse.

Una solución a este retraso es un proceso llamado codificación fragmentada. Este proceso funciona mediante la "fragmentación", es decir, divide los segmentos de video en partes aún más pequeñas. Luego, esas piezas más pequeñas se codifican, y los dispositivos que reciben la transmisión pueden reproducir estos fragmentos más pequeños antes de que se cargue todo el segmento.

¿Cómo están mejorando las CDN para acelerar la transmisión en vivo?

Las CDN son esenciales para la transmisión en vivo porque permiten distribuir la transmisión a los usuarios en ubicaciones muy diferentes. Además, las CDN tienen mucho más ancho de banda para distribuir la transmisión que un solo servidor de origen. Sin una CDN, la transmisión en vivo puede encontrarse fácilmente con problemas de ancho de banda.

Sin embargo, la mayoría de las CDN todavía tienen que cargar un segmento completo de video antes de poder servir el segmento a múltiples usuarios a la vez. Esto reintroduce el problema de latencia que se supone que resuelve la codificación fragmentada.

Para acelerar la transmisión en vivo, Cloudflare ofrece una característica llamada aceleración de transmisión simultánea. El CDN de Cloudflare puede entregar un segmento de video a múltiples usuarios finales a la vez mientras se está cargando, y así elimina el tiempo de espera mientras se carga todo el segmento. La red global de Cloudflare abarca 200 ciudades en más de 100 países, lo que permite a los usuarios de todo el mundo sintonizar una transmisión en vivo, en tiempo real, de gran calidad.