Introduction
Nous regardons tous de plus en plus de vidéos en ligne : sur nos téléphones, tablettes, téléviseurs, au travail, dans le train, en marchant dans la rue, etc. À mesure que les services de streaming évoluent pour répondre à la demande de plus de contenu sur plus d'écrans, les coûts de stockage et de bande passante de la diffusion de vidéos sur ces écrans augmentent. La diffusion efficace de vidéos de haute qualité à grande échelle sur une vaste gamme d'appareils est au cœur de ce que nous faisons chez Brightcove. L'encodage contextuel peut réduire considérablement les coûts de stockage et de diffusion en continu de la vidéo, tout en améliorant la qualité de lecture pour les téléspectateurs. L'encodage contextuel utilise des algorithmes d'analyse de contenu avancés pour déterminer le nombre et la qualité des rendus à créer pour chaque vidéo. Dans la plupart des cas, cela se traduit par des fichiers vidéo plus petits (et des factures CDN plus petites) tout en maintenant la qualité visuelle.
Inscription à l'encodage contextuel
L'encodage contextuel nécessite des frais supplémentaires. Contactez votre Customer Success Manager pour savoir s'il est possible de regrouper l'encodage contextuel afin d'obtenir l'ensemble optimal de rendus pour vos vidéos.
Streaming à débit adaptatif : comment nous en sommes arrivés là
La plupart des vidéos diffusées sur Internet utilisent aujourd'hui des technologies de diffusion en continu à débit binaire adaptatif (ABR), telles que HLS et MPEG-DASH, pour optimiser la lecture vidéo. Un flux ABR contient plusieurs copies de la même vidéo, appelées « rendus », qui sont codées à des résolutions et à des débits binaires différents. Lorsqu'un utilisateur appuie sur le bouton de lecture, le lecteur reçoit un manifeste qui répertorie les rendus disponibles pour la lecture. Le lecteur choisit le rendu approprié à lire en fonction de plusieurs facteurs, notamment la bande passante actuellement disponible, la plénitude de la mémoire tampon et la taille de la fenêtre de lecture. Au fur et à mesure que ces facteurs changent au cours de la lecture, le lecteur peut passer à un rendu de qualité supérieure ou à un rendu de qualité inférieure, garantissant que le spectateur obtient la meilleure qualité vidéo possible avec une mise en mémoire tampon minimale.
Les services de streaming créent généralement une configuration d'encodage unique pour l'ensemble de leur contenu : un ensemble prédéterminé de rendus ABR, souvent appelé « échelle », qui est utilisé pour encoder chaque élément de contenu. Décider de la liste des résolutions et des débits à mettre dans une échelle ABR est une science inexacte. Dans certains cas, les échelles ABR peuvent être adaptées à un cas d'utilisation spécifique. Les animations, par exemple, peuvent être codées à des débits binaires inférieurs, car le contenu est généralement moins complexe.
Le problème avec l'ABR statique
Atteindre un large public oblige les streamers à adopter un scénario unique, utilisant une seule échelle de débit binaire pour encoder une variété de types de contenu pour une variété d'appareils d'utilisateurs finaux. Dans la plupart des cas, une seule échelle ABR est utilisée pour encoder du contenu sportif HD pour la lecture à la télévision ainsi que des dessins animés pour la lecture sur les téléphones.
Le problème ? L'utilisation d'une seule échelle de débit binaire entraîne souvent une qualité incohérente entre les différents types de contenu. Les vidéos très complexes telles que les contenus sportifs nécessitent plus de bits pour obtenir une expérience de visionnage acceptable que les animations. Par exemple, si vous orientez votre échelle ABR vers des débits binaires plus élevés pour vous assurer que votre contenu sportif a fière allure, vous gaspillez du stockage et de la bande passante lorsque vous utilisez ce même profil pour encoder du contenu animé. Ce gaspillage de stockage et de bande passante coûte de l'argent réel.
Optimisation des flux ABR avec l'encodage contextuel
C'est là qu'intervient la technologie d'encodage contextuel de Brightcove. Au lieu d'utiliser une échelle ABR pour tout le contenu, l'encodage contextuel analyse chaque vidéo source et crée intelligemment une échelle de débit binaire personnalisée (ensemble de rendus) pour chaque élément de contenu. De plus, le codage contextuel prend en compte les contraintes associées au réseau de diffusion et au périphérique utilisé pour afficher le contenu. Il décide du nombre de rendus nécessaires et des résolutions et débits à utiliser pour chacun, tout en maintenant un niveau de qualité constant pour tous les titres. Cela se traduit par des économies massives sur les coûts de stockage et de bande passante, tout en améliorant l'expérience de lecture pour les utilisateurs.
Le graphique ci-dessous illustre une échelle ABR statique typique ainsi qu'un exemple d'échelle contextuelle qui a été générée pour un clip d'actualités typique.
Le codage contextuel a pu fournir la même qualité que l'échelle ABR statique en utilisant deux fois moins de rendus et en utilisant des débits binaires inférieurs ou des résolutions plus élevées pour chaque rendu. Cela a un impact positif sur les performances de lecture et la rentabilité.
Meilleures performances de lecture à des débits binaires inférieurs
En utilisant l'échelle ABR statique, un utilisateur 3G mobile avec 1 000 kbps de bande passante soutenue atteindrait un pic au rendu 360p à 900 kbps. L'encodage contextuel a déterminé qu'il pouvait créer un rendu 432p de résolution plus élevée à un débit inférieur, soit 777 kbit/s. Ce rendu utilise 13% de bits en moins et offre en fait une résolution et une qualité supérieures, comme vous pouvez le voir dans la comparaison côte à côte ci-dessous. Dans l'exemple ci-dessous, les détails les plus nets du clip Context Aware sont visibles dans le texte en bas, ainsi que les cheveux de l'homme.
De même, un utilisateur disposant d'un forfait Internet résidentiel à prix économique fournissant 3 000 kbps de bande passante soutenue dépasserait le rendu 720p sous l'échelle ABR statique, tandis qu'il serait capable de diffuser en 1080p en utilisant l'encodage contextuel, offrant un Full HD vivre.
Coûts de stockage et de bande passante réduits
L'encodage vidéo sur les huit rendus de l'échelle ABR statique génère un total de 14 750 kbps de données. Pour une vidéo d'une minute, cela fait 885 Mo. L'échelle contextuelle sur la droite ne génère que 4 950 kbps. Ainsi, pour la même vidéo d'une minute, cela ne fait que 297 Mo, ce qui représente une économie de 66% sur les coûts de stockage. Étant donné que la bande passante utilisée dépend du nombre de téléspectateurs et de la durée de la vidéo visionnée, les économies de bande passante peuvent être encore plus élevées que celles du stockage. Dans l'ensemble, Brightcove prévoit jusqu'à 50 % d'économies sur les coûts de stockage et de bande passante. En ajustant les débits binaires des rendus au débit le plus bas nécessaire pour maintenir la qualité visuelle, les téléspectateurs consommeront généralement moins de bande passante au cours de chaque session de visionnage, offrant ainsi des économies supplémentaires sur les coûts de bande passante.
Encodage contextuel et livraison dynamique
L'encodage contextuel est une fonctionnalité de Livraison dynamique. Context Aware Encoding analyse chaque vidéo source et crée intelligemment une échelle de débit binaire personnalisée (ensemble de rendus) pour chaque élément de contenu. Lorsqu'un spectateur appuie sur play, Video Cloud identifie l'appareil demandeur afin que nous sachions quel type de format multimédia il attend (codecs, comment il doit être conditionné pour la livraison, quel type de DRM il utilise, de quels sous-titres il a besoin, quelle langue audio, etc.). Dynamic Delivery utilise ensuite ces informations pour traiter les différents niveaux de qualité en temps réel afin qu'ils soient au bon format pour l'appareil demandant le contenu.
Un diagramme illustrant l'architecture de livraison dynamique est présenté ci-dessous. Pour plus d'informations sur la livraison dynamique, consultez Présentation de la livraison dynamique.
Utilisation de l'encodage contextuel dans Video Cloud
Du point de vue de la publication vidéo, quelques éléments apparaîtront différemment dans Video Cloud Studio. Tout d'abord, lors du téléchargement de vidéos à l'aide du module de téléchargement, vous verrez un CODAGE CONTEXTUEL lors de la sélection d'un profil d'ingestion.
Le module Média affichera une icône verte en forme de nuage () à côté des titres vidéo qui ont été ingérés à l'aide d'un profil d'ingestion dynamique ou contextuel. Les vidéos ingérées à l'aide d'un ancien profil d'acquisition afficheront une icône grise ().