Que savons-nous des impacts environnementaux de la vidéo en ligne ? L’exemple de Netflix

Cet article est publié Binaire, le blog pour comprendre les enjeux du numérique.

Compte tenu des efforts importants que doit consentir le secteur des Technologies de l’Information et de la Communication (TIC) pour passer d’une tendance de forte croissance de ses émissions de Gaz à Effet de Serre (+45% d’ici 2030) à une trajectoire de réduction significative (-45% sur l’horizon 2030), même période), tous les aspects du numérique doivent nécessairement s’interroger sur leur contribution à cette tendance. En ce sens, il est intéressant de cartographier et d’estimer leurs impacts environnementaux afin de construire une société durable.

Comme le montre le graphique ci-dessous, la vidéo en ligne représente la majorité du trafic Internet dans le monde.


Principales catégories de contenu par volume de trafic de téléchargement. Données du rapport mondial sur les phénomènes Internet 2024 de Sandvine.

Binaire

Pour la France, les hébergeurs vidéo sont principalement responsables de l’augmentation du trafic vers les utilisateurs au niveau de l’interconnexion, avec une augmentation de x2,4 de début 2020 à fin 2022.

La vidéo est donc souvent pointée du doigt comme l’une des principales causes des impacts environnementaux du numérique et est débattue, par exemple, dans le rapport 2019 de The Shift Project sur la non-durabilité de la vidéo en ligne. Mais au-delà des téléviseurs et autres terminaux de visualisation, que sait-on de la matérialité du visionnage d’un film ou d’une série en vidéo à la demande (VoD) ? A quoi sert réellement cet équipement ?

Peu d’informations publiques existent sur les architectures très complexes exploitées par les prestataires de services VoD et sur leur dimensionnement. Cependant, nous avons tenté une analyse grossière du service Netflix. Ce dernier est en effet l’un des plus utilisés et a le mérite de rendre accessible certaines informations concernant son fonctionnement. Cette plateforme n’est qu’un exemple et le but n’est en aucun cas de cibler spécifiquement cette entreprise.

A travers les informations recueillies via différentes sources (rapports d’activité, vidéos de conférences techniques, articles de blog), nous illustrons la difficulté de cartographier les différentes parties de l’architecture d’un service de VoD, travail qui est pourtant indispensable avant de procéder à une quantification de l’impact environnemental. impacts d’un tel service.

Même si la consommation électrique n’englobe pas tous les impacts environnementaux, elle fait partie des informations rendues publiques par Netflix, comme le montre la figure ci-dessous. 2019 est la seule année pour laquelle une estimation de la consommation des serveurs exploités par des tiers est fournie.


Consommation d’énergie.

Binaire

Le streaming vidéo, comment ça marche ?

La partie la plus simple à expliquer concernant cette consommation concerne la réseau de diffusion de contenu (CAN). Il s’agit d’une infrastructure comptant plusieurs dizaines de milliers de serveurs pour Netflix répartis dans le monde et hébergeant les titres les plus populaires du catalogue au plus près des utilisateurs. Certains de ces serveurs sont hébergés directement dans les centres de données des fournisseurs d’accès Internet (FAI) et échappent ainsi à la consommation électrique précise rapportée par Netflix.

Les FAI disposent en effet de leurs propres centres de données, afin de permettre d’acheminer un trafic Internet de qualité tout en réduisant la pression sur les infrastructures réseaux.

Ainsi, lorsqu’un utilisateur accède à un contenu vidéo en ligne, c’est en réalité le plus souvent sur un CDN que ce contenu est hébergé. Ces données transitent par toutes les infrastructures réseaux (câbles, antennes, équipements de routage, etc.) nécessaires pour connecter ce CDN à l’utilisateur, sans oublier sa box Internet et potentiellement d’autres équipements (switch, répéteur wifi, box TV, etc.) pour le terminal où la vidéo est visionnée.

Le reste de la consommation des serveurs tiers concerne l’utilisation d’Amazon Web Services (AWS) pour toutes les opérations en amont de la diffusion du contenu vidéo lui-même. Cela représente une utilisation constante de plusieurs centaines de milliers de machines virtuelles (plus de cent mille en 2016) en plus des besoins de stockage.

En effet, une fois produite, une vidéo est d’abord stockée sous forme brute et non compressée. Il est ensuite encodé dans une centaine de versions différentes afin d’offrir la meilleure qualité d’expérience utilisateur quelles que soient les caractéristiques du terminal et de son écran (plus de 1 500 types d’équipements supportés), la qualité du réseau Internet et du système d’exploitation. utilisé. L’encodage vidéo nécessite ainsi plusieurs centaines de milliers de CPU en parallèle.

Ces multiples versions sont dupliquées sur plusieurs serveurs au sein de datacenters situés dans des zones géographiques différentes (3 pour Netflix en 2016) pour des raisons de sécurité et pour garantir l’accès aux contenus dans le monde entier.

La face cachée de la VoD

Les modèles économiques des plateformes de VoD reposent sur la rétention d’attention et le nombre d’abonnés ou de vues. Avant de pouvoir visualiser un contenu vidéo, l’utilisateur commence par naviguer sur la plateforme, depuis la page d’accueil jusqu’au choix du contenu. Cette navigation est personnalisée pour chaque utilisateur et repose sur des mécanismes de captation et de rétention de l’attention nécessitant la collecte, le stockage et le traitement de nombreuses données personnelles et d’usage. Toute une partie de l’infrastructure, et donc de l’empreinte environnementale, est ainsi liée non pas à la diffusion de vidéos, mais à la personnalisation de l’expérience utilisateur.

L’ensemble des données permettant la mise en œuvre de ces mécanismes est communément appelé « datahub ». Celle-ci est composée à la fois de données collectées par la plateforme (données utilisateurs et données d’utilisation), agrégées avec des données provenant d’autres sources de la chaîne de valeur Netflix : annonceurs, prestataires de paiement, prestataires de services, prestataires de mesures d’audience, avis de contenus, réseaux sociaux, etc. . Netflix est par exemple membre de la Digital Advertising Alliance.

Ce datahub est de taille importante, en 2016 pour 89 millions de comptes il contenait 60 Po (1 pétaoctet = 1 million de Go) de données. Il n’est pas aberrant d’imaginer qu’elle sera encore plus importante aujourd’hui avec 260 millions d’abonnés en 2023.

En revanche, la taille du catalogue de Netflix est estimée entre 50 000 et 60 000 heures de visionnage. Dans cet article, nous parlons de 470 Go par heure de vidéo brute, ce qui donne un catalogue non codé d’environ 25 Po, soit la moitié du datahub de 2016. Intuitivement, cependant, nous nous attendrions à ce que la vidéo brute du catalogue représente une part plus importante des besoins de stockage que les données d’utilisation.

À ce volume de données s’ajoutent les flux vidéo et les données produites dans le cadre des tournages et du montage par les studios Netflix eux-mêmes, qui représentent environ 100 Po par an.

Pour soutenir leur modèle économique, le volume des productions originales augmente fortement, tout comme les impacts environnementaux associés, qui représentent plus de la moitié des émissions de gaz à effet de serre de Netflix.

Omdia 2023/Binaire

Au-delà du stockage, chaque action sur la plateforme (recherche, clic sur play, etc.) génère un événement traité par Netflix, il y en avait 500 milliards par jour en 2016. Cette captation de données sert par exemple à générer une page d’accueil personnalisée. pour chaque compte utilisateur. Cette dernière nécessiterait au total plus de 22 000 serveurs virtuels hébergés chez AWS, et le stockage de plus de 14,3 Po de données pour la gestion d’un cache dynamique appelé EVCache.

Parmi les éléments de personnalisation de l’expérience utilisateur, il y a évidemment le contenu proposé, mais aussi la manière dont il est présenté avec la personnalisation des vignettes utilisées, ou encore l’utilisation de « Dynamic Sizzles », génération de vidéos personnalisées agrégeant des contenus issus de plusieurs films ou séries.

Ces mécanismes de rétention de l’attention reposent sur l’utilisation d’algorithmes d’apprentissage automatique continu de plus en plus avancés, nécessitant à la fois de grandes quantités de données et de puissance de calcul. Pour des raisons évidentes de mise à jour, ces algorithmes sont entraînés de manière incrémentale. La généralisation de leur utilisation entraîne nécessairement une augmentation des données acquises, traitées et stockées, augmentant ainsi les impacts environnementaux associés.

A toutes ces données, il faut ajouter les politiques de sauvegarde nécessaires à la reprise de l’activité en cas d’incident. Ils sont appliqués à chaque niveau de cette architecture, ce qui peut conduire à une duplication plus ou moins importante de l’ensemble de ces contenus. A noter que Netflix met également en œuvre des méthodologies sophistiquées de purification des données, tant au niveau du cache et du datahub que des données produites par les studios.

« Juste » une vidéo ?

Ainsi, regarder une vidéo en ligne implique de nombreuses étapes et données générées bien au-delà du contenu vidéo lui-même. L’optimisation à l’extrême de l’expérience utilisateur repose sur des ressources matérielles importantes par rapport au simple visionnage de vidéos. Le manque d’informations disponibles sur le fonctionnement complet des plateformes et des infrastructures associées rend hasardeux à ce stade l’évaluation des impacts environnementaux de leur activité au regard des limites planétaires par un tiers indépendant.

Certains pourraient rétorquer que ces impacts, rapportés au nombre d’abonnés, seraient sans doute négligeables par rapport à de nombreux autres postes de consommation. Par exemple, pour 2019, la consommation électrique des serveurs utilisés par Netflix ne représente qu’environ 2,3 kWh/an par abonné. Ce chiffre peut paraître insignifiant, voire contradictoire avec les chiffres de consommation énergétique des centres de données dans le monde de l’Agence internationale de l’énergie, qui représenteraient approximativement la consommation électrique d’un pays comme l’Italie ou le Royaume-Uni. . Cela illustre une difficulté des Technologies de l’Information et de la Communication (TIC) qui sont un secteur composé d’une myriade de services, chacun en apparence insignifiant, mais dont la somme des impacts est inquiétante. En d’autres termes, la réduction globale des impacts environnementaux des TIC implique nécessairement une myriade de « petites victoires ». Dans le contexte du streaming vidéo, Netflix n’est qu’un service de VoD parmi tout un ensemble de prestataires, et de nouveaux modes de partage de vidéos peer-to-peer ou via les réseaux sociaux.

La vidéo à la demande peut-elle devenir durable ?

Afin de respecter une trajectoire de réduction des impacts environnementaux du secteur de la vidéo en ligne, on peut légitimement se demander à quoi ressemblerait une plateforme de VoD compatible avec une trajectoire environnementale durable. L’analyse précédente soulève au moins quatre principaux domaines de réduction :

  • le compromis à faire entre le poids (résolution maximale et nombre de variantes) des vidéos encodées (qui impactent les besoins de calcul, de stockage et de transmission) et la qualité réellement perçue par les utilisateurs,

  • questionner à l’extrême la personnalisation de l’expérience,

  • la nécessité de performances élevées (en termes de qualité de service, de disponibilité, etc.) pour un service de divertissement,

  • et enfin, le rythme de production de nouveaux contenus.

Au-delà des enjeux environnementaux, les algorithmes de recommandation au cœur de ces plateformes de VoD soulèvent également de nombreuses questions éthiques et démocratiques.

 
For Latest Updates Follow us on Google News
 

NEXT Une interview vertieft die Gräben – .