Dark data : pourquoi vos vieilles photos saccagent l’environnement

Dark data : pourquoi vos vieilles photos saccagent l’environnement

Ah, toutes ces photos de votre voyage en Inde en 2014, qu’elles sont belles. Et ces vidéos de votre week-end en amoureux à Amsterdam, la même année : que de beaux souvenirs… Mais les avez vous vraiment regardées, revues, écoutées, duis votre retour de voyage, il y a déjà 6 ans ? Duis quand vos dossiers plein à craquer de fichiers multimédias trônent-ils sur votre “bureau” (virtuel) d’ordinateur, sans que vous les ayez consulté ?

Vous pensiez que ces dossiers étaient inoffensifs, puisqu’ils étaient sur votre disque dur. Vous aviez raison. Vous pensiez la même chose lorsque, pour les sauvegarder quelque part “au cas où”, vous les avez envoyé sur iCloud ou Google Drive. Vous aviez hélas tort. 



Données oubliées

Vous le savez sans doute déjà : le numérique pollue, et l’IA tout particulièrement. Entraîner un modèle de de learning pour traitement du langage naturel émet par exemple autant qu’un être humain pendant 57 ans, ou que 5 voitures pendant leur durée de vie.

L’utilisation d’une masse considérable de données (le fameux Big data) nécessite notamment l’utilisation de milliers de centres de calcul et de fermes de serveurs, les data centers, qui tournent à plein régime, et qui génèrent 2 à 5 % des émissions mondiales de gaz à effet de serre, selon une étude de l’Université du Massachusetts datant déjà de l’été dernier. Mais il faut savoir que toutes ces données qui polluent indirectement ne sont mêmes pas toutes utilisées.

En 2015, Gartner parlait déjà de ces fameuses “dark datas”, ou données sombres. Une sorte de “matière noire” informationnelle que les entrrises “collectent, traitent et stockent au cours de leurs activités commerciales quotidiennes, mais qu’elles n’utilisent généralement pas à d’autres fins, que ce soit pour en tirer des informations ou pour prendre des décisions”. Selon le cabinet, les organisations “conservent souvent ces données uniquement à des fins de conformité, et leur stockage, de même que leur sécurisation, impliquent généralement plus de dépenses (et parfois plus de risques) que de valeur.”

Bien souvent, si les dark datas ne sont pas utilisées, c’est souvent parce que l’entrrise ne dispose pas des outils pour analyser ces données qu’elle a collecté en masse, et qui sont déstructurées (dans des formats difficiles à classer et à lire). Parfois, elle n’a même pas conscience que ces données sont collectées. Selon IBM, les données sombres sont aussi issues de capteurs et d’objets connecté ; elles rrésentent 90 % des datas de ces appareils, et ne sont jamais utilisées. Big Blue estime en outre que la majorité des organisations n’analysent que 1 % de leurs données, qui sont souvent “stockées à des fins de conformité réglementaire, ou au sein d’un registre”.

 



Données inutiles 

Certaines d’entre elles pensent que ces dark datas pourraient leur être utiles à l’avenir, notamment “le jour où elles auront acquis une meilleure technologie d’analyse et de veille économique pour traiter les informations. Dans le même temps, explique Gartner, “le stockage de ces données dans les nuages étant peu coûteux, il est facile pour ces entrrises de les conserver à outrance”.

En 2014, selon une étude de l’AIIM (Association for Information and Image Management), 60% des entrrises estimaient alors que leur “capacité de rorting en matière d'intelligence économique était insuffisante” pour analyser ces données sombres. La situation semble avoir peu changé 6 ans plus tard. Selon un récent rapport de Veritas Technologies, une startup américaine spécialisée dans la “gestion des données multi-cloud”, 52 % de toutes les informations stockées par les entrrises sur des data centers sont des données obscures. Des datas dont la valeur est inconnue car elle n’a “pas encore été définie”, ou parce quelles sont tout simplement inutiles. À noter sur ce point que selon IBM, 60 % des dark datas perdent leur valeur très rapidement, car périssables.

 



6,4 millions de tonnes de dioxyde de carbone

Au fond, tout cela serait sans grande importance, si ces dark datas n’avaient pas une empreinte énergétique et environnementale non négligeable. Car toutes ces données, stockées sur des data centers (dont la plupart sont extrêmement énergivores et sont encore nombreux à fonctionner grâce à de l’électricité produite à partir de charbon ou de centrales nucléaires), mobilisent en effet des ressources énergétiques importantes, pour un impact sur l'environnement conséquent. D’après l’étude de Veritas, environ 6,4 millions de tonnes de dioxyde de carbone seront rejetées inutilement dans l'atmosphère en 2020 à cause de ces données inutilisées ou oubliées.

Quitte à faire des comparaisons imagées (mais un peu nébuleuses ?), Veritas Technologies indique qu’il s’agit de l’équivalent du rejet annuel de 80 pays, ou que cela revient à faire 575 000 fois le tour du monde en voiture (tout en polluant l’air sur son passage). Mais les choses ne devraient pas s’arrêter là. En effet, rrenant des estimations du cabinet IDC, elle explique que l'Internet des objets (IoT) entraînera bientôt une “augmentation massive” de la production de données “dans le monde entier”, les faisant passer de 33 zettaoctets (ZB) en 2018 à 175 ZB en 2025, soit 175 milliards de téraoctets. Dans ce gloubi-boulga, les dark datas devraient rrésenter 91 ZB, soit 4 fois la quantité globale de données actuelles. “Une superficie de 7 500 000 acres de forêt, 500 fois la taille de Manhattan, sera nécessaire pour absorber tout le dioxyde de carbone produit”, observe Veritas.

Que penser de ces chiffres ? Au Shift Project, think tank dédié à la transition énergétique en Europe, Hugues Ferreboeuf, directeur du projet ‘sobriété’, réfléchit sur les pratiques permettant de limiter l’impact environnemental du numérique. Selon le chercheur, les dark datas ne polluent en fait pas tant que cela… pour l’instant. “Le stockage de données (global) consomme 30 % de la consommation d’électricité des data centers ; qui consomment eux même 400 térawattheures (TWh) pour tourner. Ce qui signifie donc que les données consomment 130 TWh. Si 50 % d’entre elles ne servent à rien, nous avons donc 60 Twh de consommés pour rien, soit environ 30 millions de tonnes d’émissions de CO2 tous les ans”, calcule-t-il. “Certes, c’est dix fois moins que l’utilisation du streaming (autour de 300 millions de tonnes de CO2 consommées par an), mais il faut retenir que le volume des données stockées dans le cloud croit encore plus vite que le trafic sur les réseaux”, ajoute l’ingénieur.

D’après Hugues Ferreboeuf, le trafic sur les réseaux augmente de 25 et 30 % par an, tandis que les données stockées croissent de 35 à 40 % par an, “notamment en raison de ces dark datas qui restent alors qu’on ne les utilise qu’une fois ; et qui sont en fait inutiles, qui ne servent à rien.”

 



Un impact indirect, mais colossal

Frédéric Bordage, fondateur de GreenIT.fr et spécialiste du conct de sobriété numérique, nuance aussi l’importance de la pollution, directe, causée par les dark datas via les data centers. “6,4 millions de tonnes de CO2, en % de l’empreinte du numérique mondial en 2020, c’est 0,38 % des émissions de gaz à effets de serre sur le plan mondial en 2020 (qui correspondent précisément à 1671 millions de tonnes d’équivalents CO2). C’est vraiment dérisoire”, observe-t-il. Mais ce qui l’est moins, c’est l’effet indirect du stockage de toutes ces données inutiles ou inexploitées. “On se trompe d’angle de tir. Le problème, ce n’est pas le stockage des données sombres, qui est un détail à l’échelle de l’empreinte environnementale du numérique mondial (1). Le vrai enjeu avec les dark datas est le suivant : s’il y en a trop, ils risquent de boucher les tuyaux, et de déclencher la nécessité de fibrer la planète entière, ainsi que de mettre de la 5G partout.”

Cet effet marginal serait ainsi le vrai nœud du problème. “Car toutes ces données inutiles, tout ce gras, pourrait déclencher indirectement des impacts environnementaux colossaux en entraînant l’obsolescence d’équipements qui étaient suffisants et qui fonctionnaient jusqu’à présent ; qu’il s’agisse des serveurs, du réseau ou des terminaux des utilisateurs”, explique l’expert en éco-conction logicielle. Au cas où tout cela ne serait pas assez clair, il enfonce le clou : “ce qui est en train de se passer, c’est que l’on migre actuellement vers la 5G pour des données qui ne servent à rien ; globalement, on update le parc informatique mondial à cause du gras, qui va du streaming en 4K aux dark datas oubliées dans les serveurs des entrrises, mais aussi des particuliers”. 100 Go de photos et de vidéos inutiles (mais en ligne) par personne rrésenterait par exemple 100 Go x 4 milliards d’utilisateurs, soit 400 milliards de Gb de données sombres. Juste chez les internautes lambdas.

Au Shift Project, Hugues Ferreboeuf estime également que le problème des dark datas concerne aussi le grand public. “L’étude de Veritas vise essentiellement les entrrises, qui stockent de nombreuses données via leurs logiciels de gestion (avec l’idée qu’ils pourraient l’utiliser un jour), notamment. Mais le stockage de données inutilisées est aussi une réalité chez tout un chacun. Nous faisons tous des photos avec notre smartphone, nous sommes nombreux a utiliser un système de réplication automatique des photos dans le cloud, et aussi à conserver sur notre ordinateur et en ligne des centaines ou milliers de photos que nous ne regardons jamais, et que nous ne regarderont sans doute jamais…”, note-t-il.

 



Les Marie Kondō du cloud

Triste réalité. En tout cas pour tous les nostalgiques qui aiment, comme moi, peut-être comme vous, revoir des photos anciennes de temps en temps sur leur écran d’ordinateur ou de smartphone. Et qui, avouons-le, les stockent à la fois en physique et dans les nuages. Mais les chiffres et les études se rejoignent et sont implacables. La vérité est là. Si nous nous soucions de l’environnement et de ce que nous léguerons un jour à nos enfants, mieux vaut peut-être faire le tri dans les photos de ces derniers. Et devenir des Marie Kondō du cloud computing.

“Les données sombres sont une menace, mais dans le sens où aujourd’hui, l’on ne s’aperçoit plus des données que l’on stocke ou que l’on consomme. Essentiellement parce que s’opère duis dix ans un mouvement vers le cloud qui nous prive d’une voix de retour : avant, quand notre disque dur était presque plein, un message nous prévenait et plutôt que d’en acheter un autre, nous faisions le tri dans les données. Dans le cloud, tout est fait pour nous éviter de nous poser cette question, et nous sommes alors d’autant moins attentifs aux données que nous conservons en ligne”, explique Hugues Ferreboeuf.

Entrrises comme particuliers, nous avons donc perdu l’habitude de mesurer le poids de nos données dans nos infrastructures ou nos services en ligne. Hugues Ferreboeuf espère que les géants du Web finiront bien par nous aider à ranger nos affaires virtuelles, en nous rappellent qu’il faut le faire. En 2022, les FAI et les opérateurs télécoms seront contraints de calculer ce que génèrent les activités en ligne de leurs clients, et de les informer sur leur impact carbone. Une mesure de la loi anti-gaspillage adoptée au Parlement le 30 janvier 2020.



Éco-conction

“Cela sera affiché sur la facture des gens tous les mois ou deux mois, il s’agira du premier exemple de rappel à l’ordre dans ce domaine. Mais en attendant, quand Google vous prévient que vous avez consommé 50 % de votre espace sur le cloud, il ne vous dit pas combien cela rrésente en CO2”, déplore Hugues Ferreboeuf. Pour le chercheur du Shift Project, un système informatif sur l’impact environnemental du stockage en ligne devrait être la norme, “by design”. À défaut, “il faudra sans doute le rendre obligatoire… Mais de la même façon que l’on a rendu obligatoire l’affichage des émissions de CO2 des véhicules par les constructeurs automobiles, en fin de compte”.

Veritas planche notamment sur des solutions de “data mapping” pour les organisations, qui permettent déjà de visualiser la production et la circulation de datas au sein de l’entrrise, pour la limiter au nécessaire. La mise en place progressive de la RGPD en Europe, qui oblige les entrrises à supprimer les data des clients inactifs duis 3 ans pourrait en outre permettre de limiter l’inflation de données stockées.

 



Green Attitude

D’ici là, comment agir pour alléger soi-même, sur le plan individuel, le poids de nos données inutilisées ? D'abord, en adoptant la "green attitude”, qui voudrait que l’on ne regarde plus le cloud comme un espace de stockage et de rangement infini, et que l’on limite au maximum son usage. “Il faut se poser la question tabou, que l’on soit en entrrise ou chez soi : à quoi vont servir mes données, vais je réellement les utiliser, ai je vraiment besoin de les stocker ?”, note Frédéric Bordage.

À nous, donc, d’assumer nos responsabilités. Avant tout, en faisant le tri dans nos e-mails et nos photos / vidéos stockées en ligne. Des outils comme Cleanfox permettent par exemple de se désabonner automatiquement des nombreuses newsletters et spams qui encombrent nos boîtes mails, gaspillant au passage de l'énergie et dopant la production de dioxyde de carbone. Comme le résume bien l’Ademe dans son guide pratique sur la “face cachée du numérique”, pour réduire l’impact du numérique sur l’environnement, deux actes très simples s’offrent à vous. “Ne conservez que ce qui vous est utile, que ce soit en ligne ou sur vos équipements. Enfin, stockez et utilisez le maximum de données localement”.



Vers la sobriété numérique

“Il faut tendre vers la sobriété numérique : faire le ménage régulièrement dans les gros fichiers ; les vidéos, les photos, les fichiers d’installation qui pèsent lourd… Cela vous évitera en outre d’avoir besoin deacheter un 2e disque dur externe ou un espace de stockage en ligne plus grand”, conclut Frédéric Bordage. L’idée étant notamment de supprimer les photos prises en double ou en triple, et d’accter de n’en garder qu’une seule ; de retrouver le bon sens d’un usage frugal et sobre que nous avions à l’époque où nous prenions des photos argentiques qui nous obligeaient à faire attention. Quant aux entrrises (y compris celles qui fabriquent des objets connectés), tout sera demain une question d’éco-conction de leurs services numériques. Éviter de générer trop de données, afin de ne pas avoir besoin d’en supprimer.

(1) The Shift Project estime que l'empreinte énergétique de l'industrie du numérique, dans sa globalité, augmente de 10 % par an. Dans son rapport, intitulé "pour une sobriété numérique", l’ONG française explique que la part du numérique dans les émissions de gaz à effet de serre a augmenté de moitié duis 2013, passant de 2,5 % à 3,7 % du total des émissions mondiales, et que “les émissions de CO2 du numérique ont augmenté dans le même temps d’environ 450 millions de tonnes dans l’OCDE, dont les émissions globales ont en même temps diminué de 250 millions de tonnes”. Ainsi, alors que l'intensité énergétique (le rapport de la consommation d'énergie au PIB) de l'économie en général a tendance à s'améliorer, celle du numérique s'aggrave - dans le monde en général, elle baisse de 2% par an, mais dans le numérique, elle augmente de 4 % par an.


à lire aussi Disney+ France : tarifs, abonnement (via Canal ou pas), films et séries à l'affiche… ce qu'il faut savoir sur la plateforme de streaming

Lire l'article sur cnetfrance.fr

Keynote Apple du 15 septembre : à quoi pourrait bien ressembler le prochain iPad ?

Keynote Apple du 15 septembre : à quoi pourrait bien ressembler le prochain iPad ? Apple préparerait un nouvel iPad, on l'espère plus accessible que le Pro.

Poco X3 disponible : Xiaomi fracasse les prix avec un smartphone 120 Hz à moins de 200€

Poco X3 disponible : Xiaomi fracasse les prix avec un smartphone 120 Hz à moins de 200€ MAJ le 11/09/2020. Xiaomi complète son offre d'entrée de gamme avec le Poco X3, un smartphone qui s'inspire des références les plus coûteuses pour composer sa fiche technique.

Ces objets connectés pour faire face au coronavirus

Ces objets connectés pour faire face au coronavirus Depuis le déconfinement en mai dernier, les technologies destinées à nous aider à respecter la distanciation sociale fleurissent. Dans les entreprises comme chez les particuliers, ces objets connectés constituent toutefois des systèmes de surveillance et de pistage. À l’origine d’un potentiel nouveau marché très lucratif ?

Forfait mobile + Box fibre : Free ou RED by SFR, quelle offre choisir ?

Forfait mobile + Box fibre : Free ou RED by SFR, quelle offre choisir ? RED et Free cassent les prix sur leu abonnements qui incluent forfait mobile et internet fibre. Entre la Freebox mini 4K et RED Box, quelle est l'offre la plus attrayante ?

Netflix : 3 très bons films à voir ou revoir pour le plaisir ce week-end

Netflix : 3 très bons films à voir ou revoir pour le plaisir ce week-end Besoin de décompresser sur Netflix ce week-end après une longue semaine ? Voici notre sélection de trois très bon films présents au catalogue de la plateforme de streaming par abonnement (SVoD).

LG OLED55BX6 : les précommandes sont lancées, les premières livraisons fin septembre

LG OLED55BX6 : les précommandes sont lancées, les premières livraisons fin septembre Le téléviseur OLED le moins cher d'LG est désormais disponible en précommande chez les principaux distributeurs. Les premières livraisons auront lieu entre le 21 et la fin du mois de septembre.