Internet se développe, mais les anciennes informations continuent de disparaître quotidiennement. Crédit :wk1003mike/shutterstock.com
De nombreux utilisateurs de MySpace ont été consternés de découvrir plus tôt cette année que la plate-forme de médias sociaux a perdu 50 millions de fichiers téléchargés entre 2003 et 2015.
L'échec de MySpace à prendre soin et à préserver le contenu de ses utilisateurs devrait nous rappeler que s'appuyer sur des services tiers gratuits peut être risqué.
MySpace a probablement conservé les données des utilisateurs; il vient de perdre leur contenu. Les données étaient précieuses pour MySpace; le contenu des utilisateurs moins.
Qu'est-il arrivé à MySpace
MySpace est un site de médias de réseautage social où les artistes peuvent télécharger de la musique ou d'autres contenus pour accès et distribution à sa communauté d'utilisateurs. Cela a toujours été un site gratuit, avec des revenus provenant d'annonces et de programmes qui ciblent les utilisateurs pour des produits spécifiques.
Formé en 2003 à l'imitation du site de jeux sociaux Friendster, MySpace a connu une croissance rapide et a été acheté par Rupert Murdoch's News Corporation en 2005. En 2008, MySpace était le premier site de réseautage social, évalué à un moment à 12 milliards de dollars, mais sa popularité a perdu de sa popularité – grâce à une surprévalence des publicités, préoccupations concernant l'exposition des mineurs à du contenu sexuel et d'autres problèmes. En 2011, News Corporation a vendu MySpace à Specific Media, qui l'a revendu en 2016 à Time Inc., qui a été à son tour racheté par la Meredith Corporation en 2018.
L'entreprise a donc connu trois changements de propriétaire sur une période de 12 ans, et a vu les revenus et les adhésions chuter précipitamment au cours de cette période. Une vente pourrait être bien, mais trois ventes à court terme me suggèrent une entreprise en difficulté qui n'était pas bien placée pour veiller sur la propriété intellectuelle d'autrui.
Quiconque utilise MySpace comme service de stockage et n'a pas de sauvegarde alternative n'a tout simplement pas de chance. Vous avez laissé votre propriété intellectuelle à côté de l'autoroute de l'information, et quand tu es revenu 10 ans plus tard, c'était parti.
MySpace n'est pas le seul à rencontrer des problèmes. Services cloud Amazon, par exemple, a également connu une panne importante en 2011 et une autre en 2017. Bien que temporaire, et sans perte réelle de données, ces pannes ont laissé les utilisateurs sans accès à des fichiers précieux et importants pendant un certain temps.
Un problème bien plus important
La préservation du contenu ou de la propriété intellectuelle sur Internet constitue une énigme. S'il est accessible, alors ce n'est pas sûr; si c'est sûr, alors il n'est pas accessible.
Le contenu accessible est sujet à falsification, le vol ou d'autres types de mauvaises actions. Seul le contenu inaccessible peut être verrouillé et protégé contre le piratage.
Internet accède actuellement à environ 15 zettaoctets de données, et croît à un rythme de 70 téraoctets par seconde. C'est un navire certes qui fuit, et le contenu est constamment déconnecté pour se retrouver perdu à jamais.
Dans un rapport, Myspace a dit, « Nous nous excusons pour la gêne occasionnée. » Crédit :chrisdorney/shutterstock.com
Des efforts massifs et désespérés sont en cours pour préserver tout ce qui vaut la peine d'être préservé, mais même faire le tri entre ce qui est et ce qui n'est pas est en soi une entreprise formidable. Qu'est-ce qui aura de la valeur dans 10 ans – ou 50 ans ? Et comment le préserver ?
Le papier sans acide peut durer 500 ans; inscriptions en pierre encore plus longues. Mais les supports magnétiques comme les disques durs ont une durée de vie beaucoup plus courte, ne dure que trois à cinq ans. Ils doivent également être copiés et vérifiés sur un cycle de vie très court pour éviter la dégradation des données à des taux de défaillance observés entre 3 % et 8 % par an.
Ensuite, il y a aussi un problème de préservation du logiciel :comment les gens d'aujourd'hui ou de demain peuvent-ils interpréter ces fichiers WordPerfect ou WordStar des années 1980, lorsque les éditeurs de logiciels d'origine ont cessé de les prendre en charge ou ont cessé leurs activités ?
Une startup à but non lucratif appelée The Internet Archive préserve en permanence des instantanés du Web, mais c'est surtout pour les pages Web HTML publiques de haut niveau telles que le site Web du New York Times et Facebook, pas pour les fichiers de contenu sous-jacents. Depuis l'automne dernier, sa Wayback Machine contenait plus de 450 milliards de pages dans 25 pétaoctets de données. Cela représenterait 0,0003 % de l'Internet total.
Les universités, les gouvernements et les sociétés scientifiques luttent pour préserver les données scientifiques dans un méli-mélo d'archives, comme la Digital Preservation Coalition du Royaume-Uni, MétaArchive, ou le réseau collaboratif de préservation numérique désormais dissous. La préservation est difficile et coûteuse en temps, argent et matériel. Pour être le plus utile, il doit non seulement être stocké, mais hébergé sous une forme accessible et disponible pour une réutilisation future.
Coûts de stockage réels inférieurs à 0,05 $ par gigaoctet, mais le stockage ne représente qu'un faible pourcentage des coûts de conservation. Acquisition, la mise en réseau, l'entretien et l'administration nécessitent tous une main-d'œuvre importante et coûteuse.
Les modèles de budgétisation suggèrent une dépense de conservation sur 10 ans d'environ 2,50 $ par gigaoctet, ou 2 $, 500 par téraoctet, ou 625 $, 000 pour les fichiers que MySpace n'a pas réussi à préserver.
Tenir compte de vos propres données
Donc oui, Internet pourrit, mais les archivistes et les bibliothécaires numériques comme moi savaient que c'était déjà pourri, de même que quiconque a déjà eu une erreur "404 File Not Found".
Lorsqu'il existe une incitation économique à conserver et à utiliser des données - telles que les informations des utilisateurs, profils ou historique de navigation - il peut exister assez longtemps. Il a été dit par beaucoup que les données sont le nouveau pétrole, et les entreprises sont impatientes de forer et d'exploiter cette ressource.
Cependant, où le contenu a moins de valeur pour le propriétaire des serveurs, il y a moins d'incitation à investir pour le préserver. Une enquête de 10 millions de visites de 25 sites aléatoires en 2004 suggère que 404 erreurs se produisent à près de 3% des URL ciblées. Internet se développe beaucoup plus vite qu'il ne pourrit, mais les deux choses arrivent à la fois. Aucune entreprise Internet géante n'a vos intérêts plus à cœur que les siens.
Un réseau de préservation est connu sous l'acronyme LOCKSS – Lots of Copies Keeps Stuff Safe – et c'est une bonne règle de base. Ayez toujours une sauvegarde, et toujours avoir plusieurs sauvegardes. Protégez votre vie privée et protégez votre contenu, au moins ce contenu que vous souhaiterez peut-être conserver, comme des photos, e-mail, ce scénario ou ce roman, ou des fichiers vidéo et musicaux. Les règles de droit d'auteur n'interdisent pas le stockage du contenu que vous avez peut-être acheté, tant que vous ne le publiez pas pour un partage public.
Le stockage gratuit est une excellente offre, mais parfois, vous n'obtenez que ce que vous payez. Internet n'est ni sécurisé ni permanent. Il n'a jamais promis d'être, et les utilisateurs ne doivent pas supposer qu'il le deviendra. Les pièces pourrissent, se corrodent et s'effondrent pendant que je tape ceci. Espérons simplement et prévoyez de ne pas vous reposer sur cette plate-forme lorsqu'elle tombera.
Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lire l'article original.