Nouvelles Du Monde

Les ingénieurs de Facebook ne savent pas où ils conservent vos données

Les ingénieurs de Facebook ne savent pas où ils conservent vos données

En mars, deux ingénieurs vétérans de Facebook se sont retrouvés interrogés sur les opérations tentaculaires de collecte de données de l’entreprise lors d’une audience pour le procès en cours concernant la mauvaise gestion des informations des utilisateurs privés résultant de la Scandale de Cambridge Analytica.

L’audience, dont une transcription a été récemment descellée, visait à résoudre un problème crucial : quelles informations, précisément, Facebook stocke-t-il à notre sujet, et où se trouvent-elles ? La réponse des ingénieurs ne sera que peu de soulagement pour ceux qui sont concernés par la gestion par l’entreprise de milliards de vies numérisées : ils ne savent pas.

Les aveux ont eu lieu lors d’une audience avec le maître spécial Daniel Garrie, un expert en la matière nommé par le tribunal chargé de résoudre une impasse de divulgation. Garrie tentait d’amener l’entreprise à fournir une comptabilité exhaustive et définitive de l’endroit où les données personnelles pourraient être stockées dans quelque 55 sous-systèmes Facebook. Les deux ingénieurs vétérans de Facebook, avec selon LinkedIn deux décennies d’expérience entre eux, ont eu du mal à même oser ce qui pourrait être stocké dans les sous-systèmes de Facebook. “J’essaie juste de comprendre au niveau le plus élémentaire à partir de cette liste ce que nous examinons”, a demandé Garrie.

“Je ne crois pas qu’il existe une seule personne qui puisse répondre à cette question”, a répondu Eugene Zarashaw, directeur technique de Facebook. “Il faudrait un effort d’équipe important pour même être en mesure de répondre à cette question.” (Facebook n’a pas répondu à une demande de commentaire.)

Lorsqu’on lui a demandé comment Facebook pourrait retrouver chaque bit de données associé à un compte d’utilisateur donné, Zarashaw a de nouveau été perplexe: «Il faudrait plusieurs équipes du côté de la publicité pour retrouver exactement où – où les données circulent. Je serais surpris qu’il y ait ne serait-ce qu’une seule personne qui puisse répondre de manière concluante à cette question étroite.

Lire aussi  En collaboration avec Nicholas Saputra, Brother Hope a réalisé un court métrage sympa pour discuter des spécifications de l'Oppo Find X5 Pro 5G

Le différend sur où Facebook stocke des données est survenue lorsque, dans le cadre du litige, maintenant dans sa quatrième année, le tribunal a ordonné à Facebook de remettre les informations qu’il avait recueillies sur les plaignants du procès. La société s’est conformée, mais a fourni des données constituées principalement de matériel que tout utilisateur pouvait obtenir via l’outil « Télécharger vos informations » accessible au public de la société.

Facebook a soutenu que toutes les données non incluses dans cet ensemble n’entraient pas dans le cadre du procès, ignorant les vastes quantités d’informations que l’entreprise génère par le biais d’inférences, de partenariats extérieurs et d’autres analyses non publiques de nos habitudes – des parties du fonctionnement interne du site de médias sociaux qui sont obscurs pour les consommateurs. En bref, ce que nous appelons “Facebook” est en fait un ensemble de programmes spécialisés qui fonctionnent ensemble lorsque nous téléchargeons des vidéos, partageons des photos ou sommes ciblés par des publicités. Le réseau social voulait garder le stockage des données dans ces parties non-consommatrices de Facebook hors cour.

En 2020, le juge n’était pas d’accord avec l’affirmation de l’entreprise, jugeant que la divulgation initiale de Facebook avait en effet été trop clairsemée et que l’entreprise devait révéler les données obtenues grâce à sa capacité océanique à surveiller les gens sur Internet et à faire des prédictions monétisables sur leurs prochains mouvements.

L’obstruction de Facebook s’est révélée à elle seule, offrant des variations sur le même thème : il a amassé tellement de données sur tant de milliards de personnes et les a organisées de manière si confuse qu’une transparence totale est impossible sur le plan technique. Lors de l’audience de mars 2022, Zarashaw et Steven Elia, un responsable de l’ingénierie logicielle, ont décrit Facebook comme un appareil de traitement de données si complexe qu’il défie toute compréhension de l’intérieur. L’audience s’est élevée à deux ingénieurs de haut rang de l’une des équipes d’ingénierie les plus puissantes et les plus riches en ressources de l’histoire, décrivant leur produit comme une machine inconnaissable.

Lire aussi  Olivier Véran estime qu'"échanger avec les Français, c'est jamais compliqué"

Le maître spécial semblait parfois incrédule, comme lorsqu’il a demandé aux ingénieurs s’il existait une documentation pour un sous-système Facebook particulier. “Quelqu’un doit avoir un diagramme indiquant que c’est là que ces données sont stockées”, a-t-il déclaré, selon la transcription. Zarashaw a répondu : « Nous avons une culture d’ingénierie quelque peu étrange par rapport à la plupart où nous ne générons pas beaucoup d’artefacts pendant le processus d’ingénierie. En fait, le code est souvent son propre document de conception. » Il a rapidement ajouté: “Pour ce que ça vaut, c’est aussi terrifiant pour moi quand j’ai rejoint pour la première fois.”

Les remarques dans l’audience fait écho à celles trouvées dans un document interne fuite vers la carte mère plus tôt cette année, détaillant comment le dysfonctionnement de l’ingénierie interne chez Meta, qui possède Facebook et Instagram, rend impossible la conformité aux lois sur la confidentialité des données. “Nous n’avons pas un niveau adéquat de contrôle et d’explicabilité sur la façon dont nos systèmes utilisent les données, et nous ne pouvons donc pas apporter en toute confiance des changements de politique contrôlés ou des engagements externes tels que” nous n’utiliserons pas les données X à des fins Y “”, le 2021 document lu.

Le problème fondamental, selon les ingénieurs présents à l’audience, est que l’étalement de Facebook a rendu impossible de savoir plus en quoi il consiste ; l’entreprise n’a jamais pris la peine de cultiver des connaissances institutionnelles sur le fonctionnement de chacun de ces systèmes composants, ce qu’ils font ou qui les utilise. Il n’y a aucune documentation sur ce qu’il advient de vos données une fois qu’elles sont téléchargées, car cela n’a jamais été quelque chose que l’entreprise fait, ont expliqué les deux. “Il est rare qu’il existe des artefacts et des diagrammes sur la manière dont ces systèmes sont ensuite utilisés et sur les données qui les traversent réellement”, a expliqué Zarashaw.

Lire aussi  InnoGames partage le salaire des travailleurs du jeu par souci de transparence

“Il est rare qu’il existe des artefacts et des diagrammes sur la façon dont ces systèmes sont ensuite utilisés et sur les données qui les traversent réellement.”

L’incapacité de Facebook à appréhender son propre fonctionnement a poussé l’audience à la limite de la métaphysique. À un moment donné, le maître spécial nommé par le tribunal a noté que le fichier “Téléchargez vos informations” fourni aux plaignants de la poursuite ne devait pas inclure tout ce que la société avait stocké sur ces personnes, car il semble n’avoir aucune idée de ce qu’il stocke réellement sur quiconque. Se peut-il que l’outil désigné par Facebook pour le téléchargement complet de vos informations ne télécharge pas réellement toutes vos informations ? Ceci, encore une fois, est en dehors des frontières de la connaissance.

“La solution à cela est malheureusement exactement le travail qui a été fait pour créer le fichier DYI lui-même”, a noté Zarashaw. “Et la chose avec laquelle je me bats ici est que pour trouver des lacunes dans ce qui ne se trouve peut-être pas dans le fichier DYI, vous auriez par définition besoin de faire encore plus de travail que ce qui a été fait pour générer les fichiers DYI en premier lieu.”

Le brouillard systémique du stockage de données de Facebook a rendu futile la réponse à la question la plus élémentaire. À un autre moment, le maître spécial a demandé comment on pouvait savoir quels systèmes contiennent réellement des données utilisateur créées par inférence machine.

« Je ne sais pas », répondit Zarashaw. “C’est une énigme assez difficile.”

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT