Confidentialité des métadonnées EXIF : une image vaut mille points de données
Lorsque vous prenez une photo numérique avec votre appareil photo ou votre téléphone, celui-ci stocke bien plus que les pixels et les couleurs qui composent l'image. Chaque fichier image contient également des métadonnées, qui incluent des détails allant de la date de création et des informations sur les droits d'auteur jusqu'à l'endroit où la photo a été prise.
Il en va de même pour les images modifiées avec de nombreux programmes de retouche photo. Les programmes d'édition d'images ajoutent souvent des métadonnées aux images, notamment des horodatages de modification, des informations système et le suivi des modifications.
Les métadonnées peuvent constituer une menace à la vie privée des personnes qui partagent et publient des photos en ligne. Bien que certains réseaux sociaux et sites de stockage et de partage de photos suppriment les métadonnées des photos téléchargées, beaucoup n'y parviennent pas, affirment les chercheurs de Comparitech, ce qui pourrait permettre aux attaquants de recueillir des informations personnelles à partir d'images publiées en ligne. Par exemple, si quelqu’un publie une photo de vacances avec des coordonnées GPS et un horodatage dans les métadonnées, un attaquant pourrait facilement trouver quand et où il a voyagé.
Les métadonnées peuvent être classées en trois grandes catégories :
- Les métadonnées du système sont générées lorsque l'image est stockée (c'est-à-dire lorsqu'une photo est prise ou que les modifications sont enregistrées). Il comprend des critères spécifiques, tels que la date et l'heure de création de l'image et des détails sur l'appareil photo et/ou le logiciel d'édition utilisé.
- Les métadonnées substantielles incluent le contenu du fichier réel, tel que le suivi des modifications apportées à une image modifiée.
- Les métadonnées intégrées incluent des données saisies dans un document qui ne sont normalement pas visibles, telles que des formules dans une feuille de calcul Excel.
Les métadonnées d'image peuvent être intégrées en interne dans des formats de fichiers image courants tels que JPEG et PNG. Ces données d'image sont généralement stockées au format Exif (format de fichier image échangeable). Mais il peut également exister en dehors du fichier image dans un système de gestion des actifs numériques (DAM). Ceux-ci sont parfois appelés fichiers « side-car » et sont souvent stockés au format XMP.
Les métadonnées ont trois grands cas d’utilisation :
- Décrire le contenu du fichier, y compris les mots-clés, les noms des personnes photographiées et les coordonnées de localisation
- Les informations sur les droits d'auteur incluent l'attribution du créateur, les restrictions de licence, les crédits et les conditions d'utilisation.
- Les données administratives peuvent inclure la date de création, la date de modification, l'emplacement et d'autres métadonnées du système mentionnées ci-dessus.
Quels services de partage d’images nettoient les métadonnées et lesquels ne le font pas ?
Les chercheurs de Comparitech ont analysé les pratiques de nettoyage des métadonnées de 12 services populaires de stockage et de partage d’images en ligne. Ils ont téléchargé une image de la Joconde chargée de métadonnées sur chacun des services. Après le téléchargement, ils ont ensuite téléchargé l'image depuis chaque service respectif pour voir si les métadonnées restaient intactes ou non.
Commençons par les endroits les plus populaires pour partager des images sur le Web.Imgur, Facebook et Instagram nettoient tous toutes les métadonnéesà partir de photos lors du téléchargement. Vous n’avez pas à vous soucier des fuites de métadonnées lors du téléchargement d’images sur ces sites. Gardez toutefois à l’esprit que même si les utilisateurs de ces sites n’ont pas accès aux métadonnées, les sites eux-mêmes y ont accès.
Flickr conserve toutes les données de métadonnées originaleset en affiche même une grande partie sur la page Web de chaque photo.
photobox.frbalise les photos dans la section des commentaires sur les métadonnées pour indiquer que les images téléchargées sont compressées. Le reste des métadonnées est intact. C'était le seul service qui ajoutait ou modifiait réellement des données.
Les autres services de partage et de stockage d’images que nous avons examinés n’ont supprimé ni modifié aucune métadonnée, à l’exception des horodatages « date de modification » :
- pastelboard.com
- turbomoimagehost.com
- lienimage.com
- 8upload.com
- imgpile.com
- postimages.org
- imgbb.com
- imageupload.io
- Gifyu
Si vous ne souhaitez pas exposer les métadonnées EXIF sur ces sites, vous devrez préalablement nettoyer les images. Plus d’informations sur la façon de procéder ci-dessous.
Comment vous pouvez être suivi à l'aide des métadonnées EXIF : exemples de recherche
Les chercheurs de Comparitech ont prouvé la sensibilité des métadonnées d'images en utilisant des images accessibles au public pour retrouver les sujets et les créateurs des images. (Remarque : nous avons nettoyé toutes les images suivantes de leurs métadonnées d'origine).
Commençons par un exemple simple. En utilisant les métadonnées GPS de la photo ci-dessus, nous avons déterminé qu'elle avait été prise près de Sørstranda, en Norvège.
Le sujet suivant était une photo du visage d’un homme. En utilisant les métadonnées de l'image, la recherche d'image inversée et un peu d'intelligence open source (OSINT), les chercheurs ont pu l'identifier comme un ancien participant à un jeu télévisé. Ils ont trouvé son pays, sa date de naissance, la date de son mariage, le nom de son conjoint, son profil Facebook, son compte Twitter, sa page LinkedIn, son compte Instagram, son expérience professionnelle, ses compétences, sa formation et ses intérêts. Les chercheurs ont également pu identifier et trouver des informations sur les coéquipiers du sujet dans le jeu télévisé.
Un autre sujet était une photo de type passeport montrant un homme portant ce qui semble être un treillis militaire. Les chercheurs ont pu retrouver l’image sur un site contenant des photos de l’obtention du diplôme scolaire du sujet. À l’aide du nom de l’école et de la galerie de remise des diplômes, les chercheurs ont récupéré les noms de tous les membres de sa promotion. Une fois les possibilités réduites, ils ont trouvé un homme dont le nom était similaire à celui du fichier image. Les chercheurs ont ensuite découvert les profils Facebook et Instagram de l’homme. En utilisant ces images, ils ont découvert qu’il était bien un soldat. Ils ont appris sa division et sa brigade, ainsi que des informations sur ses plus proches parents.
Enfin, les chercheurs ont identifié une ressortissante philippine à l’aide d’une photo d’elle publiée sur un site de partage d’images. Le sujet tient une pièce d’identité avec photo. Ces photos sont souvent utilisées pour vérifier l’identité du sujet auprès d’un service numérique, tel qu’une banque en ligne. Les chercheurs ont pu connaître le pays du sujet, sa date de naissance, son poids, sa taille, son groupe sanguin, son adresse, son profil Facebook, son emploi, sa formation, le fait qu'elle a récemment eu le Covid-19 et sa chaîne Youtube.
Métadonnées utilisées comme preuve judiciaire
Les métadonnées provenant d’images et d’autres fichiers ont été utilisées comme preuve dans les tribunaux et dans les enquêtes policières, démontrant ainsi la valeur des métadonnées du point de vue de la vie privée. Voici quelques exemples marquants :
- En 2016, deux étudiants de Harvard ont utilisé les coordonnées GPS stockées dans les métadonnées de photos publiées sur le dark web pour identifier des trafiquants de drogue. 229 trafiquants de drogue . Les trafiquants de drogue du Dark Web publient souvent des images de leurs produits en ligne pour prouver leur crédibilité, mais ils oublient souvent de nettoyer les données EXIF au préalable.
- En 2017, un employé des Laboratoires Bio-Rad a déposé une plainte contre son employeur alléguant qu'il avait été licencié pour avoir informé les autorités d'une éventuelle corruption en Chine. Une évaluation des performances avec un horodatage de métadonnées daté après son licenciement a servi de preuve dans l'affaire, ce qui a donné lieu à une indemnité plus élevée pour violation des lois interdisant le licenciement des lanceurs d'alerte. Il s’agit du plus gros dédommagement lié aux métadonnées à ce jour, avec 10,8 millions de dollars de dommages et intérêts.
- En 2015, un juge a rejeté une affaire dans lequel une femme accusait son conjoint de violence physique. Le plaignant a fourni plusieurs photos comme preuve d'abus, mais les métadonnées indiquaient la date à laquelle l'épouse avait affirmé que les abus avaient eu lieu trois mois après la prise des photos.
- La société de criminalistique numérique Legility a publié un étude de cas (PDF) décrivant un procès sur lequel il a enquêté. Dans cette affaire, une entreprise de soins de santé a acquis une autre entreprise. Les employés de l’entreprise d’origine sont partis créer leur propre entreprise. La société désormais acquise a poursuivi la nouvelle société, alléguant qu'elle avait débauché des employés et volé des secrets commerciaux et des documents exclusifs, notamment des listes de clients. En utilisant les métadonnées de ces documents comme preuve du moment où les documents ont été copiés et transférés, la société acquise a été récompensée de 7 millions de dollars (5,1 millions de livres sterling du PIB).
Comment supprimer les métadonnées des images
Les appareils photo et les applications d'appareil photo varient considérablement, mais beaucoup d'entre eux disposent d'une option permettant de désactiver ou de limiter la génération de métadonnées. Vérifiez les paramètres de votre appareil photo ou de votre application.
La plupart des appareils photo et des programmes d'édition d'images stockent les métadonnées des images au format EXIF. Vous pourrez peut-être modifier les données EXIF lors de la sortie des images via votre appareil photo ou votre application de retouche photo.
Certains programmes sont spécialement conçus pour fonctionner avec des métadonnées. ExifTool et Épurateur d'images sont deux excellentes options open source.
Windows 10 est livré avec une option intégrée pour supprimer les métadonnées. Cependant, cela supprimera uniquement les métadonnées comprises par Windows 10, ce qui signifie qu'il pourrait laisser certaines métadonnées derrière lui. Néanmoins, cela devrait au moins contribuer à minimiser les informations stockées dans les images. Si vous êtes un utilisateur de PC, suivez simplement ces étapes :
- Cliquez avec le bouton droit sur le fichier image et sélectionnezPropriétéspour ouvrir une nouvelle fenêtre
- Clique leDétailsonglet en haut
- Cliquez sur le lien qui ditSupprimer les propriétés et les informations personnellesau fond. Une autre nouvelle fenêtre apparaîtra.
- Dans leSupprimer les propriétésfenêtre, sélectionnezSupprimez les propriétés suivantes de ce fichier :
- Cliquez surTout sélectionner, alorsD'ACCORD