Marquage d'images : y voir un peu plus clair...

Les motivations pour dissimuler de l'information dans une image ou un document peuvent être très variées:
la stéganographie consiste à dissimuler l'existence même d'un message.
le tatouage consiste à insérer une marque permettant de préserver les droits d'auteurs ou de vérifier l'intégrité du document.
Le fingerprinting ou empreinte digitale, permet de remonter la piste d'une utilisation frauduleuse d'un document.

Les techniques dépendent des supports utilisés: image fixe, vidéo, audio...

Sommaire :

  1. Tatouage, stéganographie, fingerprinting
  2. Différents types de documents : images, vidéo, audio, ...

Informations sur le parcours

Titre :
Marquage d'images : y voir un peu plus clair...
Profils :
Décideur économique, Enseignant & Lycéen, Ingénieur informatique, Enseignant-Chercheur, Etudiant
Thème :
Marquage d'image et stéganographie
Finalité :
Théorique
Difficulté :
niveau 1
Auteur(s) :
Caroline Fontaine
Mise à jour :
17/03/2006 à 17h22

 

Tatouage, stéganographie, fingerprinting

Dans une première formalisation, on peut distinguer trois types de dissimulation d'information dans une image ou un document.

La stéganographie vise à dissimuler l'existence même du message transmis. Ainsi, un adversaire ne doit pas pouvoir dire si un medium donné contient un message caché ou non. La problématique a été formalisée dans [3] sous le nom de "problème des prisonniers". Le document porteur n'est pas nécessairement fixé au départ, car il n'a aucune importance ; il peut même être construit spécialement en fonction du message qu'il va dissimuler. Le terme anglais correspondant est steganography.
 
Le tatouage vise à insérer le message dans un document porteur donné. Ce document n'est pas anodin, il a une valeur (marchande, médicale, ...) qu'il faut protéger. En général, on demande au tatouage de ne pas perturber l'utilisation normale du document. Par ailleurs, tous les utilisateurs qui vont accéder au document en auront la même version. Le terme anglais correspondant est watermarking. Dans le contexte de la protection des droits d'auteur, on souhaite que le tatouage reste détectable tant que le document conserve de la valeur, ce qui le rapproche d'un filigrane (on peut penser à l'analogie avec les billets de banque) : on parle alors de tatouage robuste car il doit résister à de nombreux traitements. Dans un autre contexte, si l'on souhaite surveiller l'intégrité du document, on peut souhaiter que ce tatouage disparaisse dès que le document subit des modifications : on parle alors de tatouage fragile, et c'est la présence du filigrane qui garantit l'intégrité.
 
Le fingerprinting est aussi utilisé dans le contexte de la protection des droits d'auteur, mais son objectif est différent. Il dépend en effet de la personne à qui l'on va donner le document (acheteur, utilisateur). Son objectif premier est de permettre de remonter la piste d'un document utilisé de manière frauduleuse. Chaque utilisateur aura ainsi en sa possession une version unique du document.
 

References

[1] B. M. and C. LABIT. Compression et codage des images et des vidéos. Traité IC2 - Information, Commande, Communication. Hermès-Lavoisier, 2002. ISBN 2-7462-0328-6.
[2] W. Pennebaker and J. Mitchell. JPEG Still Image Compression Standard. New York : Van Nostrand Reinhold, 1993.
[3] G. Simmons. The prisoners' problem and the subliminal channel. In Advances in Cryptology - CRYPTO'83, pages 51-67. Plenum Press, 1984.
[4] G. Wallace. The JPEG still picture compression standard. 34(4):30-40, 1991.


Différents types de documents : images, vidéo, audio, ...

Potentiellement, tout document peut être concerné par la dissimulation d'information. Les exemples les plus classiques sont les images fixes (réelles, virtuelles), la vidéo, les documents audio, les programmes informatiques, les parties de jeu en réseau, ...

Nous traitons ici plutôt des documents multimédia (images, vidéo, audio), car ils présentent de nombreuses similitudes et sont tous abordés par des techniques de traitement du signal. Ainsi, si chacun peut faire appel à des outils spécifiques (pour garantir l'imperceptibilité par exemple), les principes des techniques de dissimulation présentent de nombreux points communs.
En revanche, les programmes informatiques sont très différents, et peu de travaux ont abordé leur cas.
On peut également citer des propositions de tatouage de matériels hardware, de molécules chimiques (pétrole pour tracer les dégazages sauvages, parfums pour en attester l'authenticité).
Des références génériques ou plus techniques sont fournies dans les fiches correspondant à chacun de ces aspects. Nous allons plutôt présenter brièvement ici les formats usuels de docmuents multimedia, afin de permettre au lecteur néophite de mieux les comprendre, et de se référer aux standards si besoin.
 

Images fixes

Il existe de nombreuses manières de représenter une image. Considérons le cas général d'une image en couleurs. Chaque pixel (élément de base, point) de l'image peut être représenté par un triplet :
  • soit (R,G,B), où R désigne la quantité de rouge, G celle de vert et B celle de bleu dans la composition de la couleur du pixel. Les valeurs de R, G, B sont comprises entre 0 et une valeur maximale M, généralement égale à 255 (dans ce cas, chaque composante est codée sur un octet). C'est cette représentation qui est utilisée dans le format PPM (Portable PixMap), où la valeur de M est indiquée dans l'en-tête du document ;
  • soit (Y,U,V), où Y désigne la luminance, et U et V contiennent des informations de chrominance, i. e. sur la différence entre la couleur du pixel et un gris de même luminance.
Le passage de (R,G,B) à (Y,U,V) s'effectue par un changement de base orthogonale :





Y
U
V




=



0,299
0,587
0,144
0,596
−0,274
−0,322
0,211
−0,523
0,312




 



R
G
B







L'intérêt de l'utilisation de la représentation (Y,U,V) provient du fait que lorsque l'image est noire (R=G=B=0), blanche (R=G=B=M) ou grise (0 ≤ R=G=B ≤ M), alors on a U=V=0.

JPEG

les standards JPEG (Joint Photographic Experts Group) définissent une norme de compression d'images fixes et sont décrits dans [4,2,1]. Rappellons en quelques mots le principe de l'algorithme de compression. Considérons la représentation (Y,U,V) : la luminance et la chrominance sont traitées séparément. Pour chacune d'entre elles, l'image est découpée en blocs contigus de 8 ×8 pixels, et chacun d'eux subit les opérations suivantes :
  • normalisation (on recadre les valeurs dans un intervalle fixé, par exemple [−127..127]) ;
  • application de la transformée en cosinus discrète ;
  • seuillage (c'est là qu'intervient le choix du taux de compression) ;
  • quantification des coefficients (la transformée en cosinus discrète possède des tables de quantification, distinctes pour la luminance et la chrominance, en fonction des caractéristiques perceptives de l'oeil pour les fréquences spatiales, indiquant la valeur du pas de quantification à appliquer à chaque coefficient ; les hautes fréquences subissent une quantification moins fine que les autres) ;
  • codage des coefficients et séquence zig-zag ;
  • codage de Huffman.
En conséquence, une telle compression implique que
  • la répartition des bits de poids faible des pixels de l'image compressée suit la loi de distribution uniforme ;
  • les hautes fréquences ont été altérées lors de la compression.

JPEG 2000

Ce standard (ISO/IEC 15444-2:2000) est plus récent et repose sur une décomposition multirésolution de l'image utilisant la transformée en ondelettes. Cette compression est plus évoluée et plus performante que celle du standard JPEG. Par ailleurs, d'autres considérations que la compression ont été prises en compte été discutées dans des standards additionnels, comme le tatouage par exemple (JPSEC : secure image transfert). On peut trouver une brève description du procédé de compression en français à l'adresse http://sic.epfl.ch/SA/publications/FI01/fi-3-1/3-1-page1.html.

Vidéo

Les formats de vidéo définis au sein de l'ISO sont principalement la norme MPEG-1 (ISO/IEC 11172) qui permet de transmettre des flux vidéos au format CIF (c'est-à-dire avec une demi-résolution par rapport au foramt télévisuel classique, le CCIR601, tel que défini par la recommandation BT.601-5 de l'ITU-R) et la norme MPEG-2 (ISO/IEC JTC1/SC29) introduite pour les activités de diffusion broadcast télévisuelles [1]. Elles reposent sur un codage hybride : chaque image de la vidéo est codée de façon prédictive par rapport aux images précédentes ; une estimation de mouvement permet de prédire les images futures, en associant à cette prédiction une évaluation de l'erreur commise. Nous ne rentrerons pas plus dans les détails ici, mais il est important de savoir que la vidéo est découpée en groupes d'images, comme illustré ci-dessous.


La première image est codée indépendamment des autres (mode Intra, type I). Les autres images sont ensuite codées à l'aide de seimple prédiction (type P) ou de prédiction bidirectionnelle à partir des images de type I ou P présentes avant ou après (type B).

Audio


La norme connue sous le nom de MPEG-Audio est en fait la partie audio de la norme internationale ISO/CEI 11172. Il s'agit d'un codeur perceptuel que nous ne détaillerons pas ici, mais qui est globalement composé de trois modules : une transformation temps/fréquence réalisée par des bancs de filtres d'analyse et de synthèse ou par une transformée ; un module s'appuyant sur un modèle d'audition et estimant un seuil de masquage ; enfin, un module réalisant l'allocation de bits et la quantification.
Le format AAC correspond, lui, à la norme MPEG-2 advanced audio coding définie par ISO/IEC 13818-7.

References

[1] B. M. and C. LABIT. Compression et codage des images et des vidéos. Traité IC2 - Information, Commande, Communication. Hermès-Lavoisier, 2002. ISBN 2-7462-0328-6.
[2] W. Pennebaker and J. Mitchell. JPEG Still Image Compression Standard. New York : Van Nostrand Reinhold, 1993.
[3] G. Simmons. The prisoners' problem and the subliminal channel. In Advances in Cryptology - CRYPTO'83, pages 51-67. Plenum Press, 1984.
[4] G. Wallace. The JPEG still picture compression standard. 34(4):30-40, 1991.