Informations sur le parcours

Titre :
Initiation au marquage d'image
Profils :
Décideur économique, Enseignant & Lycéen, Ingénieur informatique, Enseignant-Chercheur, Etudiant
Thème :
Marquage d'image et stéganographie
Finalité :
Pratique
Difficulté :
niveau 1
Auteur(s) :
Caroline Fontaine
Mise à jour :
17/03/2006 à 17h22

 

Mais qu'est-ce que tatouer ?

La procédure de tatouage est synthétisée dans la figure 1, et celle de détection/extraction dans la figure 2. La détection/extraction s'opère sur un document qui a pu être modifié, dans un but de piratage, ou tout simplement pour faciliter son utilisation (compression).



Figure 1: Tatouage
 
Lors de l'insertion, le signal original (image fixe, vidéo, fichier audio) est transformé en un signal/vecteur équivalent, par le biais d'une bijection (identité si l'on souhaite rester dans le domaine d'origine, ou encore transformée de Fourier, en cosinus, ondelettes, ...). Le vecteur x ainsi obtenu va être mélangé au signal de tatouage w pour donner le vecteur tatoué y, qui, par la transformée inverse, donnera le document tatoué. Le signal de tatouage w est quant à lui obtenu à partir du message m que l'on souhaite cacher, et d'une clé k. Une fois tatoué, le document est diffusé.


Figure 2: Détection/extraction
 
Lorsque l'on récupère un document et que l'on souhaite savoir s'il a été tatoué ou non, ou quel message il contient, on applique la procédure de détection/extraction. On parle plutôt de détection lorsque l'on souhaite simplement savoir si le document est tatoué ou non ; la réponse est donc binaire, et obtenue par rapport à une clé k′ donnée : si la réponse est "oui ", alors c'est que le document a été tatoué avec cette clé k′ (et donc par extension par le propriétaire de celle-ci). Certains schémas permettent d'obtenir plus d'information, en donnant une réponse de plusieurs bits, soit le message caché m (par exemple un numéro ISBN) ; on parle alors plutôt d'extraction. La réponse est ici encore liée à la clé k′ utilisée.
 
Imperceptibilité ?  
Nous nous intéressons ici aux schémas assurant l'insetion d'un signal de tatouage de manière imperceptible. Ceci signifie que, d'une part, le signal ne perturbera pas l'utilisation du document (ne se verra pas, ne s'entendra pas, ...), mais également qu'il ne sera pas trop aisément détectable par une analyse statistique du signal tatoué. L'imperceptibilité visuelle ou auditive est contrôlée à l'aide de modèles psycho visuels/acoustiques. Ainsi, on s'assure au moment de l'insertion-même du tatouage qu'il est bien imperceptible et, au besoin, on en atténue l'intensité par endroits si cela s'avère nécessaire.
 
Aveugle ou non aveugle ? 
On peut également remarquer que le processus de détection/extraction peut ou non nécessiter la présence du document original. On dira qu'un schéma est aveugle s'il ne requiert pas la présence du document original. Les procédés non aveugles donnent de meilleurs résultats, mais ne peuvent être utilisés que dans des contextes particuliers.
 
Symétrique, asymétrique ?  
Enfin, notons que si les clé k et k′ sont toutes deux secrètes et identiques, on parlera de schéma symétrique, et que dans le cas contraire on parlera de schéma asymétrique. Le cas des schémas de tatouage asymétriques rappelle celui de la signature numérique : le propriétaire du document le taoutera avec une clé privée, et l'extraction pourra être effectuée par tous à l'aide d'une clé publique.
 
Robuste, fragile ? 
Les processus de tatouage sont assez variés, et donnent par conséquent des résultats assez différents, adaptés à des contextes applicatifs propres. En effet, dans certaines circonstances comme la protection du droit d'auteur, ou l'authentification, on souhaitera que le tatouage soit robuste, c'est-à-dire qu'il perdure même si le document a subi des transformation, ou plus exactement on souhaitera dans ce cas que tant que le document conserve une valeur marchande, il contienne l'information de tatouage. Dans d'autres cas, on peut souhaiter que moindre transformation du document tatoué fasse "sauter "  la marque, et ce afin de détecter la perte d'intégrité du document ; on parlera alors de tatouage fragile. Enfin, on peut souhaiter une situation intermédiaire, dans laquelle la marque va perdurer pour certaines transformations, et non pour d'autres ; on parle alors de tatouage semi-fragile.
 
Tatouage informé. 
Des études menées en théorie de l'information [5] montrent que l'on peut tirer tout le parti possible de la connaissance a priori de la réalisation du signal que l'on souhaite tatouer lors de la phase d'insertion ; à condition que cette connaissance soit disponible lors de l'extraction. Cela parait peut-être naturel, formulé en français, mais ce résultat est particulièrement important puisqu'il a donné lieu à une nouvelle génération de schémas de tatouage dits informés, plus efficaces que les leurs prédécesseurs. Ce type de schémas n'a de sens que dans le cadre d'un tatouage aveugle, bien entendu.


Des ouvrages généraux sur le tatouage sont [7,10,6,9,11,8,1,2,4,3].

References

[1] Techniques and Applications of Digital Watermarking and Content Protection. Artech House Publishers, 2003. ISBN 1580531113.
[2] Data Hiding Fundamentals And Applications. Elsevier, 2004. ISBN 0-12-047144-2.
[3] Multimedia Security: Steganography and Digital Watermarking Techniques for Protection of Intellectual Property. Idea Group Publishing, 2004. ISBN 1591401925.
[4] Watermarking Systems Engineering: Enabling Digital Assets Security and Other Applications. Marcel Dekker, 2004. ISBN 0824748069.
[5] M. Costa. Writing on dirty papers. IEEE Transactions on Information Theory, 29(3), 1983.
[6] I. Cox, M. Miller, and J. Bloom. Digital watermarking. Morgan Kaufmann Publishers, 2001. ISBN 1-55860-714-5.
[7] F. Davoine and S. Pateux, editors. Tatouage de documents audiovisuels numériques. Traité IC2 - Information, Commande, Communication. Hermès-Lavoisier, 2004. ISBN 2-7462-0816-4.
[8] J. Eggers and B. Girod. Informed Watermarking. Kluwer Academic Publishers, 2002. ISBN 1-4020-7071-3.
[9] N. Johnson, Z. Duric, and S. Jajodia. Information Hiding : Steganography and Watermarking - Attacks and Countermeasures. Kluwer Academic Publishers, 2001. ISBN 0792372042.
[10] S. Katzenbeisser and F. Petitcolas. Information hiding techniques for steganography and digital watermarking. Artech House Publishers, 1999. ISBN 1-58053-035-4.
[11] P. Wayner. Disappearing Cryptography - Information hiding: steganography and watermarking. Moragn Kaufmann Publishers, 2002. ISBN 1-55860-769-2.


Introduction au tatouage robuste

Les algorithmes de tatouage permettant d'insérer un filigrane robuste sont les plus nombreux. Ceci est principalement dû au fait que pendant très longtemps les recherches se sont focalisées sur le contexte de la protection des droits d'auteur, qui requiérait la robustesse. Toute la question est alors de savoir à quoi l'on souhaite que le tatouage résiste : autrement dit, quelles transformations vont conserver au document tatoué une valeur marchande ? Car l'idée est bien ici que le document est considéré comme protégé si l'on est capables de retrouver le filigrane qu'il contient (et qui atteste de l'identité de son propriétaire).

On peut proposer de nombreuses classifications pour ces manipulations, prenant en compte leur nature intrinsèque ou encore l'intention qu'elles révèlent ; en effet, un utilisateur peut appliquer un algorithme de compression pour des raisons tout à fait honnêtes (gain de place), comme il peut le faire pour des raisons malhonnêtes (afin d'altérer le filigrane). Nous faisons le choix ici de nous appuyer sur la nature de ces transformations, plutôt que sur l'intention de l'utilisateur. Voici donc une liste (non exhaustive) de manipulations.
 
Compression.  
Une compression sans perte n'altérera bien entendu pas le filigrane, mais il est plus probable que la compression soit réalisée afin de gagner de l'espace de stockage et, dans ce cas, il y aura perte d'information. Une technique de compression avec perte efficace cherche à simplifier le codage du document, en supprimant l'information peu significative ; comme le filigrane est impercetpible, il est naturellement consiféré comme peu significatif, et sera donc naturellement altéré lors de la compression. Si l'on souhaite insérer un filigrane robuste à la compression, il faut donc tirer parti des imperfections de ces techniques pour concevoir des algorithmes de tatouage adaptés.
 
Rehaussement (resp. lissage) (images fixes et vidéo). 
Ceci correspond à l'augmentation (resp. la diminution) des composantes hautes fréquences.
 
Transformation géométriques (images fixes et vidéo). 
Modification des dimensions de l'image, rotation, extraction de portions de l'image. Ce genre de transformation a pour effet de désynchrnoiser le signal de tatouage, ce qui rend impossible la détection de sa présence.
 
Conversions analogique-numérique.  
Impression suivie d'un scan, film réalisé à l'aide d'un camescope dans une salle de cinéma, musique ré-enregistrée ... Ce processus entraîne en général une désynchronisation du signal de tatouage, ainsi que de petites distorsions.
 
Transformations valumétriques (images fixes et vidéo).  
Étalement d'histogramme, égalisation d'histogramme, transformation Gamma.
 
Débruitage.  
L'objectif de cette manipulation est d'approcher au mieux la forme d'onde du filigrane, pour pouvoir l'enlever [2,3].
 
Gigue (ou Jittering).  
Ce phéomène est connu en télécommunications lorsque le délai de transmission du signal varie. Il en résulte une duplication, ou une suppression, de morceaux de signaux. Ceci peut se traduire ici dans le domaine temporel ou dans le domaine spatial (par exemple ajout ou suppression de lignes/colonnes dans une image). Le document ne semble par vraiment altéré, d'un point de vue perceptif, mais le signal de tatouage est désynchronisé.
 
Attaque par mosaïques.  
Son principe est simple : le signal tatoué est découpé en plusieurs morceaux, qui sont ensuite juxtaposés. Dans le cas d'une image fixe, par exemple, on peut donc aisément la regarder sans s'apercevoir de la manipulation, mais le tatouage est totalement désynchronisé si sa détection est automatisée. Si la détection peut se faire manuellement, on peut recoller les morceaux avant de l'effectuer.
 
Stirmark.  
Le logiciel Stirmark et ses variantes proposent un banc de tests permettant d'apprécier la robustesse du filigrane. Voir le paragraphe " évaluation "  de la fiche "Dissimulation d'information et sécurité ".

On distinguera donc par la suite les distorsions synchrones (i.e. qui ne modifient pas la position spatiale ou temporelle du signal : compression, lissage, ajout de bruit, ...) des distorsions asynchrones (i.e. qui modifient la position spatiale ou temporelle du signal, et introduisent donc une désynchronisation : transformations géométriques, gigue, ...).

Par ailleurs, il est illusoire de présenter toutes les techniques publiées sur le sujet, dans leurs moindres détails. Nous avons choisi ici de mentionner les plus importantes, et d'expliquer leur approche. Les détails peuvent être obtenus à la lecture des articles cités en références. L'idée générale sur laquelle reposent toutes ces techniques est que l'on va introduire une certaine structure dans le document, qui est fortement liée à la clé utilisée. La présence de cette structure (détectable uniquement à l'aide de la bonne clé) sera la garantie de la présence du filigrane. Notons que sauf mentions contraires, les techniques présentées sont comprises comme symétriques et aveugles.

References

[2] M. Kutter, S. Voloshynovskiy, and A. Herrigel. Watermark copy attack. In Proc. SPIE, Security and Watermarking of Multimedia Contents II, volume 3971. SPIE, 2000.
[3] S. Voloshynovskiy, S. Pereira, A. Herrigel, N. Baumgärtner, and T. Pun. Generalized watermark attack based on watermark estimation and perceptual remodulation. In Proc. SPIE, Security and Watermarking of Multimedia Contents II, volume 3971, pages 358-370. SPIE, 2000.


Introduction au tatouage fragile

On utilise un tatouage fragile lorsque l'on souhaite pouvoir détecter si le document a subi des transformations, et plus spécifiquement si son intégrité a été préservée, d'un point de vue perceptif. On pourrait être tenté d'utiliser pour cela des fonctions de hachage cryptographiques, mais celles-ci s'avèrent mal adaptées, car on souhaite ici préserver non pas l'intégrité numérique, mais l'intégrité perceptive.
 
Les domaines d'application sont par exemple les photos d'identité (cartes d'identité, passeport, permis de conduire), les images médicales (scanner, IRM, ...) ou encore militaires.
 
Le tatouage fragile est dit évolué lorsque la dégradation provoquée par la compression, une transformation géométrique ou encore un filtrage, n'altère par le tatouage, mais que l'ajout ou l'effacement d'un objet l'altèrent suffisamment pour être détectés.
 
En effet, selon le contexte applicatif, on peut souhaiter soit détecter tout type de modification, soit un ensemble donné de transformations (interdites). On peut par exemple autoriser certains taux de compression, des changement d'échelle, ... Dans le premier cas, on utilisera des techniques de tatouage fragile (le tatouage disparaît à la moindre manipulation), et dans le deuxième des méthodes de tatouage semi-fragile (le tatouage résiste aux manipulations autorisées). On parlera de tatouage semi-robuste lorsque l'information cachée contient des descriptions de propriétés importantes du document, comme par exemple les contours des éléments essentiels d'une image.
 
Le principe est donc que si on arrive à détecter le tatouage, c'est que le document peut être considéré comme intègre.


Introduction au Fingerprinting

On utilise un fingerprint lorsque l'on souhaite pouvoir tracer le document diffusé, et plus spécifiquement identifier son utilisateur légitime. Ainsi, la marque insérée dans le document va dépendre de l'utilisateur de celui-ci, et il y aura autant de versions différentes d'un même document qu'il aura d'utilisateurs légitimes.

 
Les techniques de dissimulations sont sensiblement les mêmes que pour le tatouage robuste. Cependant, les données à insérer doivent vérifier certaines propriétés pour résister aux attaques spécifiques, dites par collusion.

Spécificité : les attaques par collusion

 
Le principe d'une attaque par collusion est très simple : plusieurs utilisateurs légitimes comparent les versions qu'ils ont reçues d'un même document/ Comme nous l'avons dit plus haute, ces versions sont ici toutes différentes. Il leur est alors facile de détecter les "points" auxquels les documents diffèrent, et de produire un nouveau document obtenu en gardant les "points" identiques, et en choisissant pour les "points" différents des éléments de chacun des documents de départ. Ainsi, ils sont certains que d'un point de vue perceptif le nouveau document sera semblable aux autres, et la détection du nouveau fingerprint ainsi forgé n'aura aucune signification pour le distributeur qui peut essayer de tracer le document. Cette attaque est résumée dans la figure 1.



Figure 1: Illustration de l'attaque par collusion avec deux documents
 
Comment se protéger contre une telle attaque ? En utilisant des données présentant des structures combinatoires fortes, assurant que dans une coalition de n pirates, au moins un (ou deux, ...) sera identifié. Plusieurs études sont menées dans cette voie, principalement par des mathématiciens. Elles ont débouché sur la définition de codes (correcteurs) tels que si on prend plusieurs mots de codes et qu'on applique une attaque par collusion sur les composantes de ces mots, alors on peut à partir du mot ainsi obtenu, dit mot " enfant ", remonter à au moins un des mots de codes de départs, dits mots " parents ".
 


Introduction à la stéganographie

Par définition, la stéganographie vise à transmettre un message en le cachant dans un document-support, appelé stégo-document, et ce de manière indécelable pour toute personne non autorisée à accéder au message. On peut envisager différents contextes d'utilisation, mais un exemple classique résume parfaitement les caractéristiaues et propriétés souhaitées : il s'agit du problème des prisonniers, présenté dans [4]. Deux prisonniers, Alice et Bob, sont enfermés chacun dans une cellule, et souhaitent élaborer ensemble un plan d'évasion ; ils sont autorisés à communiquer, mais doivent confier les messages qu'ils s'écrivent au gardien, qui les lit et vérifie qu'ils ne contiennent rien d'illicite (en particulier pas de plan d'évasion). Alice et Bob doivent alors utiliser des moyens stéganographiques pour communiquer sans se faire prendre.
 

On suppose en général en stéganographie que le gardien est un adversaire passif, c'est-à-dire qu'elle se contente de lire les messages et de décider de les transmettre ou non. Mais on peut dans certains cas considérer un adversaire actif, qui va pouvoir modifier les messages avant de les délivrer.
Des articles simples à lire en français sont [3,1,2].

References

[1] F. Galand. Traité de sécurité des systèmes d'information, Techniques de l'ingénieur, chapter Stéganographie, Ch. H 5870. 2004.
[2] G. Le Guelvouit and T. Furon. La stéganographie moderne. M.I.S.C., le magazine de la sécurité informatique, mars 2005.
[3] F. Raynal, F. Petitcolas, and C. Fontaine. Introduction à la stéganographie. M.I.S.C., le magazine de la sécurité informatique, janvier 2002.
[4] G. Simmons. The prisoners' problem and the subliminal channel. In Advances in Cryptology - CRYPTO'83, pages 51-67. Plenum Press, 1984.