Tatouage robuste

Dans le contexte de la protection des droits d'auteur, on souhaite que le tatouage reste détectable tant que le document conserve de la valeur: on parle alors de tatouage robuste car il doit résister à de nombreux traitements.

Sommaire :

  1. Introduction au tatouage robuste
  2. Tatouage robuste : Image fixe
  3. Tatouage robuste : Video
  4. Tatouage robuste : Audio
  5. Tatouage robuste : Textes, programmes

Informations sur le parcours

Titre :
Tatouage robuste
Profils :
Enseignant & Lycéen, Ingénieur informatique, Enseignant-Chercheur, Etudiant
Thème :
Marquage d'image et stéganographie
Finalité :
Pédagogique
Difficulté :
niveau 2
Auteur(s) :
Caroline Fontaine
Mise à jour :
17/03/2006 à 17h24

 

Introduction au tatouage robuste

Les algorithmes de tatouage permettant d'insérer un filigrane robuste sont les plus nombreux. Ceci est principalement dû au fait que pendant très longtemps les recherches se sont focalisées sur le contexte de la protection des droits d'auteur, qui requiérait la robustesse. Toute la question est alors de savoir à quoi l'on souhaite que le tatouage résiste : autrement dit, quelles transformations vont conserver au document tatoué une valeur marchande ? Car l'idée est bien ici que le document est considéré comme protégé si l'on est capables de retrouver le filigrane qu'il contient (et qui atteste de l'identité de son propriétaire).

On peut proposer de nombreuses classifications pour ces manipulations, prenant en compte leur nature intrinsèque ou encore l'intention qu'elles révèlent ; en effet, un utilisateur peut appliquer un algorithme de compression pour des raisons tout à fait honnêtes (gain de place), comme il peut le faire pour des raisons malhonnêtes (afin d'altérer le filigrane). Nous faisons le choix ici de nous appuyer sur la nature de ces transformations, plutôt que sur l'intention de l'utilisateur. Voici donc une liste (non exhaustive) de manipulations.
 
Compression.  
Une compression sans perte n'altérera bien entendu pas le filigrane, mais il est plus probable que la compression soit réalisée afin de gagner de l'espace de stockage et, dans ce cas, il y aura perte d'information. Une technique de compression avec perte efficace cherche à simplifier le codage du document, en supprimant l'information peu significative ; comme le filigrane est impercetpible, il est naturellement consiféré comme peu significatif, et sera donc naturellement altéré lors de la compression. Si l'on souhaite insérer un filigrane robuste à la compression, il faut donc tirer parti des imperfections de ces techniques pour concevoir des algorithmes de tatouage adaptés.
 
Rehaussement (resp. lissage) (images fixes et vidéo). 
Ceci correspond à l'augmentation (resp. la diminution) des composantes hautes fréquences.
 
Transformation géométriques (images fixes et vidéo). 
Modification des dimensions de l'image, rotation, extraction de portions de l'image. Ce genre de transformation a pour effet de désynchrnoiser le signal de tatouage, ce qui rend impossible la détection de sa présence.
 
Conversions analogique-numérique.  
Impression suivie d'un scan, film réalisé à l'aide d'un camescope dans une salle de cinéma, musique ré-enregistrée ... Ce processus entraîne en général une désynchronisation du signal de tatouage, ainsi que de petites distorsions.
 
Transformations valumétriques (images fixes et vidéo).  
Étalement d'histogramme, égalisation d'histogramme, transformation Gamma.
 
Débruitage.  
L'objectif de cette manipulation est d'approcher au mieux la forme d'onde du filigrane, pour pouvoir l'enlever [2,3].
 
Gigue (ou Jittering).  
Ce phéomène est connu en télécommunications lorsque le délai de transmission du signal varie. Il en résulte une duplication, ou une suppression, de morceaux de signaux. Ceci peut se traduire ici dans le domaine temporel ou dans le domaine spatial (par exemple ajout ou suppression de lignes/colonnes dans une image). Le document ne semble par vraiment altéré, d'un point de vue perceptif, mais le signal de tatouage est désynchronisé.
 
Attaque par mosaïques.  
Son principe est simple : le signal tatoué est découpé en plusieurs morceaux, qui sont ensuite juxtaposés. Dans le cas d'une image fixe, par exemple, on peut donc aisément la regarder sans s'apercevoir de la manipulation, mais le tatouage est totalement désynchronisé si sa détection est automatisée. Si la détection peut se faire manuellement, on peut recoller les morceaux avant de l'effectuer.
 
Stirmark.  
Le logiciel Stirmark et ses variantes proposent un banc de tests permettant d'apprécier la robustesse du filigrane. Voir le paragraphe " évaluation "  de la fiche "Dissimulation d'information et sécurité ".

On distinguera donc par la suite les distorsions synchrones (i.e. qui ne modifient pas la position spatiale ou temporelle du signal : compression, lissage, ajout de bruit, ...) des distorsions asynchrones (i.e. qui modifient la position spatiale ou temporelle du signal, et introduisent donc une désynchronisation : transformations géométriques, gigue, ...).

Par ailleurs, il est illusoire de présenter toutes les techniques publiées sur le sujet, dans leurs moindres détails. Nous avons choisi ici de mentionner les plus importantes, et d'expliquer leur approche. Les détails peuvent être obtenus à la lecture des articles cités en références. L'idée générale sur laquelle reposent toutes ces techniques est que l'on va introduire une certaine structure dans le document, qui est fortement liée à la clé utilisée. La présence de cette structure (détectable uniquement à l'aide de la bonne clé) sera la garantie de la présence du filigrane. Notons que sauf mentions contraires, les techniques présentées sont comprises comme symétriques et aveugles.

References

[2] M. Kutter, S. Voloshynovskiy, and A. Herrigel. Watermark copy attack. In Proc. SPIE, Security and Watermarking of Multimedia Contents II, volume 3971. SPIE, 2000.
[3] S. Voloshynovskiy, S. Pereira, A. Herrigel, N. Baumgärtner, and T. Pun. Generalized watermark attack based on watermark estimation and perceptual remodulation. In Proc. SPIE, Security and Watermarking of Multimedia Contents II, volume 3971, pages 358-370. SPIE, 2000.


Tatouage robuste : Image fixe

Remarquons tout d'abord qu'il est très facile de manipuler des images fixes et que tout un chacun a accès à de nombreux outils, que ses intentions soient honnêtes ou non. Les techniques sont présentées ici en fonction des attaques/manipulations auxquelles le tatouage va pouvoir résister. On les classe ensuite en plusieurs catégories, en fonction du choix de la fonction de "mélange " (addition, substitution), et de la fonction "transformée " (identité, Fourier, Cosinus, ondelettes).

Puisqu'il est plus aisé de résister aux distorsions synchrones qu'aux asynchrones, les techniques sont présentées dans l'ordre croissant de leurs performances en termes de robustesse, qui correspond aussi à l'ordre chronologique de leur élaboration. Par ailleurs les techniques résistant à une compression avec perte sont celles qui vont effectuer l'insertion dans un domaine transformé (Fourier, Cosinus, ondelettes).

1  Résister aux distorsions synchrones

Le tatouage additif dans le domaine spatial est le plus élémentaire. La "transformée " est ici l'identité, et l'opération de " mélange " une addition : y=x+w. Il existe de nombreuses techniques reposant sur l'ajout d'une séquence aléatoire 2D dans le domaine spatial [47,50]. On peut cependant mettre en avant deux techniques particulières.
La première consiste en l'ajout d'une séquence aléatoire modulée par un message [22]. Chaque bit du message à insérer, de valeur ±1,est associé à une région de l'image, et le message complet est alors réparti sur tout le support de l'image. Ce signal est ensuite modulé par une séquence aléatoire, puis pondéré par un masque (pour assurer l'imperceptibilité). Ce signal, w, est alors ajouté à l'image.
La deuxième est connue sous le nom de patchwork [8,41]. On extrait deux ensembles disjoints de pixels de l'image, de même taille ; le choix de ces ensembles dépend de la clé k. On modifie ensuite la luminance des pixels de l'un des deux ensembles, en l'augmentant d'un facteur donné. La détection s'effectue en calculant la différence entre la moyenne de la luminance des pixels des deux ensembles : si cette différence est significative, c'est que l'image a été tatouée avec la clé qui a défini les ensembles. Notons que dans le cas général, ou si l'on n'utilise pas la bonne clé, la différence est proche de zéro.
Mais si ces techniques sont simples à comprendre et à réaliser, elles souffrent d'une trop faible robustesse, notamment face aux comrpessions avec perte.


Toujours dans le contexte des méthodes additives (y=x+w), il existe des techniques plus évoluées, permettant en particulier de résister à des compressions avec perte. On choisit alors de s'appuyer sur ces techniques même de compression, afin de maîtriser l'information qui sera retirée lors du processus de compression. S'appuyant sur la compression JPEG, on travaillera dans le domaine de la DCT (Discrete Cosine Transform), pour JPEG2000 dans le domaine des ondelettes, ... Ce passage dans un autre domaine, équivalent en termes d'information, au domaine spatial, s'effectue par l'opération " transformée " qui produit le vecteur x.
Dans [13], les auteurs appliquent la DCT à l'image globale, avant d'insérer le filigrane parmi les basses fréquences de l'image en s'appuyant sur des techniques d'étalement de spectre. La détection s'effectue en utilisant l'image originale (schéma non aveugle) pour retrouver, par différence, la filigrane inséré.
Une variante de ce schéma a été proposée dans [42], mais avec une détection aveugle (sans l'original) reposant sur une mesure de corrélation.
On peut également citer [15] qui propose une solution reposant sur la transformée de Fourier.
De nombreux schémas de tatouage opérant dans le domaine multirésolution ont été proposés [25,52,54], mais [4] est l'un des rares à fonctionner en mode aveugle : le filigrane est inséré dans les trois sous-bandes de détails de la décomposition en ondelettes ; les coefficients des trois sous-bandes sont marqués par l'addition pondérée d'une séquence pseudo-aléatoire de même taille que l'ensemble des trois sous-bandes ; la détection s'effectue par une mesure de corrélation.


Contrairement aux techniques additives qui se ressemblent beaucoup, les techniques substitutives sont souvent très différentes les unes des autres. Voici les principales approches proposées pour l'élaboration de schémas de tatouage dans le domaine spatial.
La substitution des bits de poids faible est une technique élémentaire d'insertion, simple bien connue mais malheureusment très peu robuste. On peut la résumer comme suit : les bits de poids faible d'une composante quantifiée de l'image (luminance, couleur, coefficient DCT) sont remplacés par les bits du message. La clé détermine quels bits vont être remplacés, et lesquels seront conservés [46].
[9] propose d'utiliser l'opération de quantification pour cacher le filigrane, utilisant des dictionnaires de valeurs quantifiées, un pour chaque symbole de l'alphabet dans lequel le message est codé.
[33] propose, lui, d'utiliser les caractéristiques de l'image : l'insertion n'effectue en déplaçant certains coins ou bords de l'image originale. Le filigrane est caractérisé par un réseau dense de droites tel qu'une grande proportion de points d'intérêts soient proches d'une de ces lignes. L'opération d'insertion consiste en la déformation de l'image, afin d'amener ces points d'intérêts près des lignes.
Citons enfin l'utilisation de similarités entre blocs d'une image, utilisée dans  [6]. Les composantes de l'image sont remplacées par des composantes possédant une relation de similarité avec d'autres composantes de l'image.


Voyons maintenant quelles techniques ont été proposées pour insérer un filigrane par substitution dans les domaines transformés. L'objectif est encore ici, comme expliqué plus haut, de pouvoir résister à des compressions avec perte, de type JPEG ou encore JPEG2000.
La technique la plus connue concerne la compression JPEG et, comme elle, utilise les coefficients DCT de blocs 8x8 de l'image [53]. L'idée est ici de modifier ces coefficients afin qu'ils présentent des propriétés non naturelles et faciles à vérifier (on considère dans chaque bloc 8x8 à traiter deux coefficients de moyennes fréquences notés C0 et C1 ; si l'on souhaite insérer un 1, on force C1 > C0, et si l'on souhaite insérer un 0 on force C0 > C1). Comme la compression va altérer les coefficients de hautes fréquences, on va insérer l'information dans les coefficients de fréquences moyennes (en trop basse fréquence, cela se verrait). La clé va permettre de déterminer quels blocs vont servir à cacher le message. Cette technique offre l'avantage d'être très simple à réaliser.
Pour ce qui est de la résistance à la compression JPEG2000, on peut citer [26], qui présente un schéma reposant sur la transformation par ondelettes. Le principe est le même que le précédent, mais transposé dans un autre domaine : on va ici utiliser comme structure la relation d'ordre vérifiée par des triplets de coefficients correspondant aux sous-bandes horizontales, verticales et diagonales pour un niveau de décomposition donné. Le choix des triplets à prendre en considération est déterminé par la clé.

2  Résister aux distorsions asynchrones

On demande en général à un système qui résiste aux attaques asynchrones de résister aussi aux distorsions synchrones. Ainsi, la résistance aux attaques asynchrones est comprise comme un niveau de robustesse supplémentaire, et la plupart des techniques apportant cette robustesse viennent compléter les algorithmes de tatouage présentés plus haut. Le principal enjeu est de resynchroniser le filigrane pour permettre une détection correcte. Mais cette resynchronisation a un coût : par exemple, si on copnsidère l'ensemble des rotations d'un angle quelconque ainsi que des translations allant jusqu'à 50 pixels, le temps nécessaire à la détection est multiplié par un million ! C'est pourquoi certaines techniques de tatouage dédiées ont été élaborées, prenant en compte la possibilité de telles transformations, dès le départ. Voici donc quelques techniques mises au point pour faciliter la resynchronisation lors de la détection.


Une première approche est de considérer un domaine d'insertion qui reste insensible aux distorsions asynchrones. En voici deux exemples. [49] considère des séquences vidéo et exploite l'insensibilité de la luminance moyenne des images ; et si cette technique n'est pas propre aux images fixes, il est intéressant de la noter car elle est assez représentative. L'insertion utilise l'étalement de spectre ; elle ajoute une composante continue générée à partir d'une séquence aléatoire à chaque image ; la détection s'appuie alors sur la corrélation entre la luminance moyenne et la séquence aléatoire utilisée. Mais d'autres quantités restent insensibles aux distorsions asynchrones, et peuvent donc être utilisées, comme par exemple l'histogramme de l'image [11]. Travailler sur cet histogramme présente une certaine souplesse, car on peut modifier sa silhouette sans que cela soit visible. L'insertion s'effectue en ordonnant et classifiant les pixels, de sorte que deux pixels de même valeur soient bien différenciés. L'histogramme de l'image originale est alors remplacé par un histogramme arbitraire de forme périodique. À la détection, on regarde si l'histogramme a bien la forme attendue. On peut également mentionner une approche duale, focalisée sur l'insensibilité de l'opération de détection. L'idée présentée dans [44] est d'utiliser un filigrane de structure différente selon les bits du message. Par exemple, un 0 est représenté par un carré contenant une séquence aléatoire, alors que le 1 est codé par le même carré mais avec des coefficients centraux nuls. La détection du message s'effectue gràce à un filtre passe-haut, qui permet d'extraire la séquence ajoutée lors de l'insertion ; reste ensuite à analyser sa structure à partir de sa variance locale. Enfin, on peut chercher à utiliser une "transformée " invariante aux distorsions asynchrones, comme la transformée de Fourier-Mellin [38].


Une deuxième stratégie est d'insérer un filigrane périodique, afin de limiter la complexité de la détection en cas de distorsions asynchrones. Plusieurs solutions ont été proposées dasn ce sens, comme [24,16,23].


Une autre démarche est d'insérer, en plus du filigrane, un motif de resynchronisation, dont on maîtrise les caractéristiques, et qui permettra de détecter la nature des distorsions subies pas l'image tatouée. Il sera ensuite possible d'appliquer une transformation inverse pour retomber sur une image tatouée non distendue. Il sera alors possible d'appliquer la procédure de détection. De tels motifs peuvent être insérés dans les domaines spatial [27] ou fréquentiel [40] (qui permet de contrer les transformations géométriques affines, mais pas Stirmark).


On peut aussi assez naturellement penser à utiliser l'image originale afin de détecter les transformations qu'a pu subir l'image tatouée [14,45,3]. Une fois celles-ci identifiées, il suffit de les inverser avant d'opérer la détection du filigrane.


Enfin, citons une classe de techniques prometteuses, qui exploitent le contenu-même de l'image. L'idée générale, lancée par [28], est de définir un repère lié aux caractéristiques de l'image, et de travailler pour l'insertion dans ce repère. Plus précisément, on peut s'appuyer sur la détection de points d'intérêts [7], sur l'utilisation de motifs auto-recouvrants [17], l'analyse en composantes principales [5].


Pour conclure, notons qu'il est plus facile de lutter contre les transformations asynchrones affines que contre les distorsions non affines, et toutes les techniques présentées ici permettent de les contrecarer. Pour ce qui est des distorsions non affines, seules les approches de type "insertion insensible ", "utilisation de l'image originale " et "exploitation du contenu " permettent de les contrer. Par ailleurs chaque approche peut présenter des inconvénients spécifiques (coût de calcul, contraintes, ...) et le choix s'avère difficile. Une solution peut être de combiner plusieurs de ces techniques pour associer leurs avantages [31].

3  Tatouage asymétrique, tatouage informé

D'un point de vue fonctionnel, il est très intéressant de concevoir des schémas de tatouage asymétriques. De tels schémas ont commencé à être élaborés en 1997 et de réelles solutions ont été proposées. Il serait trop long de relater ici l'histoire du tatouage asymétrique, et nous renvoyons les lecteurs intéressés vers [20,21,51,48], qui proposent un excellent état de l'art ainsi que des propositions concrètes de schémas. On y comprend pourquoi le niveau de sécurité des schémas asymétriques est particulièrement intéressant (le filigrane y ressemble plus à de l'aléa), mais aussi le prix à payer en terme de longueur de vecteurs à traiter. Par ailleurs, l'apparition des schémas informés offre une alternative (en termes de sécurité) tout à fait pertinente, puisque l'information de bord y agit comme une source d'entropie. Les travaux les plus récents sont [36,10,39,29,18,34,19,37,1,30,35,12,2,32,43].

References

[1] A. Abrardo and M. Barni. Informed watermarking by means of orthogonal and quasi-orthogonal dirty paper coding. IEEE Transactions on Signal Processing, 53(2):824-833, 2005. numéro spécial "Supplement on Secure Media II".
[2] O. Alattar and A. Alattar. A fast hierarchical watermark detector for real-time software or low-cost hardware implementation. In IEEE ICIP'05. IEEE.
[3] M. Alghoniemy and A. Tewfik. Geometric distortion correction in image watermarking. In Proc. SPIE, Security and Watermarking of Multimedia Contents II, volume 3971, pages 82-89. SPIE, 2000.
[4] M. Barni, F. Bartolini, V. Cappellini, A. Lippi, and A. Piva. A dwt-based technique for spatio-frequency masking of digital signatures. In Proc. SPIE, Security and Watermarking of Multimedia Contents I, volume 3657, pages 31-39. SPIE, 1999.
[5] P. Bas, N. Boulgouris, F. Koravos, J.-M. Chassery, M. Strintzis, and B. Macq. Robust watermarking of video objects for mpeg-4 applications. In Proc. SPIE, Applications of Digital Image Processing, volume 4472. SPIE, 2001.
[6] P. Bas, J.-M. Chassery, and F. Davoine. A geometrical and frequential watermarking scheme using similarities. In Proc. SPIE, Security and Watermarking of Multimedia Contents I, pages 264-272. SPIE, 1999.
[7] P. Bas, J.-M. Chassery, and B. Macq. Robust watermarking based on the warping of pre-defined triangular patterns. In Proc. SPIE, Security and Watermarking of Multimedia Contents II, volume 3971, pages 99-109. SPIE, 2000.
[8] W. Bender and D. Morimoto. Techniques for data hiding. In Proc. SPIE, volume 2420. SPIE, 1995.
[9] B. Chen and G. Wornell. An information-theoretic approach to the design of robust digital watermarking systems. In IEEE ICASSP'99. IEEE, 1999.
[10] B. Chen and G. Wornell. Quantization index modulation: A class of provably good methods for digital watermarking and information embedding. IEEE Transactions on Information Theory, 47(4):1423-1443, 2001.
[11] D. Coltic and P. Bolon. Watermarking by histogram specification. In Proc. SPIE, Security and Watermarking of Multimedia Contents I, volume 3657, pages 252-263. SPIE, 1999.
[12] L. Coria-Mendoza, P. Nasiopoulos, and R. Ward. A robust watermarking scheme based on informed coding and informed embedding. In IEEE ICIP'05. IEEE.
[13] I. Cox, J. Killian, T. Leighton, and T. Shamoon. Secure spread spectrum watermarking for multimedia. IEEE Transactions on Image Processing, 6(12):1673-1687, 1997.
[14] F. Davoine, P. Bas, P.-A. Hebert, and J.-M. Chassery. Watermarking et résistance aux déformations géométriques. In CORESA'99.
[15] J.-F. Delaigle, C. De Vleeschouwer, and B. Macq. A psychovisual approach for digital picture watermarking. Journal of Electronic Imaging, 7(3):628-640, 1998.
[16] D. Delanay and B. Macq. Generalized 2d cyclic patterns for secret watermark generation. In IEEE ICIP'00, volume 2, pages 77-80. IEEE, 2000.
[17] J. Dittmann, T. Fiebig, and R. Steinmetz. New approach for transformation-invariant image and video watermarking in the spatial domain: self-spanning patterns (ssp). In Proc. SPIE, Security and Watermarking of Multimedia Contents II, volume 3971, pages 176-185. SPIE, 2000.
[18]  J. Eggers, R. Baüml, R. Tzschoppe, and B. Girod. Scalar costa scheme for information embedding. IEEE Transactions on Signal Processing, 51(4):1003-1019, 2003. numéro spécial ßignal processing for data hiding in digital media and secure content delivery".
[19] R. Fischer, R. Tzschoppe, and R. Bäuml. Lattice costa schemes using subspace projection for digital watermarking. European Trans. Telecommunications, 15(4):351-362, 2004.
[20] T. Furon. Application du tatouage numérique à la protection de copie. PhD thesis, ENST Paris, 2002.
[21] T. Furon and P. Duhamel. An asymmetric watermarking method. IEEE Transactions on Signal Processing, 51(4):981-995, 2003. numéro spécial ßignal processing for data hiding in digital media and secure content delivery".
[22] F. Hartung and B. Girod. Watermarking of uncompressed and compressed video. Signal Processing, 3:283-333, 1998.
[23] F. Hartung, J. Su, and B. Girod. Spread spectrum watermarking: malicious attacks and counter-attacks. In Proc. SPIE, Security and Watermarking of Multimedia Contents I, volume 3657, pages 147-158. SPIE, 1999.
[24] T. Kalker, G. Depovere, J. Haitsma, and M. Maes. A video watermarking system for broadcast monitoring. In Proc. SPIE, Security and Watermarking of Multimedia Contents I, volume 3657, pages 103-112. SPIE, 1999.
[25] D. Kundur and D. Hatzinakos. A robust digital image watermarking scheme using the wavelet based function. In IEEE ICIP'97, volume 1, pages 544-547. IEEE, 1997.
[26] D. Kundur and D. Hatzinakos. Digital watermarking using multiresolution wavelet decomposition. In IEEE ICASSP'98, volume 1, pages 2659-2662. IEEE, 1998.
[27] M. Kutter. Watermarking resisting to translation, rotation and scaling. In Proc. SPIE, Multimedia systems and applications, volume 3528, pages 423-431. SPIE, 1999.
[28] M. Kutter, S. Bhattacharjee, and T. Ebrahimi. Towards second generation watermarking schemes. In IEEE ICIP'99, volume 1, pages 320-323, 1999.
[29] G. Le Guelvouit. Tatouage robuste par étalement de spectre avec prise en compte de l'information adjacente. PhD thesis, INSA Rennes, 2003.
[30] L. Lin, I. Cox, G. Doërr, and M. Miller. An efficient algorithm for informed embedding of dirty-paper trellis codes for watermarking. In IEEE ICIP'05. IEEE.
[31] C.-S. Lu, S.-K. Huang, C.-J. Sze, and H.-Y. Liao. Cocktail watermarking for digital image protection. IEEE Transactions on Multimedia, 2(1):209-224, 2000.
[32] C.-S. Lu, S.-W. Sun, and P.-C. Chang. Robust hash-based image watermarking with resistance to geometric distortions and watermark-estimation attack. In IS&T/SPIE International Symposium on Electronic Imaging 2005, volume 5681 of Proceedings of the SPIE, pages 147-163. SPIE, 2005. Security, Steganography, and Watermarking of Multimedia Contents VII.
[33] M. Maes and C. van Overveld. Digital watermarking by geometric warping. In IEEE ICIP'98, volume 2, pages 424-429. IEEE, 1998.
[34] H. Malvar and D.A.F. Florêncio. Improved spread spectrum: A new modulation technique for robust watermarking. IEEE Transactions on Signal Processing, 51(4):898-905, 2003. numéro spécial ßignal processing for data hiding in digital media and secure content delivery".
[35] J. Mayer and J. Bermudez. Multi-bit informed embedding watermarking with constant robustness. In IEEE ICIP'05. IEEE.
[36] M. Miller, I. Cox, and J. Bloom. Informed embedding: exploiting image and detector information during watermark insertion. In IEEE ICIP'00, volume 3, pages 1-4, 2000.
[37] M. Miller, G. Doërr, and I. Cox. Applying informed coding and embedding to design a robust, high capacity watermark. IEEE Transactions on Image Processing, 13(6):792-807, 2004.
[38] J. O'Ruanaidh and T. Pun. Rotation, scale and translation invariant spread sspectrum digital image watermarking. Signal Processing, 66(3):303-317, 1998.
[39] S. Pateux and G. Le Guelvouit. Practical watermarking scheme based on wide spread spectrum and game theory. Signal Processing: Image Communication, 18:283-296, 2003.
[40] S. Pereira and T. Pun. Fast robust template matching for affine resistant image watermarking. In International Workshop on Information Hiding - WIH'99, number 1768 in Lecture Notes in Computer Science, pages 200-210. Springer-Verlag, 2000.
[41] I. Pitas. A method for signature casting on digital images. In IEEE ICIP'96, volume 3, pages 215-218. IEEE, 1996.
[42] A. Piva, M. Barni, F. Bartolini, and V. Capellini. Dct based watermark recovering without resorting to the uncorrupted original image. In IEEE ICIP'97, pages 520-523. IEEE, 1997.
[43] L. Pérez-Freire and F. Pérez-González. Spread-spectrum vs. quantization-based data hiding: misconceptions and implications. In IS&T/SPIE International Symposium on Electronic Imaging 2005, volume 5681 of Proceedings of the SPIE, pages 341-352. SPIE, 2005. Security, Steganography, and Watermarking of Multimedia Contents VII.
[44] I. Setyawan, G. Kakes, and R. Lagendijk. Synchronization-insensitive video watermarking using structured noise pattern. In Proc. SPIE, Security and Watermarking of Multimedia Contents IV, volume 4675, pages 520-529. SPIE, 2002.
[45] Q. Sun, J. Wu, and R. Deng. Recovering modified watermarked image with reference to original image. In Proc. SPIE, Security and Watermarking of Multimedia Contents I, volume 3657, pages 415-424. SPIE, 1999.
[46] M. Swanson, B. Zhu, and A. Tewfik. Transparent robust image watermarking. In IEEE ICIP'96, volume 3, pages 211-214. IEEE, 1996.
[47] A. Tirkel, G. Rankin, R. van Schyndel, and C. Osborne. Electronic watermark. In DICTA, pages 666-672, 1993.
[48] J. Tzeng, W. Hwang, and I.-L. Chern. An asymetric subspace watermarking method for copyright protection. IEEE Transactions on Signal Processing, 53(2):784-792, 2005. numéro spécial "Supplement on Secure Media II".
[49] A. van Leest, J. Haitsma, and T. Kalker. On watermarking and digital cinema. In Proc. SPIE, Security and Watermarking of Multimedia Contents V, volume 5020. SPIE, 2003.
[50] R. van Schyndel, A. Tirkel, and C. Osborne. A digital watermark. In IEEE ICIP'94, volume 2, pages 86-90. IEEE, 1994.
[51] J.-E. Vila-Forcén, O. Koval, S. Voloshynovskiy, and T. Pun. Asymmetric spread spectrum data-hiding for laplacian host data. In IEEE ICIP'05. IEEE.
[52] X. Xia, C. Boncelet, and C. Arce. A multiresolution watermark for digital images. In IEEE ICIP'97, volume 1, pages 548-551. IEEE, 1997.
[53] J. Zhao and E. Koch. Embedding robust labels into images for copyright protection. In International Congress on Intellectual Property Rights for Specialized Information, Knowledge and New Technologies - KnowRight'95, Schriftenreihe der Österreichischen Computer Gesellschaft, Band 82, pages 242-251. Oldenbourg, 1995.
[54] W. Zhu, Z. Xiong, and Y. Zhang. Multiresolution watermarking for images and video: a unified approach. In IEEE ICIP'98, volume 1, pages 465-469. IEEE, 1998.


Tatouage robuste : Video

Une vidéo étant constituée d'une séquence d'images, certes avec une bande son, on peut adapter des techniques de tatouage d'images fixes. Parmi ceux cités plus haut, certains sont très facilement transposables à la vidéo, ou inversement initialement proposés pour de la vidéo et transposables aux images fixes. Néanmoins, le contexte vidéo a ses particularités et il peut être avantageux de les prendre en compte.

La première est évidemment la composante temporelle. Elle influe sur la quantité d'information que l'on peut cacher (25 à 30 images par secondes donnent plus de "place " pour cacher le filigrane), sur la robustesse du filigrane (on peut cumuler les informations lors de la détection, en opérant sur une séquence plus longue si vécessaire ; mais en revanche, l'attaquant peut calculer la moyenne de plusieurs images de la vidéo contenant le même filigrane dans le but d'estimer celui-ci, les images cumulées apparaissant alors comme du bruit), et sur les contraintes algorithmiques (il y a beaucoup d'images dans un film, et il faut donc que l'algorithme de tatouage soit rapide, voire temps-réel ; cette contrainte dépend bien entendu du contexte : cinéma, télévision). Par ailleurs, il est moins facile de manipuler une vidéo qu'une image fixe, et donc moins facile de l'attaquer : elle est volumineuse, et nécessite une plus grosses puissance de calcul. Cependant, la capacité de stockage des disques dure augmente rapidement, ainsi que la puissance de calculs des ordinateurs personnels, ce qui rend ces manipulations de plus en plus accessible (ou du moins, leur coût financier diminue). Pour éviter l'attaque par moyennage, il faut changer le message caché le plus souvent possible, mais pas trop, afin de conserver la robustesse : il y a là un compromis à réaliser. Il faut également que la détection puisse s'opérer le plus facilement possible, sans avoir à resynchroniser le signal à la main pour les différents messages à extraire.


Le contexte du tatouage robuste concerne principalement la protection des droits d'auteur, et peut se décliner dans le contexte télévisuel (par exemple pour contrôler automatiquement que les programmes ou reportages diffusés sur les chaînes de télévision le sont dans les règles), dans la cadre des DVD (pour contrôler le nombre et la nature des copies autorisées ; on peut par exemple vouloir autoriser une copie de l'original, mais pas de copie de copie). Combiné à des outils cryptographiques, le tatouage permet aussi d'autoriser ou non la lecture d'un film sur un support matériel donné (décodeur, lecteur DVD, ...) ; mais dans ce cas, il faut que la clé de détection se trouve du côté du lecteur, et donc du côté de l'utilisateur, et il est évident que si celui-ci est malhonnête il va essayer de la retrouver (par exemple à l'aide de procédés de reverse engineering) ; il est donc particulièrement intéressant dans ce contexte de disposer de schémas de tatouage asymétriques, pour lesquels la clé de détection n'a pas besoin d'être tenue secrète.

1  Techniques dérivées du tatouage d'images fixes

Le principe est d'appliquer un algorithme de tatouage d'images fixes à chacune des images composant la vidéo, et ce de manière indépendante. Parmi les techniques citées plus haut pour les images fixes, et qui peuvent s'adapter à la vidéo de cette manière, on retrouve [10,28,21,13,2,1,6], dont les plus récentes sont aussi les plus robustes, notamment face aux distorsions asynchrones de l'image. On peut noter que la méthode présentée dans [10] présente l'avantage de pouvoir opérer sur flux compressé (MPEG-2) ou non. Ceci peut éviter des manipulations de décompression-tatouage-recompression si le flux est déjà compressé, ce qui permet non seulement de gagner du temps, mais aussi d'éviter des dégradations de la séquence vidéo. Cependant l'application de cette méthode telle qu'elle est proposée provoque l'apparition d'artefacts gênants ; mais cet inconvénient peut être contré par l'utilisation d'un procédé de compensation de dérive, c'est-à-dire en modifiant la marque sur une image prédite afin qu'elle annule la contribution de la marque de l'image de référence précédente. Citons enfin une technique dédiée au tatouage de flux compressé, [18,3], qui consiste en l'adaptation de l'algorithme [26] présenté dans la fiche .

2  Algorithmes spatio-temporels

Si l'on considère que l'on a affaire à un signal à trois dimensions, on peut appliquer diverses transformées prenant en compte cette troisième dimension qu'est le temps. On peut par exemple utiliser une décomposition en ondelettes temporelle, comme proposé dans [22]. Ce schéma ne permet de cacher qu'un seul bit, mais offre l'avantage de générer un filigrane qui dépend à la fois de l'ayant droit de la vidéo, et du contenu-même de celle-ci. Les avantages de cette technique sont la grande robustesse aux modifications temporelles (suppression ou insertion d'images, moyenne d'images, interpolation temporelle, ...). Ses inconvénients sont tout d'abord sa faible capacité (on ne peut extraire qu'un bit d'information), mais aussi la nécessité de disposer de la séquence originale lors de l'opération de détection.
Une autre solution proposée repose sur l'utilisation de la transformée de Fourir 3D [5]. Elle permet de sélectionner les fréquences spatio-temporelles adéquates afin d'assurer l'invisibilité du filigrane, et assure également une robustesse face aux décalages (cycliques) spatiaux et temporels. Un motif de synchronisation est également ajouté, afin d'assurer une robustesse face aux changements d'échelle spatiale ou au rééchantillonage temporel.

3  Méthodes purement temporelles

Ces méthodes cachent le filigrane dans le domaine temporel, en modifiant uniquement les très basse fréquences spatiales (moyenne d'image). En conséquence, le filigrane sera robuste aux déformations géométriques de l'image, mais sera sensible aux modification temporelles (remontage ou interpolation par exemple). La valeur de la marque sera constante sur une image donnée, mais variera d'une image à l'autre. Ceci peut évidemment avoir pour conséquence l'apparition d'artefacts, de clignotements. Pour éviter ces désagréments, d'une part on pondère la marque par un masque visuel spatial et/ou temporel, et d'autre part on n'utilise que les basses fréquences spatiales afin de ralentir la variation de la luminance moyenne. La détection consiste en une mesure de corrélation entre la suite des moyennes d'images et le filigrane que l'on s'attend à trouver. On peut citer les techniques de [8,27] qui reprennent ce principe général en l'améliorant, et [19] qui propose une méthode alternative ne reposant pas sur la luminance moyenne, mais sur des pixels isolés.

4  Tatouage de flux compressés

Nous avons déjà vu plus haut des techniques permettant de travailler au choix sur les flux compressés ou non. Mais il existe également des méthodes ne s'appliquant qu'aux flux compressés. [24,25] propose de s'appuyer sur les vecteurs de mouvement des images prédites dans le format compressé MPEG. Mais le filigrane est sensible aux estimateurs de mouvement utilisés, et risque de disparaître lors d'un transcodage. Dans le contexte de la protection de copie des DVDs, [16] s'appuie sur la structure de GOP utilisée, en attribuant par exemple à une image P la valeur 0 et à une image B la valeur 1. Il faut cependant tenir compte des contraintes imposées par la norme MPEG : la taille du message caché est limité par la taille du GOP (entre 10 et 20 images apr GOP), et si l'on code un message sur plusieurs GOP il faut faire attention à assurer la synchronisation temporelle lors de la détection ; afin d'assurer l'indétectabilité statistique du filigrane, les statistiques usuelles du GOP doivent être respectées ; il se peut qu'un codeur, adaptant naturellement la structure du GOP à la nature de la séquence vidéo, donne lieu à la détection d'un faux positif. Ces contraintes sont prises en compte dans la technique proposée par [16]. L'avantage de cette technique est que si l'encodage (le tatouage) est coûteux (ne attaque, étant équivalente à un réencodage complet, serait trop lourde à mener, et risquerait de provoquer la création d'artefacts), la détection ne l'est pas (une réalisation matérielle grand publique est possible).

5  et plus récemment ...

Comme pour les autres media, les publications sont de plus en plus nombreuses, et la notion de tatouage informé a pris beaucoup d'importance ces derniers temps. Parmi les plus récentes, on peut citer [15,23,12,17,14,4,20,9,11] ainsi que l'étude sécuritaire de [7].

References

[1] P. Bas. Méthodes de Tatouage d'Images Fondées sur le Contenu. PhD thesis, INPG, 2000.
[2] P. Bas, N. Boulgouris, F. Koravos, J.-M. Chassery, M. Strintzis, and B. Macq. Robust watermarking of video objects for mpeg-4 applications. In Proc. SPIE, Applications of Digital Image Processing, volume 4472. SPIE, 2001.
[3] S. Baudry. Stratégies de codage de canal pour le tatouage de vidéo. PhD thesis, ENST Paris, 2002.
[4] P. Campisi and A. Neri. Video watermarking in the 3d-dwt domain using perceptual masking. In IEEE ICIP'05. IEEE.
[5] F. Deguillaume, G. Csurka, J. O'Ruanaidh, and T. Pun. Robust 3d dft video watermarking. In Proc. SPIE, Security and Watermarking of Multimedia Contents I, volume 3657, pages 113-124. SPIE, 1999.
[6] J. Dittmann, T. Fiebig, and R. Steinmetz. New approach for transformation-invariant image and video watermarking in the spatial domain: self-spanning patterns (ssp). In Proc. SPIE, Security and Watermarking of Multimedia Contents II, volume 3971, pages 176-185. SPIE, 2000.
[7] G. Doërr. Security issue and collusion attacks in video watermarking. PhD thesis, EURECOM, 2004.
[8] L. Haitsma and T. Kalker. A watermarking scheme for digital cinema. In IEEE ICIP'01, volume 2, pages 487-489. IEEE, 2001.
[9] Ö. Harmanci, M. Kucukgoz, and M. Mihçak. Temporal synchronization of watermarked video using image hashing. In IS&T/SPIE International Symposium on Electronic Imaging 2005, volume 5681 of Proceedings of the SPIE, pages 370-380. SPIE, 2005. Security, Steganography, and Watermarking of Multimedia Contents VII.
[10] F. Hartung and B. Girod. Watermarking of uncompressed and compressed video. Signal Processing, 3:283-333, 1998.
[11] E. Hauer and M. Steinebach. Robust digital watermark solution for intercoded frames of MPEG video data. In IS&T/SPIE International Symposium on Electronic Imaging 2005, volume 5681 of Proceedings of the SPIE, pages 381-390. SPIE, 2005. Security, Steganography, and Watermarking of Multimedia Contents VII.
[12] H. Joumaa and F. Davoine. Performance of an ica video watermarking scheme using informed techniques. In IEEE ICIP'05. IEEE.
[13] T. Kalker, G. Depovere, J. Haitsma, and M. Maes. A video watermarking system for broadcast monitoring. In Proc. SPIE, Security and Watermarking of Multimedia Contents I, volume 3657, pages 103-112. SPIE, 1999.
[14] A. Koz and A. Alatan. Oblivious video watermarking using temporal sensitivity of hvs. In IEEE ICIP'05. IEEE.
[15] E. Lin and E. Delp. Temporal synchronization in video watermarking. 52(10):3007-3022, 2004. numéro spécial "Supplement on Secure Media".
[16] J.-P. Linnartz and J. Talstra. Mpeg pty-marks: cheap detection of embedded copyright data in dvd-video. In Computer Security - ESORICS'98, number 1485 in Lecture Notes in Computer Science, pages 221-240. Springer-Verlag, 1998.
[17] J. Liu and J. Sun. A temporal desynchronization resilient video watermarking scheme based on independent component analysis. In IEEE ICIP'05. IEEE.
[18] P. Nguyen and S. Baudry. Tatouage direct de flux mpeg-2. In CORESA'00, 2000.
[19] X. Niu, M. Schmucker, and C. Busch. Video watermarking resisting to rotation, scaling and translation. In Proc. SPIE, Security and Watermarking of Multimedia Contents IV, volume 4675, pages 512-519. SPIE, 2002.
[20] E. Sayrol, M. Soriano, M. Fernandez, J. Casanellas, and J. Tomas. Development of a platform offering video copyright protection and security against illegal distribution. In IS&T/SPIE International Symposium on Electronic Imaging 2005, volume 5681 of Proceedings of the SPIE, pages 76-83. SPIE, 2005. Security, Steganography, and Watermarking of Multimedia Contents VII.
[21] I. Setyawan, G. Kakes, and R. Lagendijk. Synchronization-insensitive video watermarking using structured noise pattern. In Proc. SPIE, Security and Watermarking of Multimedia Contents IV, volume 4675, pages 520-529. SPIE, 2002.
[22] M. Swanson, B. Zhu, and A. Tewfik. Multiresolution scene-based video watermarking using perceptual model. IEEE journal on selected areas in communications, 16(4):540-550, 1998.
[23] M. Taniguchi. Scaling detection method for watermarked mpeg content. In IEEE ICIP'05. IEEE.
[24] T. Vynne and F. Jordan. Embedding a digital signature in a video sequence using motion vectors. In IEEE ICIP'96. soumis.
[25] T. Vynne and F. Jordan. Embedding a digital signature in a video sequence. US patent 5,960,081, septembre 1999. http://www.freepatentsonline.com/5960081.html.
[26] J. Zhao and E. Koch. Embedding robust labels into images for copyright protection. In International Congress on Intellectual Property Rights for Specialized Information, Knowledge and New Technologies - KnowRight'95, Schriftenreihe der Österreichischen Computer Gesellschaft, Band 82, pages 242-251. Oldenbourg, 1995.
[27] Y. Zhao and R. Lagendjik. Video watermarking scheme resistant to geometric attacks. In IEEE ICIP'02, volume 2, pages 145-149. IEEE, 2002.
[28] W. Zhu, Z. Xiong, and Y. Zhang. Multiresolution watermarking for images and video: a unified approach. In IEEE ICIP'98, volume 1, pages 465-469. IEEE, 1998.


Tatouage robuste : Audio

La représentation de données audio est très différente de celle de données visuelles, et le fonctionnement de l'oreille est par certains aspects mieux maîtrisé que celui de l'oeil. Les modèles psycho-acoustiques sont par exemple plus précis que les modèles psycho-visuels, et l'inaudibilité bien mieux maîtrisée que l'invisibilité. On travaille habituellement en audio sur des fenêtres d'analyse, qui sont tout simplement des tranches successives de signal, de taille fixée (environ 20 ms) ; cette approche se retrouve aussi en tatouage. A l'échelle d'une fenêtre, le signal est considéré comme modélisable par un processus aléatoire stationnaire. Remarquons enfin que d'une fenêtre à la suivante, la puissance dud signal peut varier très fortement (jusqu'à 50 dB pour de la parole, 90 dB pour de la musique). Notons également que les signaux de parole sont plus structurés et mieux modélisés que les signaux musicaux.

1  Tatouage de signal audio non compressé

Parmi les toutes premières techniques proposées, on peut citer [7,6]. On trouve également dans [14] une présentation de l'analogie entre le tatouage et un système de communication standard. Elle ressemble à [6] car elle utilise aussi une modulation et de l'étalement de spectre, mais elle s'en distingue par le fait qu'elle n'est pas additive. Son principe est le suivant : les composantes spectrales du signal qui se trouvent en-dessous du seuil de masquage sont remplacées par des composantes de tatouage. La puissance du tatouage ainsi obtenu est faible, ce qui est un bon point pour l'inaudibilité, mais un auvais point pour la résistance aux distorsions. Néanmoins, dans le cas où la robustesse ne serait pas un objectif en soi, cette méthode est très performante. On peut également citer [15], qui propose tout d'abord de calculer, pour chaque fenêtre d'analyse, un premier vecteur obtenu par une transformation temps/fréquences à recouvrement (modulated lapped transform) ; on génère ensuite un second vecteur de même taille, composé d'une suite de valeurs±∆, générée à partir d'une séquence PN ; ce deuxième vecteur est ensuite additionné aux modules des somposantes du premier vecteur, exprimés en dB. Cette proposition s'appuie sur des études psychiacoustiques (loi de Weber). On applique enfin la transformée invers pour retomber dans le domaine temporel. La détection consiste en une mesure de corrélation entre la séquence PN prétendument utilisée. Dans sa version simple, le schéma est très sensible aux distorsion asynchrones, mais les auteurs ont introduit un mécanisme permettant de rendre cette technique très robuste. La contrepartie est un débit faible (1 bit par seconde au maximum).
Une technique complètement différente a été proposée dans [5] : son principe est d'insérer de l'information par l'intermédiaire d'un écho. On sait en effet que si le même signal audio est répété dans un court intervalle de temps, l'oreille n'en entendra qu'un seul, et l'inaudibilité du filigrane est donc maîtrisée. C'est le retard introduit (suffisamment long pour être significatif, mais pas trop pour ne pas être entendu) qui va caractériser l'information binaire qui est cachée. L'inconvénient est qu'il faut pouvoir obtenir des informations précises sur des intervalles de temps faibles. Les auteurs montrent que les mesures d'autocovariance ne sont pas assez précises, et proposent l'utilisation de méthodes cepstrales (qui sont classiques en traitement de la parole). Deux études complètent ces travaux [26,16], mais il est difficile d'estimer précisément la performance de cette technique.
On peut encore citer [4], qui propose de modifier les bits les moins significatifs d'une version quantifiée des échantillons du signal audio. Malheureusement, cette méthode n'a pas été testée expérimentalement, et on ne sait donc rien de sa robustesse.
Enfin, [27] propose d'additionner le signal original à sa version retardée, blanchie et spectralement mise en forme. L'information à transmettre module le retard. Lors de l'extraction, le signal tatoué est blanchi puis la mesure du maximum d'autocorrélation permet de déterminer le retard introduit, et donc le message.
Certains travaux se sont focalisés sur les signaux de la parole, qui présentente des caractéristiques particulières, et sont notamment plus faciles à modéliser. On peut citer [8,19,20].


Pour terminer ce paragraphe, mentionnons le schéma asymétrique présenté dans [12], qui fut ensuite adapté aux signaux audio [13]. Le principe est le suivant : une densité spectrale de puissance connue, fortement colorée, est imposée au signal servant de base au filigrane ; les échantillons dans la fenêtre d'analyse sont alors permutés pseudo-aléatoirement par un entrelaceur et le signal est blanchi. Le filigrane, obtenu par mise en forme spectrale du signal blanchi d'après un seuil de masquage, est alors additionné au signal audio. Lors de la détection, on commence par appliquer un filtre de Wiener au signal tatoué, ce qui nous donne, après désentrelacement, une estimation du filigrane. Cette opération rétablie les propriétés spectrales du filigrane. Ainsi, soit le signal n'a pas été tatoué et on observe un signal blanc, soit il a été tatoué et la densité spectrale de puissance du filigrane estimé contient une composante constante et une composante fortement colorée (proportionnelle à la densité spectrale de puissance du filigrane inséré). La connaissance dont le détecteur a besoin, et qui constitue ici une donnée publique, est la densité spectrale de puissance du filigrane que l'on s'attend à trouver. La clé privée est le filigrane lui-même. Et comme la densité spectrale de puissance ne donne pas d'information sur la phase du filigrane, il est impossible à un attaquant de retrouver le filigrane pour essayer de l'enlever. Cette méthode est particulièrement intéressante par cette caractéristique asymétrique, mais reste très sensible à des distorsions asynchrones, à cause de la présence de l'entrelaceur. Ces résultats ont ensuite été améliorés dans [10], qui a proposé comme transformation non inversible, liant la clé privée et la clé publique, le passage d'un signal cyclostationnaire à sa cyclofréquence. Grâce à ce m"canisme, on montre qu'il est possible de cacher simultanément dans le signal audio des données publiques et des données privées, avec des taux d'erreur et des débits tout à fait réalistes.

2  Tatouage de signal audio compressé

Une première solution a été proposée pour insérer un filigrane directement dans un flux compressé au format MPEG-2 AAC [17]. L'insertion consiste en la modification de facteurs d'échelle dans le train binaire. Comme l'attaquant ne sait pas quels facteurs d'échelle ont servi, il ne peut attaquer le filigrane dans le domaine comprimé (il pourrait essayer au hasard, mais cela ne suffirait pas, ou entrainerait une dégradation importante du document). Par contre, le filigrane disparait dès que l'on décompresse le signal. Une autre technique opérant sur le flux MPEG-2 AAC insère le filigrane dans les coefficients de la MDCT (transformée en cosinus discrète modifiée), et dans ce cas le filigrane résiste à la décompression [24].

3  Tatouage informé

Une première proposition d'un schéma de tatouage informé pour l'audio a été présentée dans [9]. Les auteurs de [2] comparent deux autres stratégies : [22] et [21]. On peut également citer les travaux très récents présentés dans [25].

4  Spécificité face aux distorsions asynchrones

On ne peut ici se contenter d'insérer un motif connu pour resynchroniser le signal lors de la détection, notamment parce que les fréquences d'horloge des processeurs utilisés lors de l'insertion et de la détection peuvent être légèrement différentes. Si on prend l'exemple de deux PC, la dérive dues aux caractéristiques différentes des quartz revient à perdre ou rajouter environ un échantillon tous les 2500, ce qui est très fréquent. Il faut donc obligatoirement prévoire une procédure de resynchronisation locale. Notons de plus que les signaux audio sont souvent soumis à un time stretching lors de leur radiodiffusion : il s'agit de faire varier la vitesse de lecture d'un signal, tout en conservant sa tonalité, afin d'adapter le temps de diffusion au temps disponible. Cette opération est redoutable, et le filigrane doit y faire face. Des solutions proposées pour améliorer la robustesse des techniques de tatouage audio face à de telles manipulations sont [23,11,1,3].

5  Autres approches

D'autres approches et considérations ont débouché sur des réusltats intéressants, comme [28,18].

References

[1] C. Baras. Etude de la mise en forme de l'information binaire dans un système de tatouage audio. Technical report, ENST Paris, mémoire de DEA, 2002.
[2] C. Baras, N. Moreau, and P. Dymarski. Comparative study of two informed embedding strategies for audio spread-spectrum data hiding systems. In EUSIPCO 2005, 2005.
[3] C. Baras, N. Moreau, and B. Zayen. Mécanisme de synchronisation en tatouage audio pour des perturbations désynchronisantes à forte dérive. In GRETSI 2005, 2005.
[4] P. Bassia and I. Pitas. Robust audio watermarking in the time domain. In EUSIPCO'98, pages 25-28, 1998.
[5] W. Bender, D. Gruhl, N. Morimoto, and A. Lu. Techniques for data hiding. IBM Systems Journal, 35(3/4):313-336, 1996.
[6] L. Boney, A. Tewfik, and K. Hamdy. Digital watermarks for audio signals. In IEEE ICMCS'96, pages 473-480. IEEE, 1996.
[7] P. Bourcet, D. Masse, and B. Jahan. Système de diffusion de données. brevet d'invention numéro 95 06727, Télédiffusion De France, 1995.
[8] Q. Cheng and J. Sorensen. Spread spectrum signaling for speech watermarking. In IEEE ICASSP'01, volume 3, pages 1337-1340, 2001.
[9] J. Chou, K. Ramchandran, and A. Ortega. Next generation techniques for robust and imperceptible audio data hiding. In IEEE ICASSP'01, volume 3, pages 1349-1352. IEEE, 2001.
[10] L. de Campos Teixeira Gomes. Tatouage audio. PhD thesis, Université Paris 5, 2002.
[11] L. de Campos Teixeira Gomes, E. Gomez, M. Bonnet, and N. Moreau. Resynchronization methods for audio watermarking. In 110th convention of the AES, 2001.
[12] T. Furon and P. Duhamel. An asymmetric public detection watermarking technique. In International Workshop on Information Hiding - WIH'99, number 1768 in Lecture Notes in Computer Science, pages 88-100. Springer-Verlag, 2000.
[13] T. Furon, N. Moreau, and P. Duhamel. Audio public key watermarking technique. In IEEE ICASSP'00, volume 4, pages 1959-1962. IEEE, 2000.
[14] R. Garcia. Digital watermarking of audio signals using psychoacoustic auditory model and spread spectrum theory. In 107th convention of AES, 1999.
[15] D. Kirovski and H. Malvar. Robust spread spectrum audio watermarking. In IEEE ICASSP'01, volume 3, pages 1345-1348. IEEE, 2001.
[16] B. Ko, R. Nishimura, and Y. Suzuki. Time-spread echo method for digital audio watermarking using pn sequences. In IEEE ICASSP'02, volume 2, pages 2001-2004. IEEE, 2002.
[17] J. Lacy, S. Quackenbush, A. Reibman, D. Shur, and J. Snyder. On combining watermarking with perceptual coding. In IEEE ICASSP'98, volume 6, pages 3725-3728. IEEE, 1998.
[18] S. Larbi and M. Jaidane-Saidane. Audio watermarking: a way to stationnarize audio signals. IEEE Transactions on Signal Processing, 53(2):816-823, 2005. numéro spécial "Supplement on Secure Media II".
[19] J. Liénard. Transmission d'un message numérique caché dans un signal audio. In 18e colloque sur le traitement du signal et des images - GRETSI'01, 2001.
[20] A. LoboGuerrero, J. Liénard, and P. Bas. Implémentation d'un système de tatoauge pour la transmission de données. In Journées d'étude sur la parole, 2002.
[21] H. Malvar and D.A.F. Florêncio. Improved spread spectrum: A new modulation technique for robust watermarking. IEEE Transactions on Signal Processing, 51(4):898-905, 2003. numéro spécial ßignal processing for data hiding in digital media and secure content delivery".
[22] M. Miller, G. Doërr, and I. Cox. Applying informed coding and embedding to design a robust, high capacity watermark. IEEE Transactions on Image Processing, 13(6):792-807, 2004.
[23] N. Moreau, P. Dymarski, and L. de Campos Teixeira Gomes. Tatouage audio : une réponse à une attaque désynchronisante. In 6e journées d'études et d'échanges ; compression et représentation des signaux audiovisuels, 2000.
[24] C. Neubauer and J. Herre. Audio watermarking of mpeg-2 aac bit streams. In 108th convention of the AES, 2000.
[25] F. O'Donovan, N. Hurley, and G. Silvestre. An investigation of robustness in nonlinear audio watermarking. In IS&T/SPIE International Symposium on Electronic Imaging 2005, volume 5681 of Proceedings of the SPIE, pages 769-778. SPIE, 2005. Security, Steganography, and Watermarking of Multimedia Contents VII.
[26] H. Oh, J. Seok, J. Hong, and D. Youn. New echo embedding technique for robust and imperceptible audio watermarking. In IEEE ICASSP'01, volume 3, pages 1341-1344. IEEE, 2001.
[27] J. Seok and J. Hong. Prediction-based audio watermark detection algorithm. In 109th convention of AES, 2000.
[28] A. Takahashi, R. Nishimura, and Y. Suzuki. Multiple watermarks for stereo audio aignals using phase-modulation techniques. IEEE Transactions on Signal Processing, 53(2):806-815, 2005. numéro spécial "Supplement on Secure Media II".


Tatouage robuste : Textes, programmes

Textes

Cacher de l'information dans un texte est à la fois facile et difficile. Tout dépend ce que l'on entend par "texte ". S'il s'agit d'une image contenant un texte, c'est-à-dire d'un rendu graphique avec une mise en page, un choix particulier de police, ... alors on peut par exemple jouer sur ce rendu, et modifier légèrement les espaces entre les mots, le dessin des caractères. Ceci se rapproche d'ailleurs du cas de certaines images ressemblant plutôt à des dessins avec de nettes lignes de couleur (bande dessinée de type "ligne claire ", ou encore carte routière) : il est facile de modifier légèrement le tracé sans que cela ne gène l'utilisation du document.
D'un autre côté, si le texte est uniquement une suite brute de caractères ascii, alors c'est un peu plus délicat. On peut éventuellement rajouter des espaces à la fin des lignes, mais ce n'est pas très pratique. Une solution est alors de choisir certains mots, afin de donner une structure particulière au document (un profil statistique particulier, par exemple). C'est d'ailleurs un moyen utilisé depuis longtemps pour faire de la stéganographie dans un contexte militaire : certains mots ou certaines phrases ont une signification particulière, fournie par un dictionnaire (que les deux protagonistes possèdent, et qui sert de clé secrète).

Programmes

Très peu de personnes se sont penchés sur le tatouage de programmes. On peut néanmoins citer [5], qui propose une solution pour tatouer du code assembleur. Le programme peut avoir été écrit dans un autre langage (du C par exemple), mais le tatouage n'est appliqué que sur sa version en assembleur. L'idée est la suivante : l'information à cacher est une distribution de fréquence des instructions assembleur particulière (correspondant par exemple à l'auteur du programme). Le programme a été écrit sans tenir compte de ces distribution, mais l'insertion va consister en la substitution de certains bouts de codes par d'autres, au comportement équivalent, et qui vont façonner le code pour lui donner la distribution requise. Certes le code ainsi obtenu ne sera pas optimal, mais ce n'est pas l'objectif recherché ici. Ce tatouage est relativement robuste face à la réorganisation de code (qui ne modifie pas es statistiques), et son seul vrai ennemi est la décompilation-recompilation qui donnera un code aux propriétés différentes. Ce travail a inspiré les auteurs de [1,3,2]. On peut également citer un travail traitant du fingerprinting de logiciels [4] et une page web qui recense les publications sur ce sujet (http://www.cs.auckland.ac.nz/~jas/bibliography/software-watermarking.html).

References

[1] C. Collberg and C. Thomborson. Software watermarking: Models and dynamic embeddings. In Principles of Programming Languages 1999, POPL'99, pages 311-324, 1999.
[2] D. Curran, N. Hurley, and M. O'Cinnéide. Securing java through software watermarking. In PPPJ '03: Proceedings of the 2nd international conference on Principles and practice of programming in Java, pages 145-148. Computer Science Press, 2003.
[3] J. Nagra, C. Thomborson, and C. Collberg. A functional taxonomy for software watermarking. In CRPITS'02: Proceedings of the twenty-fifth Australasian conference on Computer science, pages 177-186. Australian Computer Society, 2002.
[4] J. Pieprzyk. Fingerprints for copyright software protection. In ISW '99: Proceedings of the Second International Workshop on Information Security, pages 178-190. Springer-Verlag, 1999.
[5] J. Stern, G. Hachez, F. Koeune, and Q. J.-J. Robust object watrmarking: application to code. In Information Hiding 1999, number 1768 in Lecture Notes in Computer Science, pages 368-378. Springer Verlag, 1999.