Analyse des images et des sons numériques

Code UE : NSY122

  • Cours + travaux pratiques
  • 6 crédits
  • Volume horaire de référence
    (+ ou - 10%) : 50 heures

Responsable(s)

Marin FERECATU

Public, conditions d’accès et prérequis

Ce cours est destiné aux élèves ayant le niveau de fin de cycle préparatoire ou celui d'une licence en informatique ou en mathématiques.
Il est fortement conseillé pour suivre le parcours Conception d'Applications Multimédias (UE RSX205 et RSX206).

Objectifs pédagogiques

A l'heure où la technologie numérique permet de produire, stocker et disséminer des volumes de plus en plus importants de données multimédia, automatiser l'analyse et la recherche dans ces contenus numériques est devenu un enjeu crucial pour bon nombre d'applications. Les lacunes des approches de recherche textuelle (ambiguïté et subjectivité des mots-clé, passage à l'échelle de l'annotation manuelle irréalisable) ont conduit à la mise en place de techniques d'analyse automatique des contenus audiovisuels.
Ce cours vise à faire connaître et à manipuler les solutions actuelles à la problématique de l'analyse des contenus audiovisuels. Il commence par rappeler les bases de traitement du signal communes à l'image (fixe et animée) et au son. Puis il introduit les outils mathématiques, algorithmiques et informatiques d'analyse automatique du contenu des images, des vidéos et des sons. Les différentes techniques présentées auront pour finalité la reconstruction 3D de scènes ou d'objets, le suivi de mouvements, la reconnaissance d'objets et la reconnaissance vocale.
Cette année, les applications industrielles présentées concernent la vidéo-surveillance, l'aide à l'annotation de documents audiovisuels, la détection de copies pour le problème des droits d'auteurs, l'identification biométrique et plus généralement la recherche d'information dans les bases de données multimédia (web, archives professionnelles ou grand public) par analyse du contenu.

Compétences visées

Le cours permet d'acquérir les bases mathématiques et algorithmiques d'analyse des images (fixes et animées) et des sons numériques, de comprendre et manipuler les outils associés ainsi que de connaître les solutions actuelles à la recherche d'information dans les contenus audiovisuels.

Contenu

  • Bases du traitement du signal
    • Représentation du signal, Transformée de Fourier
    • Filtres linéaires, non linéaires et convolution
    • Échantillonnage et quantification
  • Analyse des images
    • Acquisition et représentation de la couleur
    • Filtrage : lissage, amélioration
    • Extraction de primitives : détection de contours, extraction de points d'intérêt, segmentation en régions, approximations
    • Vision pré-attentive, focalisation d'attention
    • Appariement de primitives, suivi de primitives dans les vidéos
    • Application à la reconstruction 3D, à la reconnaissance d'images, au suivi et à la reconnaissance d'objets
  • Analyse des sons
    • Représentation et caractérisation du signal sonore
    • Perception du son : niveaux sonores, hauteur tonale, timbre, spatialisation
    • Extraction de primitives : segmentation temporelle, séparation des sources
    • Reconnaissance vocale

Modalité d'évaluation

Examen écrit et TP (projet)

Bibliographie

  • M. Bellanger : Traitement numérique du signal, Sciences Sup, Dunod 2012
  • R. Belaroussi : Traitement de l'image et de la vidéo, Ellipses Marketing, Technosup 2010
  • D. Lingrand : Introduction au traitement d'images, Vuibert, 2ème édition 2008
  • R. Horaud & O. Monga : Vision par Ordinateur - Outils fondamentaux, Ed. Hermès, 1995
  • D. Forsyth & J. Ponce : Computer Vision - A modern approach, Prentice Hall, 2012
  • R. Gonzalez & R. Woods : Digital Image Processing, Pearson, 2007
  • Collectif Vuibert : Encyclopédie de l'informatique et des systèmes d'information, Vuibert, 2006
  • S.D. Stearns & D.R. Hush : Digital Signal Analysis, 2nd Ed., Prentice-Hall, 1990
  • A.V. Oppenheim & R.W. Schafer : Digital Signal Processing, Prentice-Hall, 1975
  • D. Wang & G. Brown : Computational Auditory Scene Analysis: Principles, Algorithms And Applications, Wiley-IEEE Press, 2006

Contact

EPN05 - Informatique
33.1.13A, 2 rue Conté
75003 Paris
Tel :01 40 27 28 49
Mariella Annicchiarico

Voir le calendrier, le tarif, les conditions d'accessibilité et les modalités d'inscription dans le(s) centre(s) d'enseignement qui propose(nt) cette formation.

Enseignement non encore programmé