Home Formations et programmes Formation Ingénieur voie classique Paris Module IG.3505

Module IG.3505

Imprimer

IG.3505 Signal et Multimédia (5 crédits)

Pré-requis : IG.2401, IG.2403

Niveau : Avancé

Responsable du module : Maria Trocan

Déroulement :

  • Cours : 33 heures + travail personnel : 30 heures ;
  • TP (encadrement projet) : 12 heures;
  • Projet : 50 heures non-encadrées.

Nbre d'heures : 125h

Evaluation : Examen,  projet.

Contexte

On s’intéresse dans ce module aux aspects traitement du signal dans les applications multimédia. Trois thèmes sont abordés :

  • Codage de source et normes pour l’archivage et la transmission de contenus multimédia.
  • Traitement automatique du langage naturel : reconnaissance de la parole et synthèse vocale.
  • Représentation et traitement de connaissances : comment extraire des descripteurs qui permettent de caractériser des images, des vidéos, de la musique ? Comment stocker et indexer les informations ? Comment intégrer ces informations dans des moteurs de recherche ?

Objectifs

Il s’agit dans un premier temps de maîtriser l’utilisation de systèmes mettant en œuvre des contenus multimédia et/ou des interfaces vocales, ensuite les compétences évoluent vers la conception de tels systèmes et l’initiation à la recherche. Dans ce contexte, l’étudiant sera amené à :

  • comprendre et réaliser des études bibliographiques,
  • analyser le problème posé en prenant en compte les spécifications et les contraintes,
  • choisir parmi plusieurs sous-systèmes pour pouvoir concevoir une architecture multimédia,
  • maîtriser les phases de conception et de validation du système,
  • comprendre les problématiques du domaine, les limites des solutions proposées… cette analyse pouvant mener à des projets de recherche.

Concepts

  • Encodage et normes multimédia : panorama des principes de codage et des normes pour l’archivage et la transmission.
  • Représentation et traitement des connaissances : représentations des connaissances, bases de données, indexation, recherche de contenus multimédia.
  • Traitement automatique du langage naturel: reconnaissance vocale, synthèse vocale

Savoir-faire

  • Edition de contenus multimédia: transcodage avec des différents codeurs, extraction des flux audio/vidéo, utilisation de modules d’analyse vocale et de synthétiseurs de voix, indexation de contenu avec des outils spécifiques.

Bibliographie

  • Watkinson, MPEG Handbook: MPEG-1, MPEG-2, MPEG-4, Focal Press
  • Blanken, Multimedia Retrieval, Springer Verlag
  • Bilbao, Numerical Sound Synthesis, John Wiley and Sons LTD