IG.3505 Signal et Multimédia (5 crédits)
Pré-requis : IG.2401, IG.2403
Niveau : Avancé
Responsable du module : Maria Trocan
Déroulement :
- Cours : 33 heures + travail personnel : 30 heures ;
- TP (encadrement projet) : 12 heures;
- Projet : 50 heures non-encadrées.
Nbre d'heures : 125h
Evaluation : Examen, projet.
Contexte
On s’intéresse dans ce module aux aspects traitement du signal dans les applications multimédia. Trois thèmes sont abordés :
- Codage de source et normes pour l’archivage et la transmission de contenus multimédia.
- Traitement automatique du langage naturel : reconnaissance de la parole et synthèse vocale.
- Représentation et traitement de connaissances : comment extraire des descripteurs qui permettent de caractériser des images, des vidéos, de la musique ? Comment stocker et indexer les informations ? Comment intégrer ces informations dans des moteurs de recherche ?
Objectifs
Il s’agit dans un premier temps de maîtriser l’utilisation de systèmes mettant en œuvre des contenus multimédia et/ou des interfaces vocales, ensuite les compétences évoluent vers la conception de tels systèmes et l’initiation à la recherche. Dans ce contexte, l’étudiant sera amené à :
- comprendre et réaliser des études bibliographiques,
- analyser le problème posé en prenant en compte les spécifications et les contraintes,
- choisir parmi plusieurs sous-systèmes pour pouvoir concevoir une architecture multimédia,
- maîtriser les phases de conception et de validation du système,
- comprendre les problématiques du domaine, les limites des solutions proposées… cette analyse pouvant mener à des projets de recherche.
Concepts
- Encodage et normes multimédia : panorama des principes de codage et des normes pour l’archivage et la transmission.
- Représentation et traitement des connaissances : représentations des connaissances, bases de données, indexation, recherche de contenus multimédia.
- Traitement automatique du langage naturel: reconnaissance vocale, synthèse vocale
Savoir-faire
- Edition de contenus multimédia: transcodage avec des différents codeurs, extraction des flux audio/vidéo, utilisation de modules d’analyse vocale et de synthétiseurs de voix, indexation de contenu avec des outils spécifiques.
Bibliographie
- Watkinson, MPEG Handbook: MPEG-1, MPEG-2, MPEG-4, Focal Press
- Blanken, Multimedia Retrieval, Springer Verlag
- Bilbao, Numerical Sound Synthesis, John Wiley and Sons LTD
|