L’équipe de recherche Vertigo s’intéresse aux problèmes soulevés par la gestion de données à grande échelle, avec une orientation forte vers des données dont la structure, explicite ou non, est complexe et nécessite des techniques spécifiques d’approximation, d’extraction et d’interrogation. Il s’agit de collections d’images, de vidéos, de documents audios ou musicaux. Nos objectifs généraux sont d’extraire de l’information, de construire des techniques d’accès efficaces et de proposer de nouvelles méthodes de gestion de données basées sur le contenu (par opposition aux méta-données décrivant ce contenu).
Axe 1. Grandes bases dimages et de vidéos
Ces recherches s’inscrivent dans un contexte caractérisé par une croissance explosive de la production de contenus numériques, une révolution du stockage numérique (permettant de conserver – facilement accessibles – des masses de contenus au-delà de l’utilisation pour laquelle ils avaient été produits ou collectés au départ) et le développement rapide des capacités de transmission numérique, qui rend possible la diffusion distribuée et le partage à distance de grands volumes de contenus. Nous nous concentrons sur la structuration, à partir du contenu visuel, de grandes bases d’images et de vidéos, ainsi que sur la recherche par le contenu dans de telles bases. Nos travaux récentes s’intéressent à l’apprentissage profond dans le domaine de l’image pour la détection des motifs visuels et pour la segmentation sémantique, avec une tendance d’évolution vers le l’analyse sémantique des scènes en prenant en compte les relations structurelles à différents niveaux de localité. Ces approches s’appliquent d’ailleurs très bien aux données de nature différente, comme les données musicales, qui combinent des structures à différentes échelles et sont en général caractérisées par des nombres relativement faibles de données étiquetées par classe.
Axe 2. Informatique musicale
Ces recherches se proposent d’étudier la production de modèles de langages musicaux caractérisant des corpus homogènes de musiques disponibles sous forme symbolique (partitions). Notre perspective est d’enrichir une approche statistique basée sur les données explicites (notes) par un processus d’extraction de connaissances identifiant les éléments du langage musical présents implicitement dans la notation : segmentation en phrases, présence et utilisation de motifs, gestion des dissonances, des cadences, instrumentation et texture. Une autre direction de recherche est le développement de techniques de transcription automatique, conversion d’une performance musicale vers une partition en notation traditionnelle par des modèles de partitions a priori (indépendants de la performance à transcrire), représentant le langage des notations musicales possibles. Ce sont des modèles de langage, composantes essentielles des procédures de traduction automatique ou de reconnaissance des motifs (par analogie avec le traitement de langues).