Équipe RDI

Recherche et Développement en technologies de l’Information

Avec la croissance des réseaux de capteurs, des journaux Web, des réseaux sociaux ou encore des applications interconnectées, le volume des données générées en continu, à grande vitesse, et sous différents formats, dépasse les capacités de traitement des technologies traditionnelles.

 

L’équipe RDI s’attache à définir, au travers de cas d’études, de nouvelles approches nécessaires à la gestion des ressources, à l’analyse et à la visualisation des données ainsi qu’aux méthodes d’apprentissage artificiel.

Détection de communautés dans les réseaux sociaux

Les réseaux sociaux – FaceBook, Twitter, Flickr, Linkedln, … – ont connu un développement énorme ces dernières années, tant en taille qu’en complexité, ce qui rend difficile, voire impossible, leur analyse directe.

 

L’équipe RDI développe des méthodes de partitionnement des réseaux sociaux, afin de détecter des communautés et comprendre leur structure.

 

Identifier la structure communautaire des réseaux complexes permet d’extraire des fonctionnalités utiles à la visualisation ou la prédiction de phénomènes tels que la diffusion d’information, mais également de déterminer les centres névralgiques afin de les sécuriser.

 

Apprentissage artificiel pour l’analyse d’images satellites

Avec l’afflux de données satellite, l’analyse et l’interprétation automatique d’images très haute résolution est devenue une thématique majeure avec de nombreuses applications : cartographie automatique, détection automatique d’objets, étude et suivi de changements urbains ou environnementaux, etc.

 

L’équipe RDI travaille sur la conception de méthodes d’apprentissage artificiel afin d’automatiser les traitements de ces images.

 

Il s’agit de concevoir, adapter et combiner des méthodes d’apprentissage non-supervisées et des méthodes de classification à base de réseaux de neurones profonds.

Distribution des flux de données sémantiques

Les réseaux de capteurs de distribution d’eau potable, les réseaux sociaux ou encore les informations de géolocalisation fournissent des données par nature hétérogènes.

 

Afin de pouvoir généraliser les traitements, il devient indispensable de traduire les données dans un langage commun.

 

Les technologies du Web 3.0, appelé aussi Web de données, permettent de traduire les flux de données massifs en flux sémantiques, afin de les homogénéiser et de faciliter des traitements plus poussés tels que le raisonnement ou l’inférence.

Pour traiter en temps réel des volumes importants de flux sémantiques, l’équipe RDI travaille également sur des algorithmes optimisés de distribution des données et des traitements.

Systèmes de recommandation

Les systèmes de recommandations permettent de conseiller à un internaute des produits qu’il pourrait aimer en fonction de son profil, de son historique de navigation ou encore de son comportement virtuel sur la toile.

 

L’équipe RDI travaille sur des méthodes recommandation favorisant le passage à l’échelle (Big Data) et répondant au défi du démarrage à froid, ou que recommander à un utilisateur inconnu.

 

Le projet « Solimobile » a permis de recommander des services à des personnes dans le besoin via des annuaires personnalisés. Le projet « Fiora » vise une recommandation personnalisée en e-nutrition et e-tourisme à travers la mise en place d’un système hybride combinant le filtrage collaboratif et le raisonnement à base de cas.

Gestion des ressources dans les systèmes de vélos en libre service

Les systèmes de vélos en libre service sont un moyen de transport écologique par excellence mais la disponibilité des ressources – que soit les vélos eux mêmes, ou les places libres dans les stations – peut s’avérer difficile à gérer.

L’équipe RDI travaille sur l’amélioration de la fiabilité et de l’attractivité de ces systèmes.

En s’appuyant sur l’analyse des données massives issues des trajets Vélib’ (le système de vélos en libre service parisien) sur plusieurs années, l’équipe RDI s’intéresse au problème de déséquilibre de certaines stations dû à leur forte attractivité, au dimensionnement du parc de vélos, et à l’influence de l’introduction de vélos électriques.

Gestion des ressources d’un cloud

Les plate-formes de « cloud computing » représentent aujourd’hui un pan entier de l’économie numérique. Ces systèmes agrègent les ressources informatiques (stockage, calcul) dans des centres de données, concentrant des milliers de machines en un seul lieu.

 

L’allocation des ressources matérielles aux applications est un enjeu majeur des systèmes cloud, impactant leur consommation électrique.

 

En s’appuyant sur des techniques de classification et d’optimisation distribuées, l’équipe RDI travaille sur la création d’ordonnanceurs efficaces capables de gérer l’allocation des ressources en anticipant les changements et les périodes de forte ou faible consommation afin de minimiser le nombre de machines utilisées dans ces centres.