Interview de Daniel HAGIMONT, la gestion des ressources de calcul dans les datacenters

Nous publions la deuxième vidéo de la série d’interviews présentant des travaux de recherche de nos différents départements. Daniel HAGIMONT, professeur IRIT-INPT au sein du département Architecture, Systèmes, Réseaux (ASR) – équipe SEPIA, nous parle de ses recherches dans le domaine de la gestion des ressources de calcul dans les datacenters. Les enjeux ? Construire des systèmes capables de gérer la complexité des infrastructures actuelles et limiter la consommation énergétique.

Qu’est-ce qu’un système d’exploitation ?

Il s’agit d’une couche logicielle (software) qui facilite l’utilisation du matériel (hardware). La mission d’un système d’exploitation est de gérer de manière efficace les ressources et les applications d’un ordinateur. Aujourd’hui, il y a une demande forte centrée sur la puissance des machines, liée au développement de nouvelles applications gourmandes en ressources, notamment dans les domaines de l’intelligence artificielle et du big data. Les systèmes d’exploitation doivent donc s’adapter à cette évolution. La grande révolution de ces dernières années a été de ne plus construire de grands ordinateurs mais de rassembler une grande puissance de calcul en agglomérant un ensemble d’ordinateurs interconnectés par un réseau. Cela correspond à la naissance des data centers, parcs informatiques sur lesquels se concentre la recherche actuelle.

Quels sont les enjeux actuels de ce domaine de recherche ?

La naissance des data centers pose des problématiques particulières. Le premier problème est de construire des systèmes suffisamment puissants pour gérer efficacement les ressources de calcul colossales des data centers. Certains géants du numérique et grandes entreprises ont leurs propres data centers mais d’autres acteurs font le choix du cloud computing, c’est-à-dire la mise à disposition de serveurs pour des clients (OVH par exemple). Le deuxième problème concerne le gaspillage des ressources énergétiques et donc la recherche de solutions permettant l’optimisation de la gestion de ces ressources. L’objectif des recherches de Daniel HAGIMONT est, entre autres, de trouver des solutions pour déplacer des applications sur un nombre restreints d’ordinateurs pour limiter la consommation d’énergie et optimiser la performance globale de l’infrastructure (load balancing). C’est une sorte de compactage des applications. Aujourd’hui, l’enseignant-chercheur explique qu’il est nécessaire de mettre ces ressources de calcul à disposition des utilisateurs (edge computing). L’enjeu des recherches dans ce domaine est donc de construire des systèmes capables de gérer ces infrastructures complexes.