DOSSIER - VBCORP.FR

ACCUEIL > ARTICLE > DOSSIER > GRILLE DE CALCUL
Alexandre
L'informatique tient une place très importante dans le monde de la recherche. Que ce soit en médecine ou en physique des particules, les simulations des chercheurs demande toujours plus de puissance de calcul. C'est pour répondre à cette demande que la Grille à été inventé.
<?php echo $vb_article->getTitre() ?>

Sommaire:

  1. 1. Introduction aux griles

  2. 2. Différentes incarnations de grilles informatique

  3. 3. Les grilles de calcul

 

     Pour débuter ce dossier consacré à la grille, il me parait nécessaire d’en donner une définition afin de cadrer le sujet. Bien qu’il n’existe pas de définition officielle, je vais tenter d’en donner une qui se rapproche au plus de la réalité:

     Une grille est une infrastructure constituée d’un ensemble de ressources partagées, distribuées, hétérogènes, délocalisées et autonomes.
     Quelque soit sa nature, une grille est composée de deux éléments principaux, la ressource à partager et une interface utilisateur pour permettre l’accès à cette dernière.

1. Introduction aux griles

     Avant de parler des grilles informatique, nous pouvons remarquer que tout le monde utilise inconsciemment une grille au quotidien, certainement l’une des premières crée par l’homme : le réseau électrique.
    En effet, le réseau électrique s’inscrit parfaitement dans le cadre de la définition donnée plus haut. Dans ce cas, la ressources partagée et distribuée mise à la disposition des utilisateurs est l’électricité. Cette ressource est bien hétérogène car constituée aussi bien de parc éolien que de centrale nucléaire, délocalisée car ces centrales sont présentes partout sur le territoire et autonome car la panne d’un générateur ne modifie pas la comportement des autres.
Pour accéder a ces ressources, les utilisateurs on recourt à une prise de courant ( qui n’est rien de plus que l’interface utilisateur ). Cette grille utilisée au quotidien se comporte exactement comme les grilles informatiques quelque soit leur nature, cela vas être évoqué dans le prochain chapitre.

2. Différentes incarnations de grilles informatique

     Aujourd’hui les grilles informatique sont devenues omniprésentes et nous les utilisons au quotidien. Que se soit pour partager la connaissance aux travers des grilles d’informations, ou pour augmenter nos puissances de calcul, le même procédé est toujours engager : la mise en place d’une architecture virtuelle appelé grille qui agrège les ressources.

2.1     Grille d’information

     Dans les années 80, le CERN à mis au point le premier serveur http qui est devenu aujourd’hui le principal pilier d’internet. Cela n’a l’air de rien mais sans doute la première manifestation de grille informatique venait d’être crée.
     Dans cette partie, je vais tenter d’expliquer en quoi internet peut être considéré comme une grille d’information. Internet permet désormais de s’instruire, de se tenir informé des actualités, en fait nous avons accès à tout type d’information grâce à lui. Cela fait de l’information la ressource de cette grille. Maintenant, il faut vérifier qu’internet partage bien les différentes caractéristiques d’une grille.
Dans le cas d’internet, la ressource est bien partagé et distribué car vous pouvez y accédez depuis n’importe quel ordinateur muni de l’interface utilisateur de cette grille : un navigateur internet. De plus cette grille est composé d’un ensemble hétérogène de serveur (apache, tomcat, IIS) localisé en tout point du globe et pouvant très bien fonctionner individuellement.
2.2    Grille de stockage

     les grilles de stockage permettent d’agréger l’espace de chacun afin d’obtenir des capacités de stockage énorme. En un sens, internet peut être considéré comme une grille de stockage car l’on peut y trouver un certain nombres d’applications à télécharger via différent protocole (ftp ou http).
Mais ce sont sans doute les laboratoires de recherche qui ont le plus besoin d’espace de stockage et comme des ressources propres de chaque laboratoire ne permet pas de subvenir à leur besoin, le projet Datagrid (maintenant remplacé par EGEE, Enabling Grids for E-sciencE) fut lancé en 2001. Trois ans après il offrait aux scientifiques du monde entier une capacité de stockage d’environs 15 Tera-octets (Ce chiffre ne représente rien d’exceptionnel aujourd’hui mais c’était un record pour l’époque).                
    Une autre application bien connu du grand public concernant les grilles de stockage sont les réseaux peer-to-peer (kazaa, emule, limewire). Bien qu’il soit aujourd’hui très largement utilisé à des fins illégale, ils représentes une technologie de stockage dont les ressources sont quasi illimités et pouvant évoluer très simplement.

3 Grilles de calcul

    Intéressons nous maintenant aux grilles de calcul, elles représentent un outil très prometteur pour l’avenir. Elles permettent d’agréger les cpu au sein d’une même architecture virtuelle. Auparavant, chaque laboratoire de recherche avait en fonction de ses besoins (et surtout de ces moyens) une puissance de calcul fixe. Aujourd’hui la grille permet à chaque laboratoire aussi petit soit il de s’investir pleinement dans des programmes comme EGEE (grille européenne de recherche portant sur divers domaines) ou WLCG (grille de calcul mise en place par le CERN pour analyser les données fourni par les détecteur du LHC) en tant que noeud de grille.

3.1     Composition de la grille

    Pour fonctionner, la grille à besoin d’un certain nombre d’élément et de services distinct :
               User Interface (UI) :   Machine utilisée par les utilisateurs pour soumettre des job sur la grille.
      Computer Element (CE) :   Machine qui distribue les jobs aux différents Working Node.
             Working Node (WN) :   Machine qui exécute les jobs.
          Storage Element (SE) :    Serveur de stockage des résultats.

3.2     Architecture de la grille WLCG

    La grille WLCG repose sur une architecture multi-tier, elle commence au tier-0 ou sont stocké les données brut d’expérience pour finir au tier-3 ou les données sont exploitable par les physiciens. Chaque tier est un sur-traitement des données par rapport au tier précèdent.

3.3     Grille légère

    Lors du fonctionnement normale d’une grille de calcul, les processeurs ne sont pas sollicité 100% du temps. Une première solution pour pallier à ce problème serait par exemple de supporter plusieurs Virtual Organisation (VO) mais cela n’est toujours pas satisfaisant. Afin d’obtenir un taux d’utilisation des cœurs proche de 100%, une solution intéressante peut être la mise en place d’une grille légère partageant la même infrastructure qu’une grille principale. Le couple de grilles CIMENT(Calcul Intensif, Modélisation, Expérimentation Numérique et Technologique)/CiGri développé par les universités grenobloise depuis 1998 en est un exemple. Dans ce système, CIMENT est la grille (de recherche) principale, comme elle n’est pas utilisé à 100% du temps, elle à été couplée à CiGri q(grille légère) ui peut venir exécuter des jobs et ainsi profiter de l’infrastructure de CIMENT mais uniquement quand les ressources sont inutilisées. Dans un tel système la priorité est naturellement donné à la grille principal ce qui à pour conséquence d’arrêter tout job de la grille légère si les cœurs sont de nouveau demandé par la grille principale.


Dossier