Outils pour utilisateurs

Outils du site


premierspas

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
premierspas [2017/06/16 10:36] toussainpremierspas [2024/01/11 08:00] (Version actuelle) admin
Ligne 1: Ligne 1:
-====== Utilisation du gestionnaire de ressources SLURM ======+====== Utilisation du cluster et de SLURM ====== 
 + 
 +Un **cluster** est un regroupement de machines dédiées au calcul. Il est composé d'une machine frontale ("porte d'entrée" du cluster) et de plusieurs machines de calcul, appelées nœuds, et éventuellement hétérogènes ([[:machines|voir les nœuds du cluster du LIMOS]]). 
 + 
 +  
 + 
 + 
 +=====Accès au cluster===== 
 +On accède au cluster en se connectant (en ssh) sur le serveur **frontalhpc2020** et en utilisant le login / mot de passe de son compte habituel. Pour exécuter un programme sur un nœud de calcul, l'utilisateur doit obligatoirement passer par l'ordonnanceur de tâches SLURM (voir section suivante).  
 + 
 + 
  
 ===== Qu'est-ce que SLURM ? ===== ===== Qu'est-ce que SLURM ? =====
  
-SLURM (Simple Linux Utility for Resource Management) est un gestionnaire de ressources et ordonnanceur de tâches pour des clusters LINUX. Il permet de répartir au mieux les ressources de calcul (CPU, GPU, RAM) entre utilisateurs en gérant des files d'attente avec priorité. Une documentation complète est disponible sur le site de SLURM : [[http://slurm.schedmd.com/|http://slurm.schedmd.com/]].+SLURM (Simple Linux Utility for Resource Management) est un gestionnaire de ressources et ordonnanceur de tâches pour des clusters LINUX. Il permet de répartir au mieux les ressources de calcul (CPU, GPU, RAM) entre utilisateurs en gérant des files d'attente avec priorité.  
 + 
 +Les processus d'un utilisateur sont confinés aux ressources (CPU notamment) qu'il a réservées : il ne peut pas accéder aux CPU réservés par d'autres utilisateurs. Cela permet d'assurer une certaine reproductibilité des exécutions d'un même programme, notamment au niveau des temps de calcul (contrairement à ce qu'il se passe sur des machines en libre accès). 
 + 
 + 
 +Une documentation complète est disponible sur le site de SLURM : [[http://slurm.schedmd.com/|http://slurm.schedmd.com/]].
  
 ==== Le vocabulaire ==== ==== Le vocabulaire ====
Ligne 101: Ligne 117:
 </code> </code>
  
 +<color #8b0000>Attention, les jobs soumis directement avec srun sont attachés au terminal, ils sont donc tués si vous fermez le terminal ou si vous vous déconnectez.</color>
  
premierspas.1497609419.txt.gz · Dernière modification : 2018/10/11 20:49 (modification externe)