Outils pour utilisateurs

Outils du site


suivi

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Prochaine révision
Révision précédente
suivi [2017/06/16 12:47] – créée toussainsuivi [2018/10/11 20:49] (Version actuelle) – modification externe 127.0.0.1
Ligne 1: Ligne 1:
-1. sacct affiche l'état des jobs de l'utilisateur qu'ils soient en cours ou déjà terminés. Les principaux états possibles sont :  
-• CA,  cancelled : le job a été annulé par l'utilisateur ou l'administrateur 
-• CD,  completed : le job s'est terminé avec succès     
-• CG,  completing : job en cours 
-• F,   failed : le job s'est terminé avec un échec 
-• PD, pending : le job attend des ressources  
-• R, running : le job est en cours d'exécution 
-• TO, timeout : le job s'est terminé car il a atteint son temps d'exécution limite 
  
-2. sinfo affiche les partitions existantes+======Suivi des jobs======
  
- sinfo -N affiche l'état des nœuds, les états possibles sont :  +SLURM dispose de nombreuses commandes pour le suivi des jobset chaque commande a de nombreuses options. On donne ici les principales.
-• alloc : le nœud est entièrement utilisé +
-• mix : le nœud est en partie utilisé +
-• idle : aucun job ne tourne sur le nœud +
-• drain : le nœud termine les jobs qui lui ont été soumis mais n'en accepte plus d'autres (typiquement le nœud est sur le point d'être arrêté pour une opération de maintenance)+
  
-3. squeue affiche les jobs en cours et en attente dans l'ordre de leur priorité +=====File d'attente ===== 
-squeue -u <user> affiche les jobs en cours et en attente pour l'utilisateur user  +  * **squeue** affiche les jobs en cours et en attente dans l'ordre de leur priorité 
-squeue -p <nomPart> affiche les jobs en cours et en attente pour la partition demandée +    * **squeue -u <user>** affiche les jobs en cours et en attente pour l'utilisateur user 
-squeue -i <sec> actualise la liste des jobs en cours toutes les sec secondes+    * **squeue -p <nomPart>** affiche les jobs en cours et en attente pour la partition demandée 
 +    * **squeue -i <sec>** actualise la liste des jobs en cours toutes les sec secondes
  
 +  * **sprio** donne la priorité des jobs en attente (les jobs les plus prioritaires ont la priorité la plus élevée)
  
-4. sprio donne la priorité des jobs en attente (les jobs les plus prioritaires ont la priorité la plus élevée)+=====Suppression d'un job =====
  
-5. sstat <jobID> donne des informations sur la consommation de ressources d'un job en cours d'exécution+  * **scancel <jobID>** supprime le job <jobID> (en cours ou en attente) 
 +  * **scancel -u <user>** supprime les jobs de l'utilisateur <user> (en cours ou en attente) 
 + 
 +=====Etat d'un job===== 
 +  * **sacct** affiche l'état des jobs de l'utilisateur qu'ils soient en cours ou déjà terminésLes principaux états possibles sont :  
 +    * CA,  cancelled : le job a été annulé par l'utilisateur ou l'administrateur 
 +    * CD,  completed : le job s'est terminé avec succès     
 +    * CG,  completing : job en cours 
 +    * F,   failed : le job s'est terminé avec un échec 
 +    * PD, pending : le job attend des ressources  
 +    * R, running : le job est en cours d'exécution 
 +    * TO, timeout : le job s'est terminé car il a atteint son temps d'exécution limite 
 + 
 +  * **sstat <jobID>** donne des informations sur la consommation de ressources d'un job en cours d'exécution 
 + 
 +  * **scontrol show job <jobID>** donne des informations détaillées sur le job <jobID> 
 +     
 +  
  
suivi.1497617221.txt.gz · Dernière modification : 2018/10/11 20:49 (modification externe)