Outils pour utilisateurs

Outils du site


suivi

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
suivi [2017/06/16 12:52] toussainsuivi [2018/10/11 20:49] (Version actuelle) – modification externe 127.0.0.1
Ligne 1: Ligne 1:
 +
 ======Suivi des jobs====== ======Suivi des jobs======
  
 SLURM dispose de nombreuses commandes pour le suivi des jobs, et chaque commande a de nombreuses options. On donne ici les principales. SLURM dispose de nombreuses commandes pour le suivi des jobs, et chaque commande a de nombreuses options. On donne ici les principales.
  
-===== +=====File d'attente ===== 
- +  * **squeue** affiche les jobs en cours et en attente dans l'ordre de leur priorité 
-3. squeue affiche les jobs en cours et en attente dans l'ordre de leur priorité +    * **squeue -u <user>** affiche les jobs en cours et en attente pour l'utilisateur user 
-squeue -u <user> affiche les jobs en cours et en attente pour l'utilisateur user  +    * **squeue -p <nomPart>** affiche les jobs en cours et en attente pour la partition demandée 
-squeue -p <nomPart> affiche les jobs en cours et en attente pour la partition demandée +    * **squeue -i <sec>** actualise la liste des jobs en cours toutes les sec secondes
-squeue -i <sec> actualise la liste des jobs en cours toutes les sec secondes +
- +
-1. sacct affiche l'état des jobs de l'utilisateur qu'ils soient en cours ou déjà terminés. Les principaux états possibles sont :  +
-  * CA,  cancelled : le job a été annulé par l'utilisateur ou l'administrateur +
-  * CD,  completed : le job s'est terminé avec succès     +
-  * CG,  completing : job en cours +
-  * F,   failed : le job s'est terminé avec un échec +
-  * PD, pending : le job attend des ressources  +
-  * R, running : le job est en cours d'exécution +
-  * TO, timeout : le job s'est terminé car il a atteint son temps d'exécution limite +
  
 +  * **sprio** donne la priorité des jobs en attente (les jobs les plus prioritaires ont la priorité la plus élevée)
  
 +=====Suppression d'un job =====
  
 +  * **scancel <jobID>** supprime le job <jobID> (en cours ou en attente)
 +  * **scancel -u <user>** supprime les jobs de l'utilisateur <user> (en cours ou en attente)
  
 +=====Etat d'un job=====
 +  * **sacct** affiche l'état des jobs de l'utilisateur qu'ils soient en cours ou déjà terminés. Les principaux états possibles sont : 
 +    * CA,  cancelled : le job a été annulé par l'utilisateur ou l'administrateur
 +    * CD,  completed : le job s'est terminé avec succès    
 +    * CG,  completing : job en cours
 +    * F,   failed : le job s'est terminé avec un échec
 +    * PD, pending : le job attend des ressources 
 +    * R, running : le job est en cours d'exécution
 +    * TO, timeout : le job s'est terminé car il a atteint son temps d'exécution limite
  
-4. sprio donne la priorité des jobs en attente (les jobs les plus prioritaires ont la priorité la plus élevée)+  * **sstat <jobID>** donne des informations sur la consommation de ressources d'un job en cours d'exécution
  
-5. sstat <jobID> donne des informations sur la consommation de ressources d'un job en cours d'exécution+  * **scontrol show job <jobID>** donne des informations détaillées sur le job <jobID> 
 +     
 +  
  
suivi.1497617539.txt.gz · Dernière modification : 2018/10/11 20:49 (modification externe)