suivi
Différences
Ci-dessous, les différences entre deux révisions de la page.
Prochaine révision | Révision précédente | ||
suivi [2017/06/16 14:47] – créée toussain | suivi [2018/10/11 22:49] (Version actuelle) – modification externe 127.0.0.1 | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | 1. sacct affiche l' | ||
- | • CA, | ||
- | • CD, | ||
- | • CG, | ||
- | • F, | ||
- | • PD, pending : le job attend des ressources | ||
- | • R, running : le job est en cours d' | ||
- | • TO, timeout : le job s'est terminé car il a atteint son temps d' | ||
- | 2. sinfo affiche les partitions existantes | + | ======Suivi des jobs====== |
- | sinfo -N affiche l' | + | SLURM dispose de nombreuses commandes pour le suivi des jobs, et chaque commande a de nombreuses options. On donne ici les principales. |
- | • alloc : le nœud est entièrement utilisé | + | |
- | • mix : le nœud est en partie utilisé | + | |
- | • idle : aucun job ne tourne sur le nœud | + | |
- | • drain : le nœud termine les jobs qui lui ont été soumis mais n'en accepte plus d' | + | |
- | 3. squeue affiche les jobs en cours et en attente dans l' | + | =====File d' |
- | squeue -u < | + | * **squeue** affiche les jobs en cours et en attente dans l' |
- | squeue -p < | + | * **squeue -u < |
- | squeue -i <sec> actualise la liste des jobs en cours toutes les sec secondes | + | * **squeue -p < |
+ | * **squeue -i <sec>** actualise la liste des jobs en cours toutes les sec secondes | ||
+ | * **sprio** donne la priorité des jobs en attente (les jobs les plus prioritaires ont la priorité la plus élevée) | ||
- | 4. sprio donne la priorité des jobs en attente (les jobs les plus prioritaires ont la priorité la plus élevée) | + | =====Suppression d'un job ===== |
- | 5. sstat < | + | * **scancel < |
+ | * **scancel -u < | ||
+ | |||
+ | =====Etat d'un job===== | ||
+ | * **sacct** affiche l' | ||
+ | * CA, cancelled : le job a été annulé par l' | ||
+ | * CD, completed : le job s'est terminé avec succès | ||
+ | * CG, completing : job en cours | ||
+ | * F, | ||
+ | * PD, pending : le job attend des ressources | ||
+ | * R, running : le job est en cours d' | ||
+ | * TO, timeout : le job s'est terminé car il a atteint son temps d' | ||
+ | |||
+ | * **sstat < | ||
+ | |||
+ | * **scontrol show job < | ||
+ | |||
+ | | ||
suivi.1497617221.txt.gz · Dernière modification : 2018/10/11 22:49 (modification externe)