suivi
Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| suivi [2017/06/16 15:06] – toussain | suivi [2018/10/11 22:49] (Version actuelle) – modification externe 127.0.0.1 | ||
|---|---|---|---|
| Ligne 1: | Ligne 1: | ||
| + | |||
| ======Suivi des jobs====== | ======Suivi des jobs====== | ||
| SLURM dispose de nombreuses commandes pour le suivi des jobs, et chaque commande a de nombreuses options. On donne ici les principales. | SLURM dispose de nombreuses commandes pour le suivi des jobs, et chaque commande a de nombreuses options. On donne ici les principales. | ||
| + | =====File d' | ||
| * **squeue** affiche les jobs en cours et en attente dans l' | * **squeue** affiche les jobs en cours et en attente dans l' | ||
| - | * squeue -u < | + | |
| - | * squeue -p < | + | |
| - | * squeue -i <sec> actualise la liste des jobs en cours toutes les sec secondes | + | |
| - | + | ||
| - | * sacct affiche l' | + | |
| - | * CA, cancelled : le job a été annulé par l' | + | |
| - | * CD, completed : le job s'est terminé avec succès | + | |
| - | * CG, completing : job en cours | + | |
| - | * F, | + | |
| - | * PD, pending : le job attend des ressources | + | |
| - | * R, running : le job est en cours d' | + | |
| - | * TO, timeout : le job s'est terminé car il a atteint son temps d' | + | |
| + | * **sprio** donne la priorité des jobs en attente (les jobs les plus prioritaires ont la priorité la plus élevée) | ||
| + | =====Suppression d'un job ===== | ||
| + | * **scancel < | ||
| + | * **scancel -u < | ||
| + | =====Etat d'un job===== | ||
| + | * **sacct** affiche l' | ||
| + | * CA, cancelled : le job a été annulé par l' | ||
| + | * CD, completed : le job s'est terminé avec succès | ||
| + | * CG, completing : job en cours | ||
| + | * F, | ||
| + | * PD, pending : le job attend des ressources | ||
| + | * R, running : le job est en cours d' | ||
| + | * TO, timeout : le job s'est terminé car il a atteint son temps d' | ||
| - | 4. sprio | + | * **sstat < |
| - | 5. sstat | + | * **scontrol show job < |
| + | |||
| + | | ||
suivi.1497618379.txt.gz · Dernière modification : 2018/10/11 22:49 (modification externe)