Outils pour utilisateurs

Outils du site


suivi

Ceci est une ancienne révision du document !


Suivi des jobs

SLURM dispose de nombreuses commandes pour le suivi des jobs, et chaque commande a de nombreuses options. On donne ici les principales.

File d'attente

  • squeue affiche les jobs en cours et en attente dans l'ordre de leur priorité
    • squeue -u <user> affiche les jobs en cours et en attente pour l'utilisateur user
    • squeue -p <nomPart> affiche les jobs en cours et en attente pour la partition demandée
    • squeue -i <sec> actualise la liste des jobs en cours toutes les sec secondes
  • sprio donne la priorité des jobs en attente (les jobs les plus prioritaires ont la priorité la plus élevée)

Suppression d'un job

La comamnde scancel suivi du numéro du job supprime un job (en cours ou en attente)

Etat d'un job

  • sacct affiche l'état des jobs de l'utilisateur qu'ils soient en cours ou déjà terminés. Les principaux états possibles sont :
    • CA, cancelled : le job a été annulé par l'utilisateur ou l'administrateur
    • CD, completed : le job s'est terminé avec succès
    • CG, completing : job en cours
    • F, failed : le job s'est terminé avec un échec
    • PD, pending : le job attend des ressources
    • R, running : le job est en cours d'exécution
    • TO, timeout : le job s'est terminé car il a atteint son temps d'exécution limite
  • sstat <jobID> donne des informations sur la consommation de ressources d'un job en cours d'exécution
  • scontrol show job <jobID> donne des informations détaillées sur le job <jobID>
suivi.1497618843.txt.gz · Dernière modification : 2018/10/11 20:49 (modification externe)