premierspas
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédenteProchaine révisionLes deux révisions suivantes | ||
premierspas [2017/06/16 10:24] – toussain | premierspas [2024/01/11 07:58] – admin | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | ====== Utilisation du gestionnaire | + | ====== Utilisation du cluster et de SLURM ====== |
+ | |||
+ | Un **cluster** est un regroupement de machines dédiées au calcul. Il est composé d'une machine frontale (" | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | =====Accès au cluster===== | ||
+ | On accède au cluster en se connectant (en ssh) sur le serveur **frontalhpc2020** et en utilisant le login / mot de passe de son compte habituel. Pour exécuter un programme sur un nœud de calcul, l' | ||
+ | |||
+ | |||
===== Qu' | ===== Qu' | ||
- | SLURM (Simple Linux Utility for Resource Management) est un gestionnaire de ressources et ordonnanceur de tâches pour des clusters LINUX. Il permet de répartir au mieux les ressources de calcul (CPU, GPU, RAM) entre utilisateurs en gérant des files d' | + | SLURM (Simple Linux Utility for Resource Management) est un gestionnaire de ressources et ordonnanceur de tâches pour des clusters LINUX. Il permet de répartir au mieux les ressources de calcul (CPU, GPU, RAM) entre utilisateurs en gérant des files d' |
+ | |||
+ | Les processus d'un utilisateur sont confinés aux ressources (CPU notamment) qu'il a réservées : il ne peut pas accéder aux CPU réservés par d' | ||
+ | |||
+ | |||
+ | Une documentation complète est disponible sur le site de SLURM : [[http:// | ||
==== Le vocabulaire ==== | ==== Le vocabulaire ==== | ||
Ligne 18: | Ligne 34: | ||
* avec l' | * avec l' | ||
- | [{{ : | + | [{{ : |
=== Les jobs et les tasks === | === Les jobs et les tasks === | ||
Ligne 36: | Ligne 52: | ||
Pour soumettre un job (demande d' | Pour soumettre un job (demande d' | ||
- | * soit définir son job dans un script et le lancer à l'aide de la commande sbatch | + | * soit définir son job dans un script et le lancer à l'aide de la commande sbatch, |
- | * soit lancer directement son job en ligne de commande à l'aide de la commande srun (voir section 2.2.2). | + | * soit lancer directement son job en ligne de commande à l'aide de la commande srun. |
==== Soumettre un job en utilisant un script ==== | ==== Soumettre un job en utilisant un script ==== | ||
- | L' | + | L' |
- | === 1. Description du job dans un fichier bash (.sh) === | + | **Etape |
Un script de soumission SLURM est composé de deux parties : | Un script de soumission SLURM est composé de deux parties : | ||
Ligne 83: | Ligne 99: | ||
* la priorité d'un job dépend, entre autre, de la quantité de ressources demandées : plus un utilisateur demande de ressources, plus la priorité de son job tend à être faible. | * la priorité d'un job dépend, entre autre, de la quantité de ressources demandées : plus un utilisateur demande de ressources, plus la priorité de son job tend à être faible. | ||
- | === 2. Soumission du job via la commande sbatch | + | **Etape |
Le job décrit dans un script est soumis via la commande sbatch suivie du nom du script. SLURM affecte alors un numéro au job et le place dans la file d' | Le job décrit dans un script est soumis via la commande sbatch suivie du nom du script. SLURM affecte alors un numéro au job et le place dans la file d' | ||
Ligne 92: | Ligne 108: | ||
</ | </ | ||
+ | ==== Soumettre directement avec srun ==== | ||
+ | |||
+ | La commande srun permet de définir une étape dans un script mais on peut aussi l' | ||
+ | Exemple de soumission d'un exécutable (exe) dans la partition court pour 10 minutes : | ||
+ | |||
+ | <code powershell> | ||
+ | [toussain@frontalhpc ~]$ srun --partition=court --time=10:0 ./exe | ||
+ | </ | ||
+ | |||
+ | <color # | ||
premierspas.txt · Dernière modification : 2024/01/11 08:00 de admin