Unser Konsortialmitglied IT Center veranstaltet vom 09. bis zum 11. Dezemeber 2024 einen HPC-Workshop
Es wird um „Maschinelles Lernen (ML) auf NVIDIA GPUs“ mit „High Performance Computing“-Bezug gehen
Maschinelles Lernen auf HPC-Clustern mit NVIDIA-Chips
Die jährliche Veranstaltung aiXcelerate an der RWTH Aachen (NHR4CES@RWTH) ist ein Tuning-Workshop für HPC-Anwender. Er besteht aus Vorträgen, die für jeden zugänglich sind, und praktischen Teilen, in denen (eingeladene) Gruppen die erlernten Konzepte auf ihre eigenen Codes anwenden. In diesem Jahr behandelt aiXcelerate das Thema „Maschinelles Lernen (ML) auf NVIDIA GPUs“ und konzentriert sich auf die Nutzung der GPUs des RWTH HPC-Clusters „CLAIX“ mit Frameworks wie PyTorch oder Tensorflow. Der Workshop gibt Einblicke in die Performance-Analyse und das Performance-Tuning von ML-Codes.
Es ist keine Einführung in Maschinelles Lernen!
Die Vorträge sind auf die Vormittagssitzungen der drei Tage von aiXcelerate verteilt. Das Thema des ersten Tages lautet „Analyzing Performance of ML Codes“ und umfasst die Nutzung des automatisch laufenden RWTH Performance Monitoring Systems, sowie die Nutzung von NVIDIAs Nsight Tool und wie man damit Engpässe findet. Der zweite Tag konzentriert sich auf die „Skalierung von ML-Codes über mehrere GPUs/Knoten“. Hier werden Ansätze mit PyTorch (Distributed) und Tensorflow + Horovod vorgestellt, um ML-Codes durch die parallele Nutzung von mehr Hardware zu beschleunigen. Am dritten Tag werden wir uns mit dem „Umgang mit Datensätzen von ML-Codes“ beschäftigen. Wir werden die verschiedenen Optionen zur Speicherung und Verwendung von ML-Daten zur Laufzeit (auf CLAIX) vorstellen. Außerdem wird die Verwendung von Check Pointing in ML-Codes vorgestellt.
aiXcelerate wird mit der Unterstützung von NVIDIA durchgeführt. Das Catering wird von NEC und NVIDIA gesponsert.
Wann: Vom 09. – 11. Dezember 2024, jeweils von 9:00 – 17:30 Uhr
Wo: Seminarraum 003/004, IT Center, Kopernikusstraße 6, 52074 Aachen
Online: über Zoom/Webex
Die Veranstaltung ist kostenlos!
Zur Anmeldung geht es hier.
Weitere Infos gibt es auf den Seiten des IT Centers.
Agenda
Tag 1: “Analyzing Performance of ML Codes”
Tag 2: “Scaling ML Codes across Multiple GPUs/ Nodes”
Tag 3: “Handling Datasets of ML Codes”
Vorraussetzungen:
- Anfänger bis Fortgeschritten in der Nutzung und Entwicklung von ML
- Grundkenntnisse über GPU-Hardware-Architekturen
- Kenntnisse über Modelle des maschinellen Lernens (die für Sie wichtig sind)
- Kenntnisse darüber, wie diese Modelle verwendet werden können, z. B. mit PyTorch oder Tensorflow
- Grundkenntnisse über Parallelität
- Die Veranstaltung wird in Englisch sein!