Data: dal 3 al 4 marzo 2022
Orario: dalle 10:00 alle 18:00
Luogo: Torino
Organizzatore: NCC Italy (Cineca)
artTipologia: Curiosità e interesse
Ti stai chiedendo come risolvere i tuoi problemi di data analytics in tempi rapidi?
Hai un dataset di dimensioni tali da non riuscire ad analizzarlo sulla tua workstation?
In questo corso analizzeremo un dataset di grandi dimensioni sfruttando le moderne tecniche di Machine Learning e mostreremo come scalare un algoritmo, ovvero parallelizzarlo nei punti chiave (ad es. data pre-processing, cross validation) per sfruttare contemporaneamente le risorse di calcolo a disposizione (dal laptop al supercomputer).
Prerequisiti
- Conoscenza base di Python
- Familiarità con algoritmi di Machine Learning
- Capacità di eseguire codice su macchina Linux
- Conoscenze base di Machine Learning e Reti Neurali
Competenze in uscita
- Conoscenze di esempi di algoritmi di machine learning e gestione dati
- Conoscenze dei benefit HPC per ML e AI
- Conoscenze relative al training e agli hyperparameters
- Conoscenze su esecuzione di AI su HPC
- Conoscenze teoriche e pratiche di training distribuito
Docenti
- Bhaskar Agarwal (Data Scientist presso Cineca)
- Laura Morselli (HPC Specialist presso Associazione Big Data)
- Eric Pascolo (HPC Specialist presso Cineca)