Presentazione

Organizzazione della Didattica

DM270
DATA SCIENCE ORD. 2017


6

Corsi comuni

 

Frontali Esercizi Laboratorio Studio Individuale
ORE: 48 0 0 102

Periodo

AnnoPeriodo
I anno2 semestre

Frequenza

Facoltativa

Erogazione

Convenzionale

Lingua

Inglese

Calendario Attività Didattiche

InizioFine
26/02/201801/06/2018

Tipologia

TipologiaAmbitoSSDCFU
caratterizzanteTecnologie dell'informaticaING-INF/036


Responsabile Insegnamento

ResponsabileSSDStruttura
Prof. ROSSI MICHELEING-INF/03Dipartimento di Ingegneria dell'Informazione

Altri Docenti

Non previsti.

Attività di Supporto alla Didattica

Non previste.

Bollettino

Si consiglia un corso di base che fornisca le basi della teoria delle probabilità. Un corso di programmazione di base è altresì utile per il corretto apprendimento dei concetti esposti.

Le competenze che verranno acquisite dallo studente sono molteplici e tutte collegate all'analisi di segnali biometrici o comunque generati dall'attività dell'uomo quali il suo movimento. In particolare, lo studente apprenderà le seguenti conoscenze tecniche: - Il trattamento di segnali quasi-periodici, estraendone strutture ricorrenti tramite rimozione del rumore e segmentazione: alcuni segnali fondamentali quali l'elettrocardiogramma e segnali di movimento misurati da dispositivi indossabili (wearables) verranno analizzati in dettaglio; - L'estrazione di "features" da insiemi di dati biometrici; - L'applicazione di algoritmi di classificazione (clustering) a segnali biometrici al fine di classificare i soggetti che li hanno generati o costruire dizionari per una rappresentazione accurata ma al tempo stesso compatta dei dati stessi; - L'utilizzo di tecniche di apprendimento non-supervisionato, basate su reti neurali, al fine di partizionare i dati in cluster caratteristi ("vector quantization") e costruire dizionari per una loro rappresentazione efficiente; - L'utilizzo di costrutti statistici, quali le catene di Markov nascoste e le reti Bayesiane, per la modellizzazione di dati correlati; - L'utilizzo di reti neurali come strumenti per la mappatura di patterns e per la soluzione di problemi di classificazione.

L'apprendimento avverrà tramite lezioni frontali svolte dal titolare del corso. Il progetto finale servirà per mettere in pratica le tecniche viste a lezione e verificarne l'efficacia in presenza di segnali reali.

Parte I – Introduzione al corso - Intro: course outline, grading rules, office hours, etc. - Applicazioni: salute, servizi "activity-aware", applicazioni di sicurezza e gestione delle emergenze, sistemi di autenticazione, analisi di dinamiche di attività umane Parte II - Strumenti e tecniche - Vector quantization (VQ): -- Obiettivi, metriche di qualità -- Algoritmi di VQ non-supervisionati: --- Self-Organizing Maps (SOM), Time Adaptive-SOM (TASOM) --- Gas Neural Networks (GNG) - Reti Neurali "Deep" (DNN) -- Neural networks brief: concept, examples, training -- Reti Neurali Convoluzionali: architettura, allenamento - Modelli per l'analisi sequenziale dei dati: -- Modelli di Markov nascosti (Hidden Markov Models, HMM): --- Massima verosimiglianza per HMM --- Forward-backward algorithm --- Algoritmo somma-prodotto --- Algoritmo di Viterbi -- Teoria della decisione sequenziale di Wald's (cado a processi iid) Parte III – Applicazioni (usando gli strumenti della Parte II) - Apprendimento di attività umana -- Activities & sensors: definizioni, classi di attività -- Features: features temporali, features statistiche, features spettrali, features estratte dal contesto -- Riconoscimento di attività: segmentazione, finestre mobili, segmentazione non-supervisionata, metriche prestazionali e risultati - Processamento di dati biometrici: -- Segnali fisiologici quasi-periodici --- Apprendimento di dizionari e algoritmi di compressione del segnale - Segnali inerziali: riconoscimento dell'identità - Sensori inerziali e video camere: tracciamento della camminata e sua profilazione - Riconoscimento vocale: -- Sistemi ibridi formati da reti neurali "deep" e modelli di Markov nascosti -- Architettura, allenamento delle reti, prestazioni

L'esame consisterà nella presentazione di un elaborato (progetto) nel quale verrà risolto un problema di classificazione su un determinato dataset. Lo studente dovrà implementare il software per la classificazione in oggetto, ottenere i risultati e commentarli.

I seguenti criteri di valutazione verranno presi in considerazione: - Qualità della presentazione orale; - Qualità del progetto finale: chiarezza espositiva, rigore matematico; - Qualità dei risultati ottenuti; - Originalità dell'approccio scelto; - Complessità del problema affrontato.

Bishop, Christopher M., Pattern recognition and machine learningChristopher M. Bishop. New York: Springer, 0 Cook, Diane J.; Krishnan, Narayanan C., Activity learningdiscovering, recognizing and predicting human behavior from sensor dataDiane J. Cook, Narayanan C. Krishnan. Hoboken: NJ, Wiley, 2015 Jeremy Watt, Reza Borhani, Aggelos K. Katsaggelos, Machine Learning Refined: Foundations, Algorithms, and Applications. : Cambridge University Press, 2016 Goodfellow, Ian; Courville, Aaron, Deep learningIan Goodfellow, Yoshua Bengio and Aaron Courville. Cambridge: MA [etc.], MIT Press, 2016

Il Professore fornirà tutto il materiale necessario che consisterà primariamente in: 1) capitoli di libro (diversi libri verranno utilizzati, in dipendenza dell'argomento trattato); 2) articoli scientifici; 3) slides. Tutto il materiale scritto sarà in lingua Inglese. Il materiale ai punti 1), 2) e 3) sarà reso disponibile tramite il sito del corso (protetto da password).