Presentazione

Organizzazione della Didattica

DM270
STATISTICA PER LE TECNOLOGIE E LE SCIENZE ORD. 2014


9

Corsi comuni

 

Frontali Esercizi Laboratorio Studio Individuale
ORE: 34 0 30 69

Periodo

AnnoPeriodo
III anno2 semestre

Frequenza

Facoltativa

Erogazione

Convenzionale

Lingua

Italiano

Calendario Attività Didattiche

InizioFine
26/02/201801/06/2018

Tipologia

TipologiaAmbitoSSDCFU
affine/integrativo Nessun ambitoSECS-S/019


Responsabile Insegnamento

ResponsabileSSDStruttura
Prof. SCARPA BRUNOSECS-S/01Dipartimento di Scienze Statistiche

Altri Docenti

DocenteCoperturaSSDStruttura
DA ASSEGNARE-N.D.

Attività di Supporto alla Didattica

Non previste.

Bollettino

Sostanziali ma non formali: Algebra Lineare, Sistemi di elaborazione, Statistica 2, Modelli Statistici 1

I metodi di analisi dei dati in statistica e machine learning giocano ormai un ruolo centrale nelle realtà aziendali, industriali e scientifiche. La crescita del web e lo sviluppo di strumenti tecnologici che raccolgono e salvano enormi quantità di dati e informazioni hanno portato ad un rapido incremento nella dimensione dei dati e nella complessità delle analisi e della modellazione statistica. Sorgono inoltre nuove forme di dati non direttamente riportabili alla classica matrice dei dati statistica, ma a strutture più complesse come funzioni, grafi e reti. Queste moderne ed emergenti applicazioni in ambito aziendale, industriale e tecnologico spiegano la necessità di introdurre modelli statistici e algoritmi (scalabili, paralleli, ricorsivi e dinamici) che possano essere adattati a queste grandi masse di dati. Il corso si propone di fornire, a livello di laurea triennale, gli strumenti statistici di base per affrontare questi problemi, ponendosi in continuità rispetto al corso di Analisi di dati multidimensionali. In particolare, il nuovo corso si propone di approfondire alcuni argomenti (quali quelli legati ai metodi di riduzione della dimensionalità, analisi dei fattori, metodi di raggruppamento), caratterizzandone l'applicazione al contesto dei "Big Data", introducendone alcuni completamente nuovi, quali quelli legati all'analisi di dati funzionali, di reti sociali e all'analisi di un numero elevato di variabili rispetto ad un numero esiguo di osservazioni.

Lezioni frontali. Esercitazioni in laboratorio

- Metodi di visualizzazione dei dati e di big data. - Metodi di riduzione della dimensionalità (independent component analysis, principal curves, principal surfaces, projection pursuit) - Metodi di estrazione di fattori: esempi di modelli di analisi fattoriale confermativa (e.g. Partial Least Squares) - Metodi di raggruppamento basati su modelli parametrici e non parametrici - Metodi di analisi in presenza di un numero elevato di variabili e un esiguo numero di osservazioni: metodi di stima penalizzata, lasso e lars e relative modifiche. Altri algoritmi efficienti. - Introduzione all'analisi dei dati funzionali - Metodi di analisi di dati raccolti da reti (e reti sociali): struttura dei dati, modelli grafici e semplici modelli statistici (e.g. logistico, di Erdos-Renyi, ERGM) ; modelli per dati da social networks (e.g. Hopkins and King). - Aspetti di statistica computazionale: algoritmi statistici di calcolo parallelo, ricorsivo e dinamico. Stime ricorsive per modelli lineari e modelli lineari dinamici (algoritmo per stima ricorsiva, filtro di Kalman).

prova scritta e/o prova pratica

Correttezza e qualità delle prove d'esame.

Scarpa, B., Materiale didattico via web per l'insegnamento di Big Data. : , Ceron, Andrea; Curini, Luigi, Social media e sentiment analysisl'evoluzione dei fenomeni sociali attraverso la rete. Milano: Springer, 2014 Azzalini, Adelchi; Scarpa, Bruno, Data analysis and data miningan introduction. New York: Oxford University Press, 2012

Materiale didattico disponibile sulla pagina web del corso. Lo strumento di calcolo primario adottato per questo corso è l'ambiente di programmazione R; questo può essere prelevato, assieme alla relativa documentazione, da una postazione CRAN.