Presentazione

Organizzazione della Didattica

DM270
INFORMATICA ORD. 2014

Big Data Computing

6

Corsi comuni

 

Frontali Esercizi Laboratorio Studio Individuale
ORE: 48 0 0 102

Periodo

AnnoPeriodo
I anno2 semestre

Frequenza

Facoltativa

Erogazione

Convenzionale

Lingua

Inglese

Calendario Attività Didattiche

InizioFine
02/03/202012/06/2020

Tipologia

TipologiaAmbitoSSDCFU
caratterizzanteDiscipline informaticheINF/012
caratterizzanteDiscipline informaticheING-INF/054


Responsabile Insegnamento

ResponsabileSSDStruttura
Prof. PIETRACAPRINA ANDREA ALBERTOINF/01Dipartimento di Ingegneria dell'Informazione

Altri Docenti

Non previsti

Attività di Supporto alla Didattica

Non previste

Bollettino

Il corso ha i seguenti prerequisiti: competenze relative al progetto e all'analisi di algoritmi e strutture dati, conoscenza delle nozioni fondamentali di calcolo delle probabilità e statistica, e capacità di programmazione in Java o Python.

In questo corso gli studenti imparano tecniche algoritmiche fondamentali per l'elaborazione efficiente ed efficace di insiemi di dati di grande dimensione. Inoltre, attraverso alcune attività pratiche, essi acquisiscono abilità relative allo sviluppo di applicazioni in Apache Spark, che è uno dei framework di programmazione più popolari e diffusi per big data computing.

Lezioni frontali e attività propedeutiche allo svolgimento degli homework.

Il corso affronterà i seguenti argomenti: Introduzione al fenomeno dei Big Data Programming frameworks: MapReduce/Hadoop, Spark Clustering Association Analysis Graph Analytics (metriche di centralità, scale-free/Power-law graphs, fenomeno dello small world, uncertain graphs) Similarity and diversity search

L'esame consiste in alcuni homework di programmazione, assegnati ogni 2-3 settimane e da svolgere in gruppi di 3-4 studenti, e in una prova scritta individuale comprendente domande teoriche ed esercizi.

La valutazione finale è basata sugli homework e sulla prova scritta. Gli homework mirano a verificare la capacità degli studenti di programmare applicazioni big data in Apache Spark, mentre la prova scritta mira a verificare la loro conoscenza delle tecniche algoritmiche apprese durante il corso e la loro capacità di problem solving nel contesto big data.

J. Leskovec, A. Rajaraman and J. Ullman, Mining Massive Datasets. : Cambridge University Press, 2014

Il diario delle lezioni, il materiale didattico e le modalità d'esame dettagliate sono resi disponibili sul sito web del corso accessibile anche da MOODLE.