Presentazione

Organizzazione della Didattica

DM270
STATISTICA PER LE TECNOLOGIE E LE SCIENZE ORD. 2014


9

Corsi comuni

 

Frontali Esercizi Laboratorio Studio Individuale
ORE: 52 0 12 69

Periodo

AnnoPeriodo
III anno2 semestre

Frequenza

Facoltativa

Erogazione

Convenzionale

Lingua

Italiano

Calendario Attività Didattiche

InizioFine
27/02/201709/06/2017

Tipologia

TipologiaAmbitoSSDCFU
affine/integrativo Nessun ambitoING-INF/059


Responsabile Insegnamento

ResponsabileSSDStruttura
Prof. MELUCCI MASSIMOING-INF/05Dipartimento di Ingegneria dell'Informazione

Altri Docenti

DocenteCoperturaSSDStruttura
Dott. DUSSIN MARCOContrattoN.D.

Attività di Supporto alla Didattica

Non previste.

Bollettino

E' richiesta la conoscenza dei concetti di Basi di Dati 1, dell'architettura e del sistema operativo di un calcolatore e della programmazione illustrati in Sistemi di elaborazione 1.

S'intende formare una figura professionale in grado di descrivere, raccogliere, organizzare, gestire e analizzare grandi moli di dati eterogenei mediante rigorose metodologie informatiche. A questo scopo, s'intende promuovere la conoscenza dei principali metodi e strumenti di gestione di dati strutturati, semi-strutturati e non strutturati, con speciale attenzione all'estrazione e all'analisi di basi di dati anche di grandi dimensioni. S'intendono poi delineare i concetti principali relativi ai sistemi informativi automatizzati mediante il World Wide Web (WWW) e le problematiche di natura informatica derivanti dalla gestione di enormi moli di dati (big data).

L'attivita' di apprendimento principale si svolge in aula in forma di lezioni frontali tenute in italiano con l'ausilio della lavagna e del video proiettore. Sebbene la frequenza delle lezioni sia facoltativa, si consiglia di partecipare alle lezioni comunque, specialmente a quelle di laboratorio. Attivita' altrettanto importante e' lo studio individuale e in particolare lo svolgimento di esercitazioni proposte alle lezioni di laboratorio da svolgere in modo individuale o in coppia. Ogni esercitazione dovra' essere consegnata appena dopo la lezione in cui e' stata proposta e comunque prima della lezione di laboratorio successiva. Lo svolgimento regolare delle esercitazioni facilita quello della prova pratica d'esame. Si raccomanda di approfittare del ricevimento per presentare le esercitazioni in via di svolgimento e ottenere suggerimenti dal docente. Durante l'attivita' di laboratorio, si affronteranno le problematiche dell'accesso a basi di dati mediante il WWW mediante linguaggi di scripting come ad esempio PHP e Javascript.

I contenuti dell'insegnamento vertono su tre tipi di dato fondamentali: strutturato, semi-strutturato e non-strutturato, come illustrato di seguito. S'introdurranno le problematiche e le metodologie di analisi di basi di dati strutturati, anche di grandi dimensioni, con particolare attenzione all'efficienza. Si vedra' come Structured Query Language (SQL) puo' essere utilizzato per estrarre, riassumere e analizzare dati organizzati in tabelle, specialmente quando gli strumenti di analisi statistica non sono in grado di far fronte all'enorme massa delle basi di dati reali. Si introdurranno gli elementi essenziali dell'organizzazione dei dati in memoria di massa e delle strutture per gli indici e si vedra' come la scelta degli indici ha effetto sull'efficienza dell'analisi dei dati. Si presentaranno - anche se solo in via d'accenno - i concetti e i risultati principali della teoria relazionale allo scopo di mostrare la logica con cui un SGBD ottimizza le proprie prestazioni. S'introdurranno le problematiche e le metodologie di analisi di basi di dati semi-strutturati, sia quelli relazionali ad oggetti che quelli ad albero. Per i primi, si riprenderanno i concetti di classe ed ereditarieta' introdotti con il modello ER e s'introdurra' SQL-3. Per i secondi, si presenteranno i concetti generali dei dati semi-strutturati ad albero e le tecnologie eXtended Markup Language (XML), XPath e XQuery. S'introdurranno le problematiche e le metodologie di analisi di collezioni di dati non strutturati (Information Retrieval, IR) che stanno alla base dei motori di ricerca. Si presenteranno inoltre i metodi principali di indicizzazione, reperimento e ordinamento. Si dara' cenno ai principali modelli teorici di reperimento. S'illustreranno le metodologie di valutazione dei sistemi di IR. Si accennera' alla tecnologia di tipo NoSQL. L'attivita' di laboratorio vertera' su tutti gli argomenti trattati in aula durante le lezioni frontali oltre che gli argomenti relativi alle tecnologie d'accesso a basi di dati mediante WWW.

L'esame consiste di una prova scritta e di una prova pratica che, nel caso dei non frequentanti o comunque in appelli successivi al primo, e' integrata da una prova orale. La prova scritta verte sui metodi di progettazione e accesso a basi di dati strutturati, semi-strutturati e non strutturati trattati durante l'insegnamento. Per i frequentanti, la prova pratica del primo appello e' svolta in laboratorio, al calcolatore e in modo autonomo. Essa consiste nella realizzazione di semplici applicazioni di basi di dati strutturati, semi-strutturati e non strutturati, simili alle esercitazioni svolte durante le lezioni. I non frequentanti o comunque coloro, anche frequentanti, che svolgono la prova in appelli successivi al primo, devono contattare il docente con un certo anticipo rispetto all'orale per concordare il tema della prova pratica che sara' realizzata in modo autonomo e discussa oralmente in sede d'esame. Il colloquio e' parte integrante della prova pratica.

Per la prova scritta, si valutera' innanzitutto la completezza, la competenza e la precisione di risposta ai quesiti. Si terra' conto anche della calligrafia e dell'ordine di tenuta del foglio d'esame. Per la prova pratica, si valutera' innanzitutto l'utilizzo appropriato dei metodi e degli strumenti informatici. Si terra' conto della capacita' d'uso del calcolatore e di produrre autonomamente i file richiesti dal tema della prova. Nel caso di colloquio orale, si valuteranno anche le conoscenze generali dei contenuti dell'insegnamento oltre a quelle specifiche della prova pratica. L'esame e' superato solo se si supera ciascuna prova con un voto sufficiente. Il voto finale d'esame e' la media dei voti delle due prove superate. E' possibile rifiutare il voto di una prova senza dover rifiutare il voto dell'altra prova. Una prova puo' essere sostenuta in un appello diverso da quello dell'altra prova. Il voto di una prova rimane valido fino all'ultimo appello previsto per l'anno accademico in cui si e' sostenuta la prova.

Linoff, Gordon S., Data Analysis Using SQL and Excel. Indianapolis, IN, USA: Wiley, 2008 Melucci, Massimo, Basi di dati. Bologna: Esculapio, 2013 Melucci, Massimo, Information Retrieval: metodi e modelli per motori di ricerca. Milano: Franco Angeli, 2013 Atzeni, Paolo et al, Basi di dati. Milano: McGraw-Hill, 2014

Prima dell'inizio delle lezioni sara' resa disponbile una dispensa con i contenuti delle lezioni. Il materiale delle esercitazioni di laboratorio sara' reso disponibile man mano che si procede l'insegnamento.