Presentazione

Organizzazione della Didattica

DM270
SCIENZE STATISTICHE ORD. 2014


9

Corsi comuni

 

Frontali Esercizi Laboratorio Studio Individuale
ORE: 64 0 0 69

Periodo

AnnoPeriodo
II anno1 semestre

Frequenza

Facoltativa

Erogazione

Convenzionale

Lingua

Inglese

Calendario Attività Didattiche

InizioFine
01/10/201620/01/2017

Tipologia

TipologiaAmbitoSSDCFU
caratterizzanteStatisticoSECS-S/029


Responsabile Insegnamento

ResponsabileSSDStruttura
Prof.ssa ROMUALDI CHIARABIO/11Dipartimento di Biologia

Altri Docenti

DocenteCoperturaSSDStruttura
Dott.ssa CALURA ENRICAContrattoN.D.

Attività di Supporto alla Didattica

Non previste.

Bollettino

Statistica progredito, Calcolo delle Probabilità e Modelli Statistici II.

Introduzione ai problemi biologici legati alla complessità dei dati provenienti dalle nuove tecniche di sequenziamento. Introduzione ai modelli statistici per dati genomici e trascrittomici. Capacità di affrontare l'analisi completa dei dati: dal dato grezzo all'interpretazione del risultato. Capacità di scrivere una breve tesina su un dataset opportunamente assegnato dal docente.

Lezioni frontali e laboratori informatici

Il completamento del progetto genoma umano e con esso l'inizio di una serie di progetti di sequenziamento sistematico di molti organismi complessi ha aumentato enormemente la quantità di informazioni disponibili riguardanti sequenze geniche e proteiche. Questa grande disponibilità di dati biologici ha quindi rivoluzionato e rivoluzionerà ulteriormente la ricerca genetica e la comprensione di molti aspetti biologici quali la regolazione genica, l'interazione fra proteine e l'attivazione e la soppressione di vie metaboliche. In questo contesto quindi, la quantità di dati congiuntamente alla natura complessa degli stessi hanno reso l'analisi statistica un passo obbligato per la loro comprensione. Il corso tratterà i seguenti argomenti: - Introduzione alla Genomica, Trascrittomica e Proteomica. Database di dati genomici di riferimento mondiale disponibili al National Center of Biotechnology Information (NCBI), GeneBank, GEO, EntrezGene, OMIM, e in altri centri di riferimento, SwissProt, UniProt, Pfam. Sistemi integrati di interazione con questi database (interfacce web). - Allineamento di sequenze. Algoritmi di allineamento, allineamenti globali e locali. Programmazione Dinamica, algoritmi euristici (BLAST, FASTA). Significatività dello score di un allineamento, approccio Bayesiano e approccio classico (valori estremi). Cenni all’utilizzo degli hidden Markov model (HMM) per l'allineamento di sequenze. - Analisi di dati di espressione derivanti da esperimenti di microarray. Normalizzazione dei dati, metodi globali e locali (lowess), trasformazioni per la stabilizzazione della varianza. Applicazione di analisi cluster e analisi discriminante. Verifica d'ipotesi per l'identificazione di geni differenzialmente espressi, test moderati, approcci permutazionali. Problema dei confronti multipli, controllo del False Discovery Rate (FDR).

Esame Scritto

Saranno criteri di valutazione: la capacità espositiva della tesina, la congruenza dei metodi usati per l'analisi dei dati assegnati, e la completezza delle risposte nell'esame scritto. Ulteriori criteri saranno l'analisi critica dei risultati e l'indipendenza nell'afforntare i temi proposti.

Parmigiani G, Garrett ES, Irizarry R, and Zeger SL., The analysis of gene expression data: methods and software. New York: Springer, 2003 Gentleman R. Carey V.J. Huber, Bioinformatics and computational biology solutions using R and Bioconductor,. New York: Springer, 2005 Ewens, Warren J., Grant, Gregory R., Statistical Methods in Bioinformatics. An introduction. New York: Springer, 2005

Materiale didattico predisposto dal docente.