Presentazione

Organizzazione della Didattica

DM270
INFORMATICA ORD. 2014

Reperimento dell'informazione

6

Corsi comuni

 

Frontali Esercizi Laboratorio Studio Individuale
ORE: 48 0 0 102

Periodo

AnnoPeriodo
I anno1 semestre

Frequenza

Facoltativa

Erogazione

Convenzionale

Lingua

Italiano

Calendario Attività Didattiche

InizioFine
30/09/201918/01/2020

Tipologia

TipologiaAmbitoSSDCFU
caratterizzanteDiscipline informaticheINF/016


Responsabile Insegnamento

ResponsabileSSDStruttura
Prof.ssa AGOSTI MARISTELLAING-INF/05Dipartimento di Ingegneria dell'Informazione

Altri Docenti

DocenteCoperturaSSDStruttura
Dott. SILVELLO GIANMARIAMutuazioneING-INF/05Dipartimento di Ingegneria dell'Informazione

Attività di Supporto alla Didattica

Non previste

Bollettino


Competenze critiche e avanzate di ideazione, progettazione, realizzazione e valutazione di sistemi di reperimento dell'informazione (Information Retrieval System, IRS) e motori di ricerca (Search Engines).

L'insegnamento si basa su lezioni frontali e attività sperimentali. La frequenza alle lezioni è fortemente consigliata, perché il corso è progettato per studenti che frequentano con costanza le lezioni, seguono le attività sperimentali del corso e realizzano il progetto. Informazioni relative al diario delle lezioni, al materiale didattico, alle scadenze e modalità d'esame sono rese disponibili agli studenti in Moodle.

I sistemi e i servizi di reperimento dell'informazione sono sistemi pervasivi che vengono utilizzati ogni giorno in attività di acquisizione di informazioni, di gestione amministrativa, di acquisizione di competenze, di intrattenimento e comunicazione da parte di milioni di utenti esperti e finali. I motori di ricerca e i sistemi di reperimento dell'informazione gestiscono grandi quantità di informazioni, documenti e risorse digitali (big data). I motori di ricerca (search engines) sono gli strumenti di reperimento dell'informazione più conosciuti e utilizzati per acquisire informazioni su persone, eventi e risultati scientifici. Grazie ai risultati ottenuti e le informazioni acquisite tramite i motori di ricerca si prendono decisioni e si svolgono attività di lavoro e personali. Sono strumenti di reperimento dell'informazione anche quelli incorporati nei diversi media sociali (social media) che vengono utilizzati ogni giorno per scopi professionali e personali da utenti di tutto il mondo e tutti quei sistemi che permettono di recuperare informazioni dai messaggi di posta elettronica, dai documenti e dagli archivi presenti sui dispositivi di memorizzazione permanente utilizzati nei diversi strumenti di elaborazione delle informazioni che le persone oggi hanno in uso personale. I contenuti del corso permettono di acquisire competenze per la ideazione, progettazione, realizzazione e valutazione di sistemi di reperimento dell'informazione e motori di ricerca. La presentazione dei contenuti è articolata nelle seguenti parti: - Elementi introduttivi (quadro d'insieme) per la rappresentazione, gestione e reperimento automatico dell'informazione in formato digitale - Indicizzazione: rappresentazione del contenuto dei documenti testuali, il processo di indicizzazione e le sue fasi principali, word embeddings - Modelli di reperimento dell'informazione: modello booleano, livello di coordinamento, modello vettoriale, word embeddings, modello probabilistico, language models, neural IR - Sistemi di IR, data visualisation - Valutazione: la valutazione in IR, collezioni sperimentali (Cranfield, TREC), misure di efficacia e di efficienza, analisi statistiche, precision medicine - Web search: la struttura del Web, interrogazioni e utenti, agenti Web (Web Crawler), Search Engine Optimization (SEO).

1. Progetto: viene realizzato con due homework, uno individuale e uno da svolgere in gruppo e con presentazione seminariale; gli obiettivi e i contenuti degli homework vengono presentati a lezione. 2. Esame scritto con domande sui tutti i contenuti trattati nelle lezioni dell'insegnamento. Esempi di compiti degli anni accademici precedenti vengono resi disponibili durante il corso. 3. Eventuale integrazione orale.

La prova finale serve a verificare l'acquisizione di competenze relative alla capacità di valutare, ideare, progettare, reingegnerizzare, realizzare e gestire sistemi di reperimento dell'informazione e motori di ricerca. Il progetto serve a verificare in modo sperimentale la capacità di applicare le competenze acquisite.

Croft, W. Bruce; Metzler, Donald; Strohman, Trevor, Search engines: information retrieval in practice. Boston: Pearson, 2010

I materiali di studio sono resi disponibili in Moodle. Il libro di testo di riferimento è: Donald Metzler, Trevor Strohman, and W. Bruce Croft. Search Engines: Information Retrieval in Practice. Il testo è disponibile e scaricabile liberamente all'URL: http://ciir.cs.umass.edu/downloads/SEIRiP.pdf Un utile riferimento aggiuntivo è: Cornelis Joost (Keith) van Rijsbergen. Information Retrieval (2° Ed). London, Butterworths, 1979 anche questo testo è e scaricabile liberamente all'URL: http://www.dcs.gla.ac.uk/Keith/Preface.html Documentazione aggiuntiva viene resa disponibile in formato elettronico in Moodle.