MASSIVE DATA MINING

Internazionalizzazione della Didattica MASSIVE DATA MINING

0222700008
DIPARTIMENTO DI SCIENZE AZIENDALI - MANAGEMENT & INNOVATION SYSTEMS
CORSO DI LAUREA MAGISTRALE
DATA SCIENCE E GESTIONE DELL'INNOVAZIONE
2021/2022



OBBLIGATORIO
ANNO CORSO 2
ANNO ORDINAMENTO 2020
PRIMO SEMESTRE
CFUOREATTIVITÀ
642LEZIONE
321LABORATORIO
Obiettivi
IL PERCORSO FORMATIVO (63 ORE E 9 ECTS) SI PROPONE DI FAR ACQUISIRE AGLI STUDENTI UNA DOTAZIONE DI CONOSCENZE RELATIVE ALL’ANALISI DI DATI ETEROGENEI, PER CONSENTIRE UNA GESTIONE SCALABILE CON COMPLESSI SISTEMI. IL CORSO SI PROPONE, INFATTI, DI SVILUPPARE CAPACITÀ ANALITICHE ORIENTATE ALLA RISOLUZIONE DI PROBLEMI COMPLESSI E ARTICOLATI CHE RICHIEDONO SOLUZIONI IBRIDE NELLA GESTIONE DI DATI ATTRAVERSO APPROCCI DI DATA MINING, CON TECNICHE DISTRIBUITE, CON PARADIGMI DI COMPUTAZIONE AVANZATI, FINALIZZATE AL DISCOVERY DATA-DRIVEN E ALLA PREDIZIONE.

LO STUDENTE, AL TERMINE DEL PERCORSO FORMATIVO, AVRÀ ACQUISITO CONOSCENZE TEORICHE E CAPACITÀ PRATICHE DI DATA ANALYTICS (PER LA RISOLUZIONE DI PROBLEMI DERIVANTI DALL’ACQUISIZIONE E GESTIONE DI GRANDI MOLI DI DATI), NONCHÉ CAPACITÀ DI UTILIZZO DELLE PRINCIPALI TECNICHE E DEGLI STRUMENTI UTILI ALLA RISOLUZIONE DI TALUNE PROBLEMATICHE SPECIFICHE.

LO STUDENTE SARÀ STIMOLATO ALLO SVILUPPO DI CAPACITÀ DI ANALISI E DESCRIZIONE/ESTRAZIONE DELLE CARATTERISTICHE INSITE NEI DATI, E L’ABILITÀ DI FORNIRE UN MODELLO ASTRATTO CHE EVIDENZI LE PECULIARITÀ RILEVATE DALL’ELABORAZIONE DEI DATI STESSI.

IL CORSO MIRA A SVILUPPARE COMPETENZE SUL DATA COLLECTION E FAVORIRE LO SVILUPPO DI CAPACITÀ DI ANALISI CRITICA, ATTRAVERSO UN APPROCCIO IBRIDO PER DEFINIRE UNA STRATEGIA COMPLESSIVA VOLTA A TRASFORMARE I DATI IN INFORMAZIONI UTILI.
Prerequisiti
NOZIONI DI BASE RELATIVI ALLA GESTIONE DI ARCHIVI DI DATI (DATA BASE) E PENSIERO ALGORITMICO RIVOLTO AL PROBLEM SOLVING
Contenuti
OBIETTIVO DEL CORSO È, IN GENERALE, FORNIRE UNA PREPARAZIONE SOLIDA E MODERNA ALLA COMPRENSIONE E GESTIONE DELLE VARIE PROSPETTIVE E SFUMATURE CHE INTERVENGONO NELL'ANALISI COMPLETA DEI DATI.
I CONTENUTI INCLUDONO: LA MANIPOLAZIONE E ANALISI DEI DATI; APPROCCI METODOLOGICI E FORMALI AL DATA ANALYTICS;
IL CORSO È STRUTTURATO IN UN UNICO MODULO DI 63 ORE:
- INTRODUZIONE ALLA DATA SCIENCE, IL SUO IMPIEGO E IL RUOLO NEI DIVERSI AMBITI APPLICATIVI
- CENNI DI DATA VISUALIZATION
- BACKGROUND SULLE LIBRERIE PYTHON PER IL DATA MANIPULATION
- MISURE DI SIMILARITÀ E DISSIMILARITÀ
- SIMILAR ITEMS (LOCALITY SENSITIVE HASHING)
- PREPROCESSING, DATA REDUCTION
- FREQUENT ITEMSET
- DIMENSIONAL REDUCTION
- CLUSTERING
- ADVANCED CLUSTERING
- CLASSIFICATION
- ADVANCED CLASSIFICATION
- OUTLIERS
Metodi Didattici
IL CORSO PREVEDE LEZIONI FRONTALI IN AULA (42 ore) ED ESERCITAZIONI PRATICHE SUGLI ARGOMENTI TRATTATI (21 ore).
Verifica dell'apprendimento
IL CORSO PREVEDE UNA PROVA SCRITTA SOTTO FORMA DI PROGETTO E UNA PROVA ORALE.



Testi
HAN, KAMBER, PEI, "DATA MINING, CONCEPT AND TECHNIQUES"
J. LESKOVEC, A. RAJARAMAN, J.D. ULLMAN, "MINING OF MASSIVE DATASETS", 2ND ED., CAMBRIDGE UNIVERSITY PRESS.
Altre Informazioni
SLIDES E DISPENSE FORNITE DAL DOCENTE

  BETA VERSION Fonte dati ESSE3
  • Didattica