Antonio BALZANELLA
Insegnamento di DATA MINING AND BIG DATA
Corso di laurea in DATA ANALYTICS
SSD: SECS-S/01
CFU: 12,00
ORE PER UNITÀ DIDATTICA: 96,00
Periodo di Erogazione: Annualità Singola
Italiano
| Lingua di insegnamento | English |
| Contenuti | L’insegnamento annuale fornisce competenze approfondite in tecniche di analisi e trattamento dei dati, con particolare enfasi su data mining e big data analytics. Il programma integra fondamenti teorici con applicazioni pratiche e utilizzo di software specialistico (R, Python). Sono trattati: introduzione al data mining e Knowledge Discovery in Databases (KDD), anomaly detection, e strategie di imputazione dei dati mancanti, analisi esplorativa dei dati, metodi fattoriali multivariati (PCA, analisi delle corrispondenze), classificazione (alberi decisionali, k-NN, Naïve Bayes, ensemble methods), associazione (market basket analysis), clustering (k-means, clustering gerarchico, metodi basati su densità). |
| Testi di riferimento | • Introduction to Data Mining |
| Obiettivi formativi | Conoscenza e capacità di comprensione (knowledge and understanding). |
| Prerequisiti | Conoscenze di analisi matematica e algebra lineare, di statistica descrittiva e inferenziale. |
| Metodologie didattiche | L’insegnamento annuale prevede 96 ore totali (12 CFU), così articolate: |
| Metodi di valutazione | La verifica prevede |
| Programma del corso | Modulo 1 |
English
| Teaching language | English |
| Contents | The annual course provides in-depth competencies in data analysis and processing techniques, with emphasis on data mining and big data analytics. The program integrates theoretical foundations with practical applications using specialized software (R, Python). Topics include introduction to data mining and KDD, ), anomaly detection, and missing data imputation strategies, exploratory data analysis, multivariate factorial methods (PCA, correspondence analysis), classification (decision trees, k-NN, Naïve Bayes, ensemble methods), association rules (market basket analysis), clustering (k-means, hierarchical clustering, density-based methods. |
| Textbook and course materials | • Introduction to Data Mining |
| Course objectives | Knowledge and understanding. |
| Prerequisites | Knowledge of analysis, linear algebra, descriptive and inferential statistics. |
| Teaching methods | The annual course consists of a total of 96 hours (12 credits), structured as follows: |
| Evaluation methods | The assessment consists of an initial interview on the first module and a second interview on the second module. |
| Course Syllabus | Modulo 1 |








