mail unicampaniaunicampania webcerca

    Antonio BALZANELLA

    Insegnamento di STATISTICS

    Corso di laurea in DATA ANALYTICS

    SSD: SECS-S/01

    CFU: 9,00

    ORE PER UNITÀ DIDATTICA: 72,00

    Periodo di Erogazione: Primo Semestre

    Italiano

    Lingua insegnamento

    INGLESE

    Contenuti

    Statistics è un corso introduttivo che non richiede precedenti conoscenze di statistica e che fornisce i concetti e i metodi della statistica descrittiva enfatizzando la comprensione dei principi della raccolta dati, dell’analisi dei dati e delle teorie sottostanti. Un parte significativa del corso è incentrata sull’utilizzo della statistica in casi reali.
    I principali argomenti del corso includono:
    Introduzione alla statistica
    Raccolta dati
    Visualizzazione e sintesi dei dati;
    Relazioni tra variabili
    Comprensione e comparazione delle distribuzioni

    Testi di riferimento

    Statistics - Principles and Methods
    Cicchitelli Giuseppe, D'Urso Pierpaolo, Minuzzò Marco
    Pearson, 2021

    Obiettivi formativi

    Conoscenza e capacità di comprensione:
    Comprendere i concetti principali della statistica descrittiva quali: le diverse tipologie di dati le distribuzioni; le misure di tendenza centrale, le misure di variabilità, di posizione e di forma; le rappresentazioni grafiche; le misure di dipendenza tra variabili statistiche.

    Capacità di applicare conoscenza e comprensione:
    Saper pianificare un’indagine, raccogliere e gestire dati, ed eseguire analisi statistiche e visualizzazioni

    Autonomia di giudizio: Interpretare correttamente i risultati delle analisi statistiche e trarre conclusioni consapevoli in presenza di variabilità e dipendenza tra variabili.

    Abilità comunicative: Saper descrivere e illustrare i risultati di un analisi statistica attraverso grafici e indici sintetici appropriati.
    Capacità di apprendere: Acquisire la padronanza metodologica necessaria per affrontare corsi avanzati di inferenza e data mining.

    Prerequisiti

    Conoscenze di base della matematica

    Metodi didattici

    Per raggiungere efficacemente gli obiettivi dichiarati, questo corso utilizzerà le seguenti strategie didattiche:
    lezioni frontali:

    Le lezioni si concentreranno sugli aspetti teorici della statisticha. Sono progettati per sviluppare la comprensione e la conoscenza delle statistiche descrittive e per rafforzare le abilità degli studenti nella raccolta dei dati, nell'analisi dei dati e nelle interpretazioni.
    Esercitazioni
    Verranno effettuate esercitazioni alla lavagna, con software R e con foglio elettronico. Lo scopo è quello di sviluppare le capacità analitiche e interpretative dei dati.

    Modalità di verifica dell'apprendimento

    L’esame finale consiste in una prova scritta seguita da una discussione orale sui temi del corso. La valutazione è in trentesimi:

    Voto Criteri di Valutazione
    30 - 30L Padronanza eccellente dei metodi e analisi critica profonda.
    26 - 29 Ottima capacità analitica e corretta interpretazione dei risultati statistici.
    22 - 25 Buona conoscenza delle tecniche descrittive proposta nel programma del corso
    18 - 21 Conoscenza sufficiente dei concetti base

    Altre informazioni

    Il materiale didattico (slide, esercizi, dataset ed eventuali risorse integrative) sarà reso disponibile sul canale Microsoft Teams del corso.
    La frequenza, pur non obbligatoria, è fortemente consigliata, in quanto le lezioni includono esempi applicativi, discussioni di casi reali ed esercitazioni guidate che facilitano la comprensione dei concetti teorici.
    Durante il corso potranno essere assegnati esercizi facoltativi per l’autovalutazione.
    Gli studenti sono invitati a partecipare attivamente alle lezioni e alle esercitazioni.
    Per chiarimenti e approfondimenti, il docente è disponibile durante l’orario di ricevimento o su appuntamento.

    Programma esteso

    PARTE I – ESPLORARE E COMPRENDERE I DATI
    1. Introduzione alla statistica
    1.1 Che cos’è la statistica?
    • Statistica descrittiva vs inferenziale
    • Popolazione e campione
    • Il processo di analisi dei dati
    • Il ruolo dei modelli nella descrizione
    1.2 Dati
    • Unità statistiche
    • Dataset
    • Matrice dei dati
    • Dataset reali (economici, sociali, aziendali)
    1.3 Variabili
    • Qualitative: nominali e ordinali
    • Quantitative: discrete e continue

    2. Rappresentare e descrivere i dati
    2.1 Variabili categoriali
    • Frequenze assolute, relative, percentuali
    • Tabelle di frequenza
    • Diagrammi a barre
    • Diagrammi a torta
    2.2 Variabili quantitative
    • Tabelle di distribuzione
    • Classi e ampiezza
    • Densità (in ottica descrittiva)
    • ECDF
    • Istogramma
    2.3 Tendenza centrale
    • Media aritmetica, media geometrica, media armonica
    • Mediana
    • Moda
    • Confronto critico tra gli indici
    2.4 Dispersione
    • Range
    • Varianza
    • Deviazione standard
    • IQR (intervallo interquartile)
    • Z-score
    2.5 Forma della distribuzione
    • Simmetria
    • Asimmetria
    • Distribuzioni unimodali e multimodali
    • Relazione tra forma e indici di posizione
    • Boxplot

    3. Comprendere e confrontare distribuzioni
    3.1 Confronto tra gruppi
    • Boxplot affiancati
    • Confronto di mediana, variabilità e forma
    • Effetto scala
    3.2 Valori anomali (outlier)
    • Definizione tramite IQR
    • Impatto sulla media e deviazione standard
    • Strategie interpretative

    4. Modello normale e percentili (in chiave descrittiva)
    4.1 Modello normale
    • Forma campanulare
    • Simmetria
    • Regola empirica 68–95–99.7 (interpretazione descrittiva)
    4.2 Percentili
    • Quartili
    • Percentili
    • Interpretazione pratica

    PARTE II – ESPLORARE LE RELAZIONI TRA VARIABILI
    5. Relazioni tra variabili categoriche — Tabelle di contingenza
    5.1 Tabelle di contingenza
    • Frequenze congiunte
    • Marginali
    • Distribuzioni condizionate
    • Interpretazione corretta
    5.2 Associazione tra variabili categoriali
    • Confronto tra distribuzioni
    • Interpretazione qualitativa dell’associazione

    6. Diagrammi di dispersione, associazione e correlazione
    6.1 Diagrammi di dispersione
    • Pattern lineari e non lineari
    • Direzione
    • Intensità
    • Forma
    6.2 Correlazione
    • Coefficiente di correlazione lineare
    • Interpretazione
    • Limiti della correlazione
    6.3 Correlazione ≠ causalità
    • Variabili confondenti
    • Esempi reali
    6.4 Linearizzazione
    • Trasformazioni logaritmiche (introduzione intuitiva)
    • Interpretazione grafica

    7. Regressione lineare semplice
    7.1 Metodo dei minimi quadrati
    • Idea geometrica
    • Retta di miglior adattamento
    7.2 Il modello lineare
    • Intercetta
    • Pendenza
    • Interpretazione dei parametri
    7.3 Determinazione della retta
    • Calcolo operativo
    7.4 Analisi dei residui
    • Residui
    • Pattern nei residui
    • Outlier influenti
    7.5 Coefficiente di determinazione (R²)
    • Variabilità spiegata
    • Interpretazione corretta
    • Limiti

    English

    Teaching language

    English

    Contents

    Statistics is an introductory course that assumes no prior knowledge of statistics. Basic statistical concepts and methods are presented in a manner that emphasizes understanding the principles of data collection and analysis as well as those of theory. Much of the course will be devoted to discussions of how statistics is commonly used in the real world.
    Main topics include:
    Introduction to Statistics
    Collecting Data
    Displaying and summarizing Data
    Relationships Between Variables
    Understanding and Comparing Distributions

    Textbook and course materials

    Statistics - Principles and Methods
    Cicchitelli Giuseppe, D'Urso Pierpaolo, Minuzzò Marco
    Pearson, 2021

    Course objectives

    Knowledge and understanding:
    Understanding the main concepts of descriptive statistics, including: different types of data; distributions; measures of central tendency; measures of variability, position, and shape; graphical representations; and measures of dependence between statistical variables.
    Ability to apply knowledge and understanding:
    Being able to plan a survey, collect and manage data, and perform statistical analyses and visualizations.
    Judgement autonomy:
    Correctly interpreting the results of statistical analyses and drawing informed conclusions in the presence of variability and dependence between variables.
    Communication skills:
    Being able to describe and present the results of a statistical analysis using appropriate graphs and summary indices.
    Learning skills:
    Acquiring the methodological proficiency necessary to tackle advanced courses in inference and data mining.

    Prerequisites

    Basic Mathematics Skills

    Teaching methods

    To effectively achieve the stated learning objectives, the course will adopt the following teaching strategies:
    Lectures:
    The lectures will focus on the theoretical aspects of statistics. They are designed to develop students’ understanding and knowledge of descriptive statistics and to strengthen their skills in data collection, data analysis, and interpretation.
    Practical sessions:
    Exercises will be carried out at the blackboard, using R software, and with spreadsheet tools. The aim is to develop students’ analytical and data interpretation skills.

    Assessment methods

    The final examination consists of a written test followed by an oral discussion on the topics covered in the course. The assessment is graded on a 30-point scale:
    Grade — Evaluation Criteria
    30 – 30L: Excellent mastery of methods and in-depth critical analysis.
    26 – 29: Very good analytical skills and correct interpretation of statistical results.
    22 – 25: Good knowledge of the descriptive techniques included in the course syllabus.
    18 – 21: Sufficient knowledge of the basic concepts.

    Other information

    Teaching materials (slides, exercises, datasets, and additional resources) will be made available through the course Microsoft Teams channel.
    Attendance, although not mandatory, is strongly recommended, as lectures include applied examples, real-world case discussions, and guided exercises that support the understanding of theoretical concepts.
    Optional exercises may be assigned during the course for self-assessment purposes.
    Students are encouraged to actively participate in lectures and practical sessions.
    For further clarification or in-depth discussion, the instructor is available during office hours or by appointment.

    Detailed syllabus

    PART I – EXPLORING AND UNDERSTANDING DATA
    1. Introduction to Statistics
    1.1 What Is Statistics?
    • Descriptive vs inferential statistics
    • Population and sample
    • The data analysis process
    • The role of models in description
    1.2 Data
    • Statistical units
    • Dataset
    • Data matrix
    • Real datasets (economic, social, business)
    1.3 Variables
    • Qualitative: nominal and ordinal
    • Quantitative: discrete and continuous

    2. Displaying and Describing Data
    2.1 Categorical Variables
    • Absolute, relative, and percentage frequencies
    • Frequency tables
    • Bar charts
    • Pie charts
    2.2 Quantitative Variables
    • Distribution tables
    • Classes and class width
    • Density (in a descriptive sense)
    • ECDF (Empirical Cumulative Distribution Function)
    • Histogram
    2.3 Measures of Central Tendency
    • Arithmetic mean, geometric mean, harmonic mean
    • Median
    • Mode
    • Critical comparison of the measures
    2.4 Measures of Dispersion
    • Range
    • Variance
    • Standard deviation
    • IQR (Interquartile Range)
    • Z-score
    2.5 Shape of a Distribution
    • Symmetry
    • Skewness
    • Unimodal and multimodal distributions
    • Relationship between shape and measures of location
    • Boxplot

    3. Understanding and Comparing Distributions
    3.1 Comparing Groups
    • Side-by-side boxplots
    • Comparison of median, variability, and shape
    • Scale effects
    3.2 Outliers
    • Definition using IQR
    • Impact on mean and standard deviation
    • Interpretative strategies

    4. The Normal Model and Percentiles (Descriptive Perspective)
    4.1 The Normal Model
    • Bell-shaped form
    • Symmetry
    • Empirical rule (68–95–99.7) — descriptive interpretation
    4.2 Percentiles
    • Quartiles
    • Percentiles
    • Practical interpretation

    PART II – EXPLORING RELATIONSHIPS BETWEEN VARIABLES
    5. Relationships Between Categorical Variables — Contingency Tables
    5.1 Contingency Tables
    • Joint frequencies
    • Marginal frequencies
    • Conditional distributions
    • Correct interpretation
    5.2 Association Between Categorical Variables
    • Comparing distributions
    • Qualitative interpretation of association

    6. Scatterplots, Association, and Correlation
    6.1 Scatterplots
    • Linear and nonlinear patterns
    • Direction
    • Strength
    • Form
    6.2 Correlation
    • Linear correlation coefficient
    • Interpretation
    • Limitations of correlation
    6.3 Correlation ≠ Causation
    • Confounding variables
    • Real-world examples
    6.4 Linearization
    • Logarithmic transformations (intuitive introduction)
    • Graphical interpretation

    7. Simple Linear Regression
    7.1 Least Squares Method
    • Geometric intuition
    • Line of best fit
    7.2 The Linear Model
    • Intercept
    • Slope
    • Interpretation of parameters
    7.3 Determining the Regression Line
    • Operational calculation
    7.4 Residual Analysis
    • Residuals
    • Patterns in residuals
    • Influential outliers
    7.5 Coefficient of Determination (R²)
    • Explained variability
    • Correct interpretation
    • Limitations

    facebook logoinstagram buttonyoutube logotype