mail unicampaniaunicampania webcerca

    Antonio IRPINO

    Insegnamento di DATA VISUALIZATION AND REPORTING

    Corso di laurea in DATA ANALYTICS

    SSD: SECS-S/01

    CFU: 9,00

    ORE PER UNITÀ DIDATTICA: 72,00

    Periodo di Erogazione: Primo Semestre

    Italiano

    Lingua di insegnamento

    INGLESE

    Contenuti

    L'insegnamento fornisce competenze metodologiche e pratiche per l'analisi visiva e la comunicazione di dati di natura diversa. Il programma integra fondamenti teorici della percezione visiva, della grammatica dei grafici e della progettazione grafica con l'implementazione pratica utilizzando software statistico (R, ggplot, Rmarkdown, Quarto). Gli argomenti trattati includono: principi di visualizzazione efficace, grafici univariati (istogrammi, density plot, box-plot), bivariati (scatter plot, heat-map, bag-plot), trivariati (contour plot, 3D scatter), multidimensionali (mosaic plot, parallel coordinates, tree-map), grafici per strutture particolari (network plot, word cloud, stream graph), e infine i fondamenti della redazione di report statistici efficaci.

    Testi di riferimento

    Testi consigliati (alcuni sono disponibili gratuitamente dal sito della biblioteca):
    Claus O. Wilke, Fundamentals of Data Visualization, O'Reilly
    disponibile gratuitamente on line: https://clauswilke.com/dataviz/

    R workflow: https://hbiostat.org/rflow/

    Edward R. Tufte, “The Visual Display of Quantitative Information”
    Leland Wilkinson, The Grammar of Graphics, 2nd edition, Springer
    AA.VV., Handbook of Data Visualization, Springer

    Websites:
    https://ggplot2.tidyverse.org/
    https://matplotlib.org/
    https://seaborn.pydata.org/
    https://towardsdatascience.com/data-visualization/home

    Obiettivi formativi

    Al termine dell’insegnamento, lo studente dovrà raggiungere i seguenti risultati:
    - Conoscenza e capacità di comprensione: Conoscere i principi della percezione visiva, della grammatica dei grafici e le regole del reporting statistico.
    - Utilizzazione delle conoscenze e capacità di comprensione: Produrre infografiche informative e visualizzazioni interattive utilizzando software statistici (R, Python).
    - Capacità di trarre conclusioni (Autonomia di giudizio): Esercitare capacità critica nel valutare e riprogettare grafici statistici esistenti per migliorarne l’efficacia.
    - Abilità comunicative: Sviluppare uno storytelling efficace supportato dai dati e strutturare report professionali auto-esplicativi.
    - Capacità di apprendere: Sintetizzare la letteratura scientifica sulla visualizzazione dati per giustificare le scelte grafiche in contesti professionali.

    Prerequisiti

    Statistica descrittiva e basi di programmazione

    Metodologie didattiche

    48 ore di lezioni frontali con utilizzo di slides e 24 ore di esercitazione con l’utilizzo di software statistico

    Metodi di valutazione

    La verifica prevede due prove integrate e sequenziali:
    Quiz (circa 30 quesiti): Test a scelta multipla e risposta breve su tutti gli argomenti del programma (durata circa 60 minuti), mirato a verificare la conoscenza teorica e la comprensione dei principi di visualizzazione, della percezione visiva e delle diverse tecniche grafiche.
    Prova orale (30-45 minuti): Discussione dei contenuti teorici del corso con domande aperte su principi di visualizzazione, scelte di design, applicabilità delle tecniche a differenti tipologie di dato, e interpretazione critica delle visualizzazioni. La prova orale verifica la padronanza concettuale, la capacità di argomentazione e la comprensione profonda dei principi affrontati.

    Struttura della valutazione:
    Accesso all'orale: È necessario ottenere almeno 18/30 nella prova quiz per essere ammessi alla prova orale. Se non si raggiunge questo punteggio, è possibile ripetere il quiz in una sessione successiva.

    Voto finale: Il voto finale (in trentesimi) è calcolato come media ponderata: 40% quiz + 60% orale.

    Validità quiz: Il voto del quiz rimane valido per l'intera sessione di esame.

    Parametri di valutazione: La valutazione considera: (1) correttezza delle risposte al quiz e comprensione teorica, (2) conoscenza profonda dei principi di percezione visiva e grammar of graphics, (3) capacità di argomentazione e giustificazione delle scelte di design, (4) applicazione consapevole dei principi ai diversi tipi di dato, (5) capacità critica di valutare e criticare visualizzazioni esistenti, (6) qualità dell'esposizione e uso del linguaggio specialistico.

    VotoDescrittore Criteri di Valutazione (Rubrica)
    30 - 30LQuiz: quasi tutte le risposte corrette (28-30/30). Orale: eccellente padronanza di tutti i principi di visualizzazione, percezione visiva e design; argomentazione teorica impeccabile; capacità critica eccellente; applicazione consapevole dei principi a casi complessi e inediti; comunicazione molto fluida e lessico specialistico perfetto.

    26 - 29Quiz: buon numero di risposte corrette (26-28/30 circa). Orale: ottima conoscenza dei principi principali; buona capacità di argomentazione; comprensione consapevole dei principi; capacità di applicare le tecniche a problemi specifici; alcuni cenni su argomenti più complessi; buon linguaggio specialistico.

    22 - 25Quiz: risposte corrette ai quesiti principali ma con qualche errore (20-23/30 circa). Orale: discreta conoscenza dei principi e delle tecniche; argomentazione adeguata anche se non sempre approfondita; comprensione sufficientemente critica; applicazione corretta delle tecniche ai casi standard; linguaggio tecnico appropriato.

    18 - 21Requisiti minimi: Quiz al limite della sufficienza (18-19/30). Orale: conoscenza basilare dei tipi di grafici e principi di visualizzazione essenziali; capacità minima di argomentazione; comprensione elementare dei concetti; applicazione meccanica delle tecniche; difficoltà nel ragionamento critico; linguaggio semplice ma adeguato.

    Altre informazioni

    Si raccomanda una frequenza costante e partecipativa. Discuteremo, criticheremo e riformuleremo tecniche di visualizzazione, attraverso esercizi pratici, mostreremo diversi software per la grafica statistica, ecc. Non sono argomenti che gli studenti possono riformulare solo studiando le slides. Se uno studente si assenterà a molte lezioni il suo voto ne può risentire.
    Oltre ai testi consigliati, il docente fornirà articoli scientifici o divulgativi e dispense su argomenti specifici.
    Il laboratorio sarà sviluppato per la maggior parte in R, ma anche altri linguaggi sono ammessi (Matlab, Python).
    Laddove possibile, si consiglia di venire a lezione con un notebook.

    Programma del corso

    Richiami di Analisi Multivariata e Funzioni Matriciali (0.5 CFU / 4 ore):
    Concetti di base di algebra lineare e analisi multivariata applicati alla visualizzazione (0.5 CFU).
    Principi Fondamentali di Visualizzazione Grafica (1 CFU / 8 ore):
    Percorso evolutivo dei grafici statistici e storia della visualizzazione dati (0.25 CFU).
    Principi di percezione visiva e stima visiva (0.25 CFU).
    Criteri per realizzare grafici efficaci, evitare distorsioni visive e applicare il "data-ink ratio" (0.25 CFU).
    Principi del design grafico applicati alla visualizzazione (0.25 CFU).
    Grafici per Dati Univariati (1 CFU / 8 ore):
    Dati numerici: istogrammi, density plot (KDE), box-plot, violin plot (0.5 CFU).
    Dati categorici: diagrammi a barre, diagrammi a torta (con critica), steam and leaf plot (0.3 CFU).
    Serie storiche: diagrammi a spezzata, diagrammi ad area, grafici per dati territoriali (0.2 CFU).
    Grafici per Dati Bivariati (1 CFU / 8 ore):
    Scatter plot (diagrammi di dispersione) e variazioni (bag-plot) (0.3 CFU).
    Heat-map e correlation plot (0.35 CFU).
    Density plot bivariati (0.35 CFU).
    Grafici per Dati Trivariati (1 CFU / 8 ore):
    Scatter plot 3D e density plot 3D (0.4 CFU).
    Contour plot e visualizzazioni contour 3D (0.3 CFU).
    Introduzione a grafici 4D, interattivi e animati (0.3 CFU).
    Visualizzazione di Dati Multidimensionali (1 CFU / 8 ore):
    Mosaic plot per dati categorici multidimensionali (0.25 CFU).
    Tree-map, dendrogrammi e parallel coordinates (0.4 CFU).
    Bi-plot e introduzione all'Analisi in Componenti Principali (PCA) (0.35 CFU).
    Grafici per Strutture Particolari di Dati (1 CFU / 8 ore):
    Dati reticolari: network plot e visualizzazione di reti (0.35 CFU).
    Dati testuali: word cloud e text visualization (0.2 CFU).
    Dati di flusso: circular plot, stream graph (0.25 CFU).
    Grafici per matrici di distanze (0.2 CFU).
    Elementi di Statistical Reporting (3 CFU / 24 ore):
    Principi di progettazione di report statistici: struttura, layout, tipografia (1 CFU).
    Integrazione di testo, tabelle e grafici nel report (0.75 CFU).
    Uso di Rmarkdown e Quarto per la generazione automatica di report (0.75 CFU).
    Poster e infografiche: principi di design grafico (0.5 CFU).


    English

    Teaching language

    ENGLISH

    Contents

    The teaching provides methodological and practical competencies for visual analysis and communication of data of diverse nature. The program integrates theoretical foundations of visual perception, grammar of graphics, and graphic design with practical implementation using statistical software (R, ggplot, Rmarkdown, Quarto). Topics include: principles of effective visualization, univariate graphs (histograms, density plots, box-plots), bivariate (scatter plots, heat-maps, bag-plots), trivariate (contour plots, 3D scatter), multidimensional (mosaic plots, parallel coordinates, tree-maps), graphs for particular data structures (network plots, word clouds, stream graphs), and fundamentals of effective statistical report writing.

    Textbook and course materials

    Recommended textbooks (some are freely available for download from the Library of the University)
    Claus O. Wilke, Fundamentals of Data Visualization, O'Reilly
    free available with code here: https://clauswilke.com/dataviz/

    R workflow: https://hbiostat.org/rflow/

    Edward R. Tufte, “The Visual Display of Quantitative Information”
    Leland Wilkinson, The Grammar of Graphics, 2nd edition, Springer
    AA.VV., Handbook of Data Visualization, Springer

    Websites:
    https://ggplot2.tidyverse.org/
    https://matplotlib.org/
    https://seaborn.pydata.org/
    https://towardsdatascience.com/data-visualization/home

    Course objectives

    Upon completion, the student will be able to:
    - Knowledge and understanding: Mastering perception principles, grammar of graphics, and reporting rules.
    - Applying knowledge and understanding: Producing informative infographics and interactive visualizations using R/Python.
    - Making judgements: Critically evaluating and redesigning graphics to improve effectiveness.
    - Communication skills: Developing data storytelling and structuring self-contained professional reports.
    - Learning skills: Synthesizing research literature to justify graphical practice recommendations.

    Prerequisites

    Knowledge of descriptive statistics and basic programming skills are required.

    Teaching methods

    48 hours of lectures using slides and 24 hours of hands-on exercises using statistical software

    Evaluation methods

    Two integrated and sequential assessments:
    Quizzes (approximately 30): Multiple-choice and short-answer tests on all program topics (duration approximately 60 minutes), aimed at verifying theoretical knowledge and understanding of visualization principles, visual perception, and diverse graphical techniques.
    Oral exam (30-45 min): Discussion of course theoretical content with open questions on visualization principles, design choices, applicability of techniques to different data types, and critical interpretation of visualizations. The oral exam verifies conceptual mastery, argumentation ability, and deep understanding of addressed principles.

    Evaluation structure:
    Oral admission requirement: Minimum 18/30 in quiz required to access oral exam. If you do not reach this score, you can repeat the quiz in a later session.
    Final grade: Final grade (out of 30) = 40% quiz + 60% oral.

    Quiz validity: Quiz mark remains valid for entire exam session.

    Evaluation parameters: (1) Quiz answer correctness and theoretical understanding, (2) Deep knowledge of visual perception and grammar of graphics principles, (3) Argumentation and design choice justification ability, (4) Conscious principle application to different data types, (5) Critical ability to evaluate and critique existing visualizations, (6) Exposition quality and specialized language use.

    GradeAssessment Criteria
    30 - 30LQuiz: almost all answers correct (28-30/30). Oral: excellent mastery of all visualization, visual perception, and graphic design principles; impeccable theoretical argumentation; excellent critical ability; conscious principle application to complex and novel cases; very fluent communication and perfect specialized language use.

    26 - 29Quiz: good number of correct responses (26-28/30 approx.). Oral: solid knowledge of main principles; good argumentation ability; conscious principle understanding; ability to apply techniques to specific problems; some notes on more complex topics; good specialized language.

    22 - 25Quiz: correct main-topic responses but some errors (20-23/30 approx.). Oral: fair knowledge of visualization principles and techniques; adequate but not always in-depth argumentation; sufficiently critical understanding; correct technique application to standard cases; appropriate technical language.

    18 - 21Minimum requirements: Quiz at passing threshold (18-19/30). Oral: basic knowledge of graph types and essential visualization principles; minimal argumentation ability; elementary concept understanding; mechanical technique application; difficulty in critical reasoning; simple but adequate language.

    Other information

    It is expected students to attend class and be actively engaged. We will discuss, critique, and redesign graphics, work through practical exercises, demonstrate useful software, etc. These are not things students can recreate by reading the slides afterwards. If a student misses enough classes, his/her grade will be affected.
    In addition to the recommended textbooks, the teacher will provide scientific or informative articles and notes on specific subjects.
    The laboratory will be developed mostly in R, but other languages are also allowed (Matlab, Python).
    If possible, it encouraged to follow all the lectures with a notebook.

    Course Syllabus

    Recalls of Multivariate Analysis and Matrix Functions (0.5 CFU / 4h):
    Basic concepts of linear algebra and multivariate analysis applied to visualization (0.5 CFU).
    Fundamental Principles of Graphical Visualization (1 CFU / 8h):
    Evolutionary path of statistical graphs and history of data visualization (0.25 CFU).
    Principles of visual perception and visual estimation (0.25 CFU).
    Criteria for creating effective graphs, avoiding visual distortions, and applying the "data-ink ratio" (0.25 CFU).
    Principles of graphic design applied to visualization (0.25 CFU).
    Graphs for Univariate Data (1 CFU / 8h):
    Numerical data: histograms, density plots (KDE), box-plots, violin plots (0.5 CFU).
    Categorical data: bar diagrams, pie diagrams (with critique), stem and leaf plots (0.3 CFU).
    Time series: line plots, areal plots, maps (0.2 CFU).
    Graphs for Bivariate Data (1 CFU / 8h):
    Scatter plots (dispersion diagrams) and variations (bag-plots) (0.3 CFU).
    Heat-maps and correlation plots (0.35 CFU).
    Bivariate density plots (0.35 CFU).
    Graphs for Trivariate Data (1 CFU / 8h):
    3D scatter plots and 3D density plots (0.4 CFU).
    Contour plots and 3D contour visualizations (0.3 CFU).
    Introduction to 4D graphs, interactive and animated plots (0.3 CFU).
    Visualization of Multidimensional Data (1 CFU / 8h):
    Mosaic plots for multidimensional categorical data (0.25 CFU).
    Tree-maps, dendrograms, and parallel coordinates (0.4 CFU).
    Bi-plots and introduction to Principal Component Analysis (PCA) (0.35 CFU).
    Graphs for Particular Data Structures (1 CFU / 8h):
    Network data: network plots and network visualization (0.35 CFU).
    Textual data: word clouds and text visualization (0.2 CFU).
    Flow data: circular plots and stream graphs (0.25 CFU).
    Graphs for distance matrices (0.2 CFU).
    Elements of Statistical Reporting (3 CFU / 24h):
    Principles of statistical report design: structure, layout, typography (1 CFU).
    Integration of text, tables, and graphics in the report (0.75 CFU).
    Use of Rmarkdown and Quarto for automatic report generation (0.75 CFU).
    Posters and infographics: principles of graphic design (0.5 CFU).


    facebook logoinstagram buttonyoutube logotype