mail unicampaniaunicampania webcerca

    Antonio IRPINO

    Insegnamento di STATISTICAL PROGRAMMING

    Corso di laurea in DATA ANALYTICS

    SSD: SECS-S/01

    CFU: 6,00

    ORE PER UNITÀ DIDATTICA: 48,00

    Periodo di Erogazione: Secondo Semestre

    Italiano

    Lingua di insegnamento

    Inglese

    Contenuti

    L’insegnamento fornisce un’introduzione alla programmazione statistica negli ambienti R e Python. Vengono trattati la gestione dei dati (importazione/esportazione), l’uso di script, la manipolazione tramite operatori logici, la creazione di illustrazioni grafiche, l’ottimizzazione del codice e la creazione di pacchetti personalizzati.

    Testi di riferimento

    A first course in statistical programming with R
    Braun John, Murdoch Duncan James
    Cambridge, N.Y. : Cambridge University Press : 2007 : 163 s. :
    ISBN: 978-0-521-87265-2

    Venables W. N., Smith D. M., the R Core Team
    An Introduction to R
    R Core Team :
    https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf

    S programming
    Venables W. N.q (William N.), Ripley Brian D.
    New York : Springer : cop. 2000 : x, 264 s. :
    ISBN: 0-387-98966-8

    Chambers John M.
    Software for data analysis : programming with R
    New York, N.Y. : Springer : cop. 2008. : 498 p. :
    ISBN: 978-0-387-75935-7

    Obiettivi formativi

    Al termine dell’insegnamento, lo studente dovrà essere in grado di:
    - Conoscenza e capacità di comprensione: Comprendere la sintassi di R e Python, i tipi di dati e le strutture di controllo del flusso.
    - Utilizzazione delle conoscenze e capacità di comprensione: Realizzare programmi per l’allocazione e manipolazione di dati e condurre studi di simulazione Monte Carlo.
    - Capacità di trarre conclusioni (Autonomia di giudizio): Valutare le prestazioni del codice scritto e identificare strategie di ottimizzazione.
    - Abilità comunicative: Illustrare e commentare i risultati di modelli statistici e la logica degli script prodotti.
    - Capacità di apprendere: Creare i propri pacchetti R per gestire analisi specifiche non standard in modo autonomo.

    Prerequisiti

    Conoscenze base di statistica descrittiva e inferenziale e di programmazione.

    Metodologie didattiche

    Lezioni frontali con utilizzo di slides.

    Metodi di valutazione

    L’esame prevede circa 30 quiz a risposta chiusa e la discussione di esempi di programmazione scelti dallo studente o proposti dal docente. La valutazione segue la seguente griglia:

    VotoCriteri di Valutazione
    30 - 30LRisposta corretta a quasi tutti i quiz; presentazione di script complessi, efficienti e commentati con rigore tecnico.
    26 - 29Buona padronanza dei quiz; capacità di gestire cicli e funzioni in modo corretto e fluido.
    22 - 25Conoscenza discreta della sintassi; corretta risoluzione di problemi di programmazione standard.
    18 - 21Conoscenza minima delle strutture dati e dei quiz; capacità base di esecuzione script.

    Altre informazioni

    Si raccomanda una frequenza costante e partecipativa. Oltre ai testi consigliati, il docente fornirà dispense su argomenti specifici.
    Il corso utilizzerà per la maggior parte R, ma anche altri linguaggi sono ammessi (Matlab, Python).
    Laddove possibile, si consiglia di venire a lezione con un notebook.

    Programma del corso

    L’insegnamento è diviso in tre moduli (pesi stimati):
    1. Introduzione a R e RStudio (1.5 CFU / 12 ore): Caratteristiche base, vettori, fattori, matrici, liste, data frame e gestione I/O.
    2. Programmazione con R (2.5 CFU / 20 ore): Controllo del flusso, funzioni, debug, linee guida per l’efficienza e creazione pacchetti.
    3. Simulazioni (2 CFU / 16 ore): Metodi Monte Carlo e generazione di numeri pseudocasuali.


    English

    Teaching language

    English

    Contents

    The teaching provides an introduction to statistical programming in R and Python. Topics include data management (import/export), script usage, manipulation via logical operators, graphical illustrations, code optimization, and custom package creation.

    Textbook and course materials

    A first course in statistical programming with R
    Braun John, Murdoch Duncan James
    Cambridge, N.Y. : Cambridge University Press : 2007 : 163 s. :
    ISBN: 978-0-521-87265-2

    Venables W. N., Smith D. M., the R Core Team
    An Introduction to R
    R Core Team :
    https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf

    S programming
    Venables W. N.q (William N.), Ripley Brian D.
    New York : Springer : cop. 2000 : x, 264 s. :
    ISBN: 0-387-98966-8

    Chambers John M.
    Software for data analysis : programming with R
    New York, N.Y. : Springer : cop. 2008. : 498 p. :
    ISBN: 978-0-387-75935-7

    Course objectives

    Upon completion, the student will be able to:
    - Knowledge and understanding: Understanding R and Python syntax, data types, and flow control.
    - Applying knowledge and understanding: Implementing programs for data manipulation and performing Monte Carlo simulations.
    - Making judgements: Evaluating code performance and identifying optimization strategies.
    - Communication skills: Illustrating and discussing statistical model results and script logic.
    - Learning skills: Developing custom R packages for autonomous handling of non-standard specific analyses.

    Prerequisites

    Basic knowledge of descriptive and inferential statistics and of programming.

    Teaching methods

    Frontal lectures with slides for a total of 48 hours.

    Evaluation methods

    The exam consists of 30 closed-ended quizzes and a discussion of programming examples. Grading scale:

    GradeAssessment Criteria
    30 - 30LCorrect answers to almost all quizzes; presentation of complex, efficient, and well-commented scripts.
    26 - 29Good command of quizzes; ability to correctly manage loops and functions.
    22 - 25Fair knowledge of syntax; correct resolution of standard programming problems.
    18 - 21Minimum knowledge of data structures and quizzes; basic script execution skills.

    Other information

    It is expected students to attend class and be actively engaged. In addition to the recommended textbooks, the teacher will provide notes on specific subjects.
    The course will use mostly the R language, but other languages are also allowed (Matlab, Python).
    If possible, it encouraged to follow all the lectures with a notebook.

    Course Syllabus

    The teaching is divided into three modules (estimated weights):
    1. Intro to R and RStudio (1.5 CFU / 12 hours): Vectors, factors, matrices, data frames, and I/O.
    2. Programming with R (2.5 CFU / 20 hours): Flow control, functions, debugging, and package creation.
    3. Simulations (2 CFU / 16 hours): Monte Carlo methods and pseudorandom numbers.

    facebook logoinstagram buttonyoutube logotype