mail unicampaniaunicampania webcerca

    Antonio IRPINO

    Insegnamento di ANALISI DEI DATI PER L'ECONOMIA

    Corso di laurea magistrale in MATEMATICA

    SSD: SECS-S/01

    CFU: 8,00

    ORE PER UNITÀ DIDATTICA: 72,00

    Periodo di Erogazione: Secondo Semestre

    Italiano

    Lingua di insegnamento

    ITALIANO

    Contenuti

    Richiami di statistica descrittiva: concetti di base. Metodi di analisi multidimensionale dei dati: obiettivi e tecniche e strutture di dati. Tecniche statistiche di riduzione di dati multivariati e multidimensionali. Tecniche di classificazione dei dati sia supervisionate che non supervisionate. Analisi statistica dei dati con R.

    Testi di riferimento

    Carlo Lauro, Gherghi Marco. Analisi Multidimensionale dei Dati. RCE Edizioni
    Sergio Bolasco. Analisi multidimensionale dei dati. Carocci Editore.

    Obiettivi formativi

    Conoscenza e capacità di comprensione (knowledge and understanding):
    Il corso è finalizzato a fornire le basi metodologiche ed applicative per la comprensione dei concetti
    comunemente utilizzati nell'Analisi dei dati, cioè di quei metodi il cui obiettivo consiste nel produrre
    delle dimensioni (fattori) attraverso le quali semplificare, sintetizzare e rappresentare un fenomeno
    oggetto di studio. Le tecniche presentate nell'ambito del corso saranno pertanto trattate da un punto di
    vista applicativo attraverso il meta-linguaggio di programmazione cran-R.
    Capacità di applicare conoscenza e comprensione (applying knowledge and understanding):
    L’obiettivo consisterà nel fornire agli studenti gli strumenti necessari per sviluppare la capacità di
    applicare i concetti appresi attraverso lo svolgimento di analisi (in laboratorio informatico) da
    condursi su banche dati che permettono di coprire un’ampia gamma di problemi nel contesto
    economico e finanziario.
    Abilità comunicative (communication skills):
    Al termine dell’insegnamento lo studente dovrà dimostrare di essere in grado di:
    • selezionare in maniera critica il metodo di analisi maggiormente rispondente alle esigenze del
    fenomeno oggetto di studio;
    • di interpretare e presentare i risultati ottenuti.

    Prerequisiti

    Nozioni di Algebra lineare e conoscenza dei concetti di base di Probabilità e Statistica

    Metodologie didattiche

    72 ore erogati con didattica frontale e 24 ore di esercitazione in laboratorio

    Metodi di valutazione

    Per la verifica dell'apprendimento è prevista una prova orale con discussione di un elaborato scritto relativo ad
    un caso studio risolto utilizzando il software R.

    Altre informazioni

    Il corso prevede lezioni frontali con contenuti sia teorici che applicati. Per quanto riguarda questi ultimi, si fa
    uso del software open source R per le elaborazioni e in parte di Excel per la gestione delle banche dati. Le
    lezioni si terranno sia in aula che in laboratorio informatico

    Programma del corso

    Richiami di statistica descrittiva: concetti di base.
    Analisi congiunta di due variabili: la dipendenza e la correlazione.
    Introduzione all'analisi congiunta di più variabili
    Metodi di analisi multidimensionale dei dati: obiettivi e tecniche e strutture di dati
    Sintesi dell'informazione
    - proiezione ortogonale;
    - ricerca del sottospazio di proiezione ottimale;
    - formalizzazione e soluzione del problema;
    - autovalori e autovettori;
    - capacità informativa della sintesi.
    Analisi in componenti principali
    - Definizione del metodo;
    - trasformazione della matrici di partenza;
    - formalizzazione del metodo nello spazio delle variabili;
    - scelta del numero di dimensioni;
    - contributi agli assi e qualità della rappresentazione;
    - formalizzazione del metodo nello spazio degli individui;
    - rappresentazione congiunta unità/variabili.
    Analisi delle corrispondenze
    - Definizione e matrice dei dati di partenza;
    - misure di connessione;
    - trasformazioni su tabella a doppia entrata: profili riga e colonna;
    - interpretazione geometrica;
    - Formalizzazione del problema;
    - Esempi di applicazione.
    Analisi corrispondenze multiple
    - codifica dell'informazione;
    - collegamento con il caso bivariato;
    - formalizzazione del problema;
    - dimensionalità della soluzione;
    - esempi di applicazione.
    Classificazione automatica
    - misure di dissimilarità e distanze;
    - metriche ed ultrametriche;
    - classificazione gerarchica;
    - criteri di aggregazione;
    - procedura agglomerativa;
    - qualità della soluzione;
    - classificazione non gerarchica;
    - procedure (centri mobili, nubi dinamiche, K-medie);
    - Approcci ibridi: analisi fattoriale e classificazione automatica;
    - Approcci ibridi: combinazione di metodi gerarchici e non gerarchici.
    Analisi statistica dei dati con R
    - Introduzione all’ambiente R: nozioni di sintassi;
    - Vettori, Matrici, Array e Liste in R
    - Organizzazione ed elaborazione dei dati in R;
    - Il dataframe: importazione dei dati;
    - Introduzione all’analisi dei dati in R: analisi in componenti principali, analisi delle corrispondenze e
    cluster analysis;
    - l’ambiente grafico in R.
    Materiale didattico: http://www.matfis.unicampania.it/dipartimento/docenti/71-romano-elvira

    English

    Teaching language

    Italian

    facebook logoinstagram buttonyoutube logotype