Laura VERDE
Insegnamento di LABORATORIO DI BIO-INFORMATICA
Corso di laurea in SCIENZE BIOLOGICHE
SSD: ING-INF/05
CFU: 6,00
ORE PER UNITÀ DIDATTICA: 48,00
Periodo di Erogazione: Secondo Semestre
Italiano
Lingua di insegnamento | ITALIANO |
Contenuti | Primo modulo: Genomi, genomica e avvento della bioinformatica. Informatica di base: algoritmi, linguaggi di programmazione e basi di dati. Inferenza statistica: test d’ipotesi parametrici e non parametrici. Allineamento tra sequenze. Sequenziamento degli acidi nucleici: Tecniche di sequenziamento NGS, formato dei dati genomici. Ricostruzione e annotazione di genomi. Analisi del trascrittoma: annotazioni di geni e trascritti alternativi, approcci sperimentali per l’analisi del trascrittoma, analisi di dati RNA-Seq, analisi dei livelli di espressione genica, funzione dei geni differenzialmente espressi. Secondo Modulo: principali tipi di dati in Python con relative operazioni e metodi di conversione; Algoritmi e diagrammi di flusso; Logica booleana e istruzioni di controllo del flusso; Inserimento dati; Struttura dati complessa; Tuple; Manipolazione di set di dati; Gestione degli errori; cicli while e for; Funzioni e parametri; variabili globali e locali; i moduli della Standard Library e quelli accessibili tramite pip; Come creare e utilizzare ambienti virtuali. Terzo Modulo: Proteomi e proteine. Annotazione funzionale di proteine. Interazioni proteiche. Banche dati: sequenze proteiche-Uniprot, motivi funzionali proteici-PROSITE ed ELM, strutture proteiche-PDB e PDBe, interazioni proteiche-IntAct/MINT e STRING. Metodi bioinformatici per l’analisi di sequenze proteiche: descrittori di elementi funzionali nelle sequenze proteiche. Strutture proteiche: livelli di descrizione delle strutture proteiche, metodi sperimentali per la determinazione della struttura: diffrazione ai raggi X e Spettroscopia di risonanza magnetica nucleare (NMR). Predizione della struttura delle proteine: struttura secondaria e terziaria. Metodi per l’analisi delle strutture proteiche. Software per l’ analisi e la visualizzazione della struttura delle proteine. Dinamica e docking molecolare. |
Testi di riferimento | Manuela Helmer Citterich, Fabrizio Ferrè, Giulio Pavesi , Graziano Pesole, Chiara Romualdi- |
Obiettivi formativi | Il presente corso fornirà i concetti di base della bioinformatica al fine di consentire un’analisi critica di dati genomici e proteomici. Il corso si articola in tre parti (moduli). Nella prima parte lo studente acquisirà concetti di base di programmazione e conoscenze di metodologie per l’allineamento di sequenze, l’analisi di dati di espressione genica e l’analisi di proteine. Nella seconda parte del corso, lo studente acquisirà le basi della programmazione in Python e sarà in grado di sviluppare programmi che prendono l'input dell'utente e lo elaborano. Inoltre, lo studente imparerà come archiviare e manipolare i dati e creare programmi in base a requisiti specifici. Nella terza parte del corso, lo studente apprenderà conoscenze approfondite relative all’uso di programmi di grafica molecolare e sarà in grado di accedere alle banche dati disponibili in rete per: l’ analisi delle strutture proteiche ottenute mediante X-ray e NMR; l’uso di informazioni strutturali per progettare esperimenti di mutazione sito diretta, la predizione della struttura secondaria e terziaria delle proteine mediante homology modeling, la predizione della struttura tridimensionale di complessi proteici mediante tecniche di molecular docking. |
Prerequisiti | Conoscenza dei principi di base di biologia molecolare e strutturale, genetica e biochimica. |
Metodologie didattiche | - Lezioni frontali in aula su tutti gli argomenti del corso. Le lezioni sono svolte mediante l’ausilio della lavagna e mediante la proiezione di diapositive |
Metodi di valutazione | Esame orale. |
Altre informazioni | Lo studente potrà avvalersi del materiale didattico (dispense, esercizi, ecc.) messo a disposizione sul sito web del Dipartimento di Scienze e Tecnologie Ambientali Biologiche e Farmaceutiche (https://www.distabif.unicampania.it/dipartimento/docenti/) |
Programma del corso | Primo modulo: Genomi, genomica e avvento della bioinformatica. Informatica di base: algoritmi, linguaggi di programmazione e basi di dati. Inferenza statistica: test d’ipotesi parametrici e non parametrici. Allineamento tra sequenze. Sequenziamento degli acidi nucleici: Tecniche di sequenziamento NGS, formato dei dati genomici. Ricostruzione e annotazione di genomi. Analisi del trascrittoma: annotazioni di geni e trascritti alternativi, approcci sperimentali per l’analisi del trascrittoma, analisi di dati RNA-Seq, analisi dei livelli di espressione genica, funzione dei geni differenzialmente espressi. |
English
Teaching language | Italian |
Contents | First module: Genomes, genomics and the advent of bioinformatics. Basic computer science: algorithms, programming languages and databases. Statistical inference: parametric and non-parametric hypothesis tests. Alignment between sequences. Nucleic acid sequencing: NGS sequencing techniques, genomic data format. Reconstruction and annotation of genomes. Transcriptome analysis: annotations of genes and transcripts, experimental approaches for transcriptome analysis, analysis of RNA-Seq data, analysis of gene expression levels, functions of differentially expressed genes. |
Textbook and course materials | Manuela Helmer Citterich, Fabrizio Ferrè, Giulio Pavesi , Graziano Pesole, Chiara Romualdi- |
Course objectives | This course will provide the basic concepts of bioinformatics aiming a critical analysis of genomic and proteomic data. The course is divided in three parts (modules). In the first part of the course, the student will acquire basic programming concepts and knowledge of methodologies for the alignment of sequences, the analysis of gene expression data and the analysis of proteins. During the second module, the student will learn the basics of programming in python, and will be able to develop programs that take user input and process it. In addition, the student will learn how to store and manipulate data, and build programs according to specific requirements. In the last part of the course, the student will learn in-depth knowledge related of the use of molecular graphics software and he will be able to access to the on-line databases for: the structural analysis of protein structures obtained via X-ray and NMR; the use of conformational information to design direct site mutation experiments; the prediction of the secondary and tertiary structure of proteins by homology modeling methodologies; the prediction of the 3D structure of protein-protein and protein-ligand complexes using molecular docking techniques. |
Prerequisites | Knowledge of the basic principles of molecular and structural biology, genetics and biochemistry. |
Teaching methods | - Frontal lectures on all course topics. The lectures are performed with the help of the blackboard and by the projection of slides |
Evaluation methods | Oral examination |
Other information | The student will be provided with learning material available on the website of Department of Environmental, Biological and Pharmaceutical Sciences and Technologies (https://www.distabif.unicampania.it/dipartimento/docenti/). |
Course Syllabus | First module: Genomes, genomics and the advent of bioinformatics. Basic computer science: algorithms, programming languages and databases. Statistical inference: parametric and non-parametric hypothesis tests. Alignment between sequences. Nucleic acid sequencing: NGS sequencing techniques, genomic data format. Reconstruction and annotation of genomes. Transcriptome analysis: annotations of genes and transcripts, experimental approaches for transcriptome analysis, analysis of RNA-Seq data, analysis of gene expression levels, functions of differentially expressed genes. |