Dipartimento di Matematica e Fisica - Docenti

Laura VERDE

Insegnamento di LABORATORIO DI BIO-INFORMATICA

Corso di laurea in SCIENZE BIOLOGICHE

SSD: ING-INF/05
CFU: 6,00
ORE PER UNITÀ DIDATTICA: 48,00
Periodo di Erogazione: Secondo Semestre

Italiano

Lingua di insegnamento	ITALIANO
Contenuti	Primo modulo: Genomi, genomica e avvento della bioinformatica. Informatica di base: algoritmi, linguaggi di programmazione e basi di dati. Inferenza statistica: test d’ipotesi parametrici e non parametrici. Allineamento tra sequenze. Sequenziamento degli acidi nucleici: Tecniche di sequenziamento NGS, formato dei dati genomici. Ricostruzione e annotazione di genomi. Analisi del trascrittoma: annotazioni di geni e trascritti alternativi, approcci sperimentali per l’analisi del trascrittoma, analisi di dati RNA-Seq, analisi dei livelli di espressione genica, funzione dei geni differenzialmente espressi. Secondo Modulo: principali tipi di dati in Python con relative operazioni e metodi di conversione; Algoritmi e diagrammi di flusso; Logica booleana e istruzioni di controllo del flusso; Inserimento dati; Struttura dati complessa; Tuple; Manipolazione di set di dati; Gestione degli errori; cicli while e for; Funzioni e parametri; variabili globali e locali; i moduli della Standard Library e quelli accessibili tramite pip; Come creare e utilizzare ambienti virtuali. Terzo Modulo: Proteomi e proteine. Annotazione funzionale di proteine. Interazioni proteiche. Banche dati: sequenze proteiche-Uniprot, motivi funzionali proteici-PROSITE ed ELM, strutture proteiche-PDB e PDBe, interazioni proteiche-IntAct/MINT e STRING. Metodi bioinformatici per l’analisi di sequenze proteiche: descrittori di elementi funzionali nelle sequenze proteiche. Strutture proteiche: livelli di descrizione delle strutture proteiche, metodi sperimentali per la determinazione della struttura: diffrazione ai raggi X e Spettroscopia di risonanza magnetica nucleare (NMR). Predizione della struttura delle proteine: struttura secondaria e terziaria. Metodi per l’analisi delle strutture proteiche. Software per l’ analisi e la visualizzazione della struttura delle proteine. Dinamica e docking molecolare.
Testi di riferimento	Manuela Helmer Citterich, Fabrizio Ferrè, Giulio Pavesi , Graziano Pesole, Chiara Romualdi- Fondamenti di bioinformatica-Zanichelli Stefano Pascarella, Alessandro Paiardini- Bioinformatica Dalla sequenza alla struttura delle proteine- Zanichelli https://www.python.org/doc/ https://www.python.it/doc/
Obiettivi formativi	Il presente corso fornirà i concetti di base della bioinformatica al fine di consentire un’analisi critica di dati genomici e proteomici. Il corso si articola in tre parti (moduli). Nella prima parte lo studente acquisirà concetti di base di programmazione e conoscenze di metodologie per l’allineamento di sequenze, l’analisi di dati di espressione genica e l’analisi di proteine. Nella seconda parte del corso, lo studente acquisirà le basi della programmazione in Python e sarà in grado di sviluppare programmi che prendono l'input dell'utente e lo elaborano. Inoltre, lo studente imparerà come archiviare e manipolare i dati e creare programmi in base a requisiti specifici. Nella terza parte del corso, lo studente apprenderà conoscenze approfondite relative all’uso di programmi di grafica molecolare e sarà in grado di accedere alle banche dati disponibili in rete per: l’ analisi delle strutture proteiche ottenute mediante X-ray e NMR; l’uso di informazioni strutturali per progettare esperimenti di mutazione sito diretta, la predizione della struttura secondaria e terziaria delle proteine mediante homology modeling, la predizione della struttura tridimensionale di complessi proteici mediante tecniche di molecular docking.
Prerequisiti	Conoscenza dei principi di base di biologia molecolare e strutturale, genetica e biochimica.
Metodologie didattiche	- Lezioni frontali in aula su tutti gli argomenti del corso. Le lezioni sono svolte mediante l’ausilio della lavagna e mediante la proiezione di diapositive
Metodi di valutazione	Esame orale.
Altre informazioni	Lo studente potrà avvalersi del materiale didattico (dispense, esercizi, ecc.) messo a disposizione sul sito web del Dipartimento di Scienze e Tecnologie Ambientali Biologiche e Farmaceutiche (https://www.distabif.unicampania.it/dipartimento/docenti/) Il docente è disponibile per ricevimento studenti nei giorni indicati sulla scheda insegnamento e su richiesta inoltrata via e-mail.
Programma del corso	Primo modulo: Genomi, genomica e avvento della bioinformatica. Informatica di base: algoritmi, linguaggi di programmazione e basi di dati. Inferenza statistica: test d’ipotesi parametrici e non parametrici. Allineamento tra sequenze. Sequenziamento degli acidi nucleici: Tecniche di sequenziamento NGS, formato dei dati genomici. Ricostruzione e annotazione di genomi. Analisi del trascrittoma: annotazioni di geni e trascritti alternativi, approcci sperimentali per l’analisi del trascrittoma, analisi di dati RNA-Seq, analisi dei livelli di espressione genica, funzione dei geni differenzialmente espressi. Secondo Modulo: principali tipi di dati in Python con relative operazioni e metodi di conversione; Algoritmi e diagrammi di flusso; Logica booleana e istruzioni di controllo del flusso; Inserimento dati; Struttura dati complessa; Tuple; Manipolazione di set di dati; Gestione degli errori; cicli while e for; Funzioni e parametri; variabili globali e locali; i moduli della Standard Library e quelli accessibili tramite pip; Come creare e utilizzare ambienti virtuali con venv. Terzo Modulo: Proteomi e proteine. Annotazione funzionale di proteine. Interazioni proteiche. Banche dati: sequenze proteiche-Uniprot, motivi funzionali proteici-PROSITE ed ELM, strutture proteiche-PDB e PDBe, interazioni proteiche-IntAct/MINT e STRING. Metodi bioinformatici per l’analisi di sequenze proteiche: descrittori di elementi funzionali nelle sequenze proteiche. Strutture proteiche: livelli di descrizione delle strutture proteiche, metodi sperimentali per la determinazione della struttura: diffrazione ai raggi X e Spettroscopia di risonanza magnetica nucleare (NMR). Predizione della struttura delle proteine: struttura secondaria (reti neurali artificiali), struttura terziaria (modeling comparativo o homology modeling, threading). Predizione della struttura terziaria mediante il metodo I-TASSER. Metodi per l’analisi delle strutture proteiche: Ordine e disordine, confronto di strutture, metodi strutturali per l’annotazione funzionale. Software per l’ analisi e la visualizzazione della struttura delle proteine: PyMoL, CHIMERA, PROCHECK. Interazioni proteiche: metodi per l’analisi delle interazioni proteiche (interferenza per omologia, mutazioni correlate, profili filogenetici, similarità di alberi filogenetici, prossimità genomica, espressione correlata, docking). Software per il docking molecolare: Autodock, Dockthor. Interazione tra proteine e ligandi: analisi strutturale delle interazioni.

English

Teaching language	Italian
Contents	First module: Genomes, genomics and the advent of bioinformatics. Basic computer science: algorithms, programming languages and databases. Statistical inference: parametric and non-parametric hypothesis tests. Alignment between sequences. Nucleic acid sequencing: NGS sequencing techniques, genomic data format. Reconstruction and annotation of genomes. Transcriptome analysis: annotations of genes and transcripts, experimental approaches for transcriptome analysis, analysis of RNA-Seq data, analysis of gene expression levels, functions of differentially expressed genes. Second module: The main data types in Python with related operations and conversion methods; Algorithms and flowcharts; Boolean logic and flow control instructions; Data input; Complex data structure; Tuples; Dataset manipulation; Error handling; While and for loops; Functions and parameters; global and local variables; the modules of the Standard Library and those accessible via pip; How to create and use Virtual Environments with venv. Third module: Proteomes and proteins. Functional aspects of proteins. Protein interactions. Protein databases: protein sequences (Uniprot), functional structural motifs of proteins (PROSITE and ELM), protein structures (PDB and PDBe), protein interactions (IntAct/MINT and STRING). Bioinformatics methods for protein sequence analysis: descriptors of functional elements in protein sequences. Protein structures: description of the structural organization of protein structures; experimental methods for protein structural determination: X-Ray and Nuclear Magnetic Resonance (NMR) spectroscopy. Prediction of the secondary and tertiary structure. Methods for analyzing protein structures. Molecular Dynamics simulations and Molecular Docking.
Textbook and course materials	Manuela Helmer Citterich, Fabrizio Ferrè, Giulio Pavesi , Graziano Pesole, Chiara Romualdi- Fondamenti di bioinformatica-Zanichelli Stefano Pascarella, Alessandro Paiardini- Bioinformatica Dalla sequenza alla struttura delle proteine- Zanichelli https://www.python.org/doc/ https://www.python.it/doc/
Course objectives	This course will provide the basic concepts of bioinformatics aiming a critical analysis of genomic and proteomic data. The course is divided in three parts (modules). In the first part of the course, the student will acquire basic programming concepts and knowledge of methodologies for the alignment of sequences, the analysis of gene expression data and the analysis of proteins. During the second module, the student will learn the basics of programming in python, and will be able to develop programs that take user input and process it. In addition, the student will learn how to store and manipulate data, and build programs according to specific requirements. In the last part of the course, the student will learn in-depth knowledge related of the use of molecular graphics software and he will be able to access to the on-line databases for: the structural analysis of protein structures obtained via X-ray and NMR; the use of conformational information to design direct site mutation experiments; the prediction of the secondary and tertiary structure of proteins by homology modeling methodologies; the prediction of the 3D structure of protein-protein and protein-ligand complexes using molecular docking techniques.
Prerequisites	Knowledge of the basic principles of molecular and structural biology, genetics and biochemistry.
Teaching methods	- Frontal lectures on all course topics. The lectures are performed with the help of the blackboard and by the projection of slides
Evaluation methods	Oral examination
Other information	The student will be provided with learning material available on the website of Department of Environmental, Biological and Pharmaceutical Sciences and Technologies (https://www.distabif.unicampania.it/dipartimento/docenti/). The professor is available to receive the students in the days indicated in their syllabus or after a student request via e-mail.
Course Syllabus	First module: Genomes, genomics and the advent of bioinformatics. Basic computer science: algorithms, programming languages and databases. Statistical inference: parametric and non-parametric hypothesis tests. Alignment between sequences. Nucleic acid sequencing: NGS sequencing techniques, genomic data format. Reconstruction and annotation of genomes. Transcriptome analysis: annotations of genes and transcripts, experimental approaches for transcriptome analysis, analysis of RNA-Seq data, analysis of gene expression levels, functions of differentially expressed genes. Second module: The main data types in Python with related operations and conversion methods; Algorithms and flowcharts; Boolean logic and flow control instructions; Data input; Complex data structure; Tuples; Dataset manipulation; Error handling; While and for loops; Functions and parameters; global and local variables; the modules of the Standard Library and those accessible via pip; How to create and use Virtual Environments with venv. Third module: Proteomes and proteins. Functional aspects of proteins. Protein interactions. Protein databases: protein sequences (Uniprot), functional structural motifs of proteins (PROSITE and ELM), protein structures (PDB and PDBe), protein interactions (IntAct/MINT and STRING). Bioinformatics methods for protein sequence analysis: descriptors of functional elements in protein sequences. Protein structures: description of the structural organization of protein structures; experimental methods for protein structural determination: X-Ray and Nuclear Magnetic Resonance (NMR) spectroscopy. Prediction of the secondary (artificial neural networks) and tertiary (homology modeling, threading) protein structure. 3D structural prediction using the I-TASSER methodology. Methods for analyzing protein structures: Order and disorder, comparison of protein structures, structural methods for functional annotation. Software for the analysis and visualization of the protein structure: PyMol, CHIMERA, PROCHECK. Protein interactions: methods for analyzing protein interactions ( homology interference, related mutations, phylogenetic profiles, similarities of phylogenetic trees, genomic proximity, related expression, docking). Software for molecular docking studies: Autodock, Dockthor. Protein-ligand interactions: structural analysis of protein interaction networks.