mail unicampaniaunicampania webcerca

    Laura VERDE

    Insegnamento di LABORATORIO DI BIO-INFORMATICA

    Corso di laurea in SCIENZE BIOLOGICHE

    SSD: ING-INF/05

    CFU: 6,00

    ORE PER UNITÀ DIDATTICA: 48,00

    Periodo di Erogazione: Secondo Semestre

    Italiano

    Lingua di insegnamento

    ITALIANO

    Contenuti

    Primo modulo: Genomi, genomica e avvento della bioinformatica. Informatica di base: algoritmi, linguaggi di programmazione e basi di dati. Inferenza statistica: test d’ipotesi parametrici e non parametrici. Allineamento tra sequenze. Sequenziamento degli acidi nucleici: Tecniche di sequenziamento NGS, formato dei dati genomici. Ricostruzione e annotazione di genomi. Analisi del trascrittoma: annotazioni di geni e trascritti alternativi, approcci sperimentali per l’analisi del trascrittoma, analisi di dati RNA-Seq, analisi dei livelli di espressione genica, funzione dei geni differenzialmente espressi. Secondo Modulo: principali tipi di dati in Python con relative operazioni e metodi di conversione; Algoritmi e diagrammi di flusso; Logica booleana e istruzioni di controllo del flusso; Inserimento dati; Struttura dati complessa; Tuple; Manipolazione di set di dati; Gestione degli errori; cicli while e for; Funzioni e parametri; variabili globali e locali; i moduli della Standard Library e quelli accessibili tramite pip; Come creare e utilizzare ambienti virtuali. Terzo Modulo: Proteomi e proteine. Annotazione funzionale di proteine. Interazioni proteiche. Banche dati: sequenze proteiche-Uniprot, motivi funzionali proteici-PROSITE ed ELM, strutture proteiche-PDB e PDBe, interazioni proteiche-IntAct/MINT e STRING. Metodi bioinformatici per l’analisi di sequenze proteiche: descrittori di elementi funzionali nelle sequenze proteiche. Strutture proteiche: livelli di descrizione delle strutture proteiche, metodi sperimentali per la determinazione della struttura: diffrazione ai raggi X e Spettroscopia di risonanza magnetica nucleare (NMR). Predizione della struttura delle proteine: struttura secondaria e terziaria. Metodi per l’analisi delle strutture proteiche. Software per l’ analisi e la visualizzazione della struttura delle proteine. Dinamica e docking molecolare.

    Testi di riferimento

    Manuela Helmer Citterich, Fabrizio Ferrè, Giulio Pavesi , Graziano Pesole, Chiara Romualdi-
    Fondamenti di bioinformatica-Zanichelli
    Stefano Pascarella, Alessandro Paiardini-
    Bioinformatica Dalla sequenza alla struttura delle proteine- Zanichelli
    https://www.python.org/doc/
    https://www.python.it/doc/

    Obiettivi formativi

    Conoscenza e Comprensione:
    Il presente corso fornirà i concetti di base della bioinformatica al fine di consentire un’analisi critica di dati genomici e proteomici.

    Capacità di Applicare la Conoscenza e la Comprensione:
    Il corso si articola in tre parti (moduli). Nella prima parte lo studente acquisirà concetti di base di programmazione e conoscenze di metodologie per l’allineamento di sequenze, l’analisi di dati di espressione genica e l’analisi di proteine. Nella seconda parte del corso, lo studente acquisirà le basi della programmazione in Python e sarà in grado di sviluppare programmi che prendono l'input dell'utente e lo elaborano. Inoltre, lo studente imparerà come archiviare e manipolare i dati e creare programmi in base a requisiti specifici. Nella terza parte del corso, lo studente apprenderà conoscenze approfondite relative all’uso di programmi di grafica molecolare e sarà in grado di accedere alle banche dati disponibili in rete per: l’ analisi delle strutture proteiche ottenute mediante X-ray e NMR; l’uso di informazioni strutturali per progettare esperimenti di mutazione sito diretta, la predizione della struttura secondaria e terziaria delle proteine mediante homology modeling, la predizione della struttura tridimensionale di complessi proteici mediante tecniche di molecular docking.

    Autonomia di Giudizio:
    l’insegnamento favorisce lo sviluppo della capacità di valutare criticamente scenari e problemi complessi nel campo della bioinformatica, consentendo agli studenti di formulare decisioni autonome basate su conoscenze teoriche e dati sperimentali

    Abilità Comunicative: lo studente maturerà un linguaggio scientifico appropriato per descrive le innovative metodiche di bioinformatica. Sarà in grado di presentare in maniera chiara ed efficace i risultati ottenuti mediante l'applicazione delle metodologie di bioinformatica.

    Capacità di Apprendimento:
    l’insegnamento promuove la capacità di apprendimento continuo, supportando l’autonomia decisionale e operativa nello studio e nell’ approfondimento teorico-pratico delle conoscenze acquisite attraverso la consultazione di testi e letteratura scientifica, per affrontare in maniera efficace nuove problematiche del settore della chimica e biologia strutturale. Inoltre, il corso fornirà le nozioni che permetteranno allo studente di proseguire gli studi in ambiti affini con un adeguato livello di autonomia.

    Prerequisiti

    Conoscenza dei principi di base di biologia molecolare e strutturale, genetica e biochimica.

    Metodologie didattiche

    - Lezioni frontali in aula su tutti gli argomenti del corso. Le lezioni sono svolte mediante l’ausilio della lavagna e mediante la proiezione di diapositive

    Metodi di valutazione

    Il raggiungimento degli obiettivi dell’insegnamento è certificato mediante il superamento di un esame con valutazione espressa in trentesimi.

    Esame orale per i moduli 1 e 3; mentre le competenze del modulo 2 verranno valutate con una prova scritta attraverso un questionario di risposte multiple e/o aperte.
    Per i moduli 1 e 3, la prova orale prevede una discussione della durata di circa 30 minuti, volta ad accertare il livello di conoscenza teorica, la capacità di rielaborazione critica e la padronanza del linguaggio tecnico-scientifico.
    La valutazione finale sarà espressa in trentesimi e ottenuta tramite media dei punteggi conseguiti nei tre moduli.
    <18 Non superato: lo studente non dimostra risultati coerenti con i descrittori di conoscenza e comprensione, applicazione, giudizio, comunicazione e capacità di apprendere.
    18-21 Livello sufficiente: lo studente raggiunge i descrittori di base relativi alla conoscenza e comprensione dei contenuti fondamentali e mostra una prima capacità di applicazione in contesti semplici.
    22-24 Livello pienamente sufficiente: lo studente soddisfa i descrittori di conoscenza e comprensione applicate, mostrando capacità di applicare concetti chiave correttamente e iniziare ad analizzare criticamente situazioni pertinenti ai temi dell’insegnamento.
    25-26 Livello buono: lo studente dimostra autonomia di giudizio nel valutare e confrontare scenari pertinenti, applica conoscenze in modo efficace e comunica risultati con chiarezza, riflettendo competenze più consolidate.
    27-29 Livello molto buono: lo studente soddisfa in modo avanzato i descrittori dei cinque ambiti, con padronanza dei contenuti, capacità di valutare criticamente casi complessi e abilità comunicative solide, evidenziate in elaborati e presentazioni.
    30 Livello eccellente: lo studente eccelle in tutti i descrittori di Dublino, con conoscenza approfondita, applicazione sicura e critica, giudizio autonomo, comunicazione efficace e capacità di apprendere in modo continuo e creativo, producendo lavori di elevata qualità sia nella presentazione sia nelle prove scritte/orali. La lode può essere attribuita quando lo studente dimostra, oltre a quanto sopra, particolare originalità, approfondimento e innovazione nell’elaborato e nella presentazione, superando le aspettative standard.

    Altre informazioni

    Lo studente potrà avvalersi del materiale didattico (dispense, esercizi, ecc.) messo a disposizione sul sito web del Dipartimento di Scienze e Tecnologie Ambientali Biologiche e Farmaceutiche (https://www.distabif.unicampania.it/dipartimento/docenti/) e nella classe vituale di Microsoft Teams.

    I docenti sono disponibili per ricevimento studenti nei giorni indicati sulla scheda insegnamento e su richiesta inoltrata via e-mail.

    Programma del corso

    Primo modulo: Genomi, genomica e avvento della bioinformatica. Informatica di base: algoritmi, linguaggi di programmazione e basi di dati. Inferenza statistica: test d’ipotesi parametrici e non parametrici. Allineamento tra sequenze. Sequenziamento degli acidi nucleici: Tecniche di sequenziamento NGS, formato dei dati genomici. Ricostruzione e annotazione di genomi. Analisi del trascrittoma: annotazioni di geni e trascritti alternativi, approcci sperimentali per l’analisi del trascrittoma, analisi di dati RNA-Seq, analisi dei livelli di espressione genica, funzione dei geni differenzialmente espressi.
    Secondo Modulo: principali tipi di dati in Python con relative operazioni e metodi di conversione; Algoritmi e diagrammi di flusso; Logica booleana e istruzioni di controllo del flusso; Inserimento dati; Struttura dati complessa; Tuple; Manipolazione di set di dati; Gestione degli errori; cicli while e for; Funzioni e parametri; variabili globali e locali; i moduli della Standard Library e quelli accessibili tramite pip; Come creare e utilizzare ambienti virtuali con venv.
    Terzo Modulo: Proteomi e proteine. Annotazione funzionale di proteine. Interazioni proteiche. Banche dati: sequenze proteiche-Uniprot, motivi funzionali proteici-PROSITE ed ELM, strutture proteiche-PDB e PDBe, interazioni proteiche-IntAct/MINT e STRING. Metodi bioinformatici per l’analisi di sequenze proteiche: descrittori di elementi funzionali nelle sequenze proteiche. Strutture proteiche: livelli di descrizione delle strutture proteiche, metodi sperimentali per la determinazione della struttura: diffrazione ai raggi X e Spettroscopia di risonanza magnetica nucleare (NMR). Predizione della struttura delle proteine: struttura secondaria (reti neurali artificiali), struttura terziaria (modeling comparativo o homology modeling, threading). Predizione della struttura terziaria mediante il metodo I-TASSER. Metodi per l’analisi delle strutture proteiche: Ordine e disordine, confronto di strutture, metodi strutturali per l’annotazione funzionale. Software per l’ analisi e la visualizzazione della struttura delle proteine: PyMoL, CHIMERA, PROCHECK. Interazioni proteiche: metodi per l’analisi delle interazioni proteiche (interferenza per omologia, mutazioni correlate, profili filogenetici, similarità di alberi filogenetici, prossimità genomica, espressione correlata, docking). Software per il docking molecolare: Autodock, Dockthor. Interazione tra proteine e ligandi: analisi strutturale delle interazioni.

    English

    Teaching language

    Italian

    Contents

    First module: Genomes, genomics and the advent of bioinformatics. Basic computer science: algorithms, programming languages and databases. Statistical inference: parametric and non-parametric hypothesis tests. Alignment between sequences. Nucleic acid sequencing: NGS sequencing techniques, genomic data format. Reconstruction and annotation of genomes. Transcriptome analysis: annotations of genes and transcripts, experimental approaches for transcriptome analysis, analysis of RNA-Seq data, analysis of gene expression levels, functions of differentially expressed genes. Second module: The main data types in Python with related operations and conversion methods; Algorithms and flowcharts; Boolean logic and flow control instructions; Data input; Complex data structure; Tuples; Dataset manipulation; Error handling; While and for loops; Functions and parameters; global and local variables; the modules of the Standard Library and those accessible via pip; How to create and use Virtual Environments with venv. Third module: Proteomes and proteins. Functional aspects of proteins. Protein interactions. Protein databases: protein sequences (Uniprot), functional structural motifs of proteins (PROSITE and ELM), protein structures (PDB and PDBe), protein interactions (IntAct/MINT and STRING). Bioinformatics methods for protein sequence analysis: descriptors of functional elements in protein sequences. Protein structures: description of the structural organization of protein structures; experimental methods for protein structural determination: X-Ray and Nuclear Magnetic Resonance (NMR) spectroscopy. Prediction of the secondary and tertiary structure. Methods for analyzing protein structures. Molecular Dynamics simulations and Molecular Docking.

    Textbook and course materials

    Manuela Helmer Citterich, Fabrizio Ferrè, Giulio Pavesi , Graziano Pesole, Chiara Romualdi-
    Fondamenti di bioinformatica-Zanichelli
    Stefano Pascarella, Alessandro Paiardini-
    Bioinformatica Dalla sequenza alla struttura delle proteine- Zanichelli
    https://www.python.org/doc/
    https://www.python.it/doc/

    Course objectives

    Knowledge and Understanding:
    This course will provide the basic concepts of bioinformatics aiming a critical analysis of genomic and proteomic data.

    Applying Knowledge and Understanding:
    The course is divided in three parts (modules). In the first part of the course, the student will acquire basic programming concepts and knowledge of methodologies for the alignment of sequences, the analysis of gene expression data and the analysis of proteins. During the second module, the student will learn the basics of programming in python, and will be able to develop programs that take user input and process it. In addition, the student will learn how to store and manipulate data, and build programs according to specific requirements. In the last part of the course, the student will learn in-depth knowledge related of the use of molecular graphics software and he will be able to access to the on-line databases for: the structural analysis of protein structures obtained via X-ray and NMR; the use of conformational information to design direct site mutation experiments; the prediction of the secondary and tertiary structure of proteins by homology modeling methodologies; the prediction of the 3D structure of protein-protein and protein-ligand complexes using molecular docking techniques.

    Autonomy of Judgment: the teaching promotes the development of the ability to critically evaluate scenarios and complex problems in the field of bioinformatic, allowing students to make independent decisions based on theoretical knowledge and experimental data.

    Communication Skills: the student will develop appropriate scientific language to describe the innovative bioinformatic metodologies. They will be able to clearly present the scientific results obtained by applyng the moder bioinformatic methodologies.

    Learning Ability: : the teaching promotes the ability for continuous learning, supporting decision-making and operational autonomy in the study and theoretical-practical deepening of the knowledge acquired through the consultation of texts and scientific literature, to effectively address new issues in the field of structural biology and structural chemistry. Moreover, the course will give essencial concepts allowing the student to continue studying in related areas with an adequate level of autonomy.

    Prerequisites

    Knowledge of the basic principles of molecular and structural biology, genetics and biochemistry.

    Teaching methods

    - Frontal lectures on all course topics. The lectures are performed with the help of the blackboard and by the projection of slides

    Evaluation methods

    The achievement of the learning objectives of the course is certified through the passing of an exam, graded on a 30-point scale.

    Oral examination for the first and third Module; whereas the skills of the second Module will be assessed with a written test using a multiple choice and/or open-ended questionnaire.
    For the modules 1 and 3, The oral exam lasts approximately 30 minutes and aims to assess the student’s theoretical knowledge, critical thinking, and command of technical-scientific language.
    The final mark will be calculated averaging the single mark obtained in each module.
    <18 Fail: the student does not demonstrate learning outcomes consistent with the Dublin descriptors for knowledge and understanding, application, judgment, communication, and learning skills.
    18-21 Sufficient: the student achieves the basic descriptors for knowledge and understanding of fundamental content and shows an initial ability to apply this knowledge in simple contexts.
    22-24 Fully sufficient: the student meets the descriptors for applied knowledge and understanding, showing the ability to correctly apply key concepts and begin to critically analyze situations related to the course topics.
    25-26 Good: the student demonstrates autonomy of judgment in evaluating and comparing relevant scenarios, applies knowledge effectively, and communicates results clearly, reflecting more consolidated skills.
    27-29 Very good: the student demonstrates an advanced level across the five descriptors, with mastery of content, the ability to critically evaluate complex cases, and strong communication skills, evidenced in papers and presentations.
    30 Excellent: the student excels in all Dublin descriptors, with in-depth knowledge, safe and critical application, autonomous judgment, effective communication, and the ability to learn continuously and creatively, producing high-quality work both in presentations and written/oral tests. Honors (cum laude) may be awarded when the student demonstrates, in addition, particular originality, depth, and innovation in the paper and presentation, exceeding standard expectations.

    Other information

    The student will be provided with learning material available on the website of Department of Environmental, Biological and Pharmaceutical Sciences and Technologies (https://www.distabif.unicampania.it/dipartimento/docenti/) and within the virtual classroom on Microsoft Teams.

    The professors are available to receive the students in the days indicated in their syllabus or after a student request via e-mail.

    Course Syllabus

    First module: Genomes, genomics and the advent of bioinformatics. Basic computer science: algorithms, programming languages and databases. Statistical inference: parametric and non-parametric hypothesis tests. Alignment between sequences. Nucleic acid sequencing: NGS sequencing techniques, genomic data format. Reconstruction and annotation of genomes. Transcriptome analysis: annotations of genes and transcripts, experimental approaches for transcriptome analysis, analysis of RNA-Seq data, analysis of gene expression levels, functions of differentially expressed genes.
    Second module: The main data types in Python with related operations and conversion methods; Algorithms and flowcharts; Boolean logic and flow control instructions; Data input; Complex data structure; Tuples; Dataset manipulation; Error handling; While and for loops; Functions and parameters; global and local variables; the modules of the Standard Library and those accessible via pip; How to create and use Virtual Environments with venv.
    Third module: Proteomes and proteins. Functional aspects of proteins. Protein interactions. Protein databases: protein sequences (Uniprot), functional structural motifs of proteins (PROSITE and ELM), protein structures (PDB and PDBe), protein interactions (IntAct/MINT and STRING). Bioinformatics methods for protein sequence analysis: descriptors of functional elements in protein sequences. Protein structures: description of the structural organization of protein structures; experimental methods for protein structural determination: X-Ray and Nuclear Magnetic Resonance (NMR) spectroscopy. Prediction of the secondary (artificial neural networks) and tertiary (homology modeling, threading) protein structure. 3D structural prediction using the I-TASSER methodology. Methods for analyzing protein structures: Order and disorder, comparison of protein structures, structural methods for functional annotation. Software for the analysis and visualization of the protein structure: PyMol, CHIMERA, PROCHECK. Protein interactions: methods for analyzing protein interactions ( homology interference, related mutations, phylogenetic profiles, similarities of phylogenetic trees, genomic proximity, related expression, docking). Software for molecular docking studies: Autodock, Dockthor. Protein-ligand interactions: structural analysis of protein interaction networks.

    facebook logoinstagram buttonyoutube logotype