Anteprima
Vedrai una selezione di 20 pagine su 131
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 1 Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 2
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 6
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 11
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 16
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 21
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 26
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 31
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 36
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 41
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 46
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 51
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 56
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 61
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 66
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 71
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 76
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 81
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 86
Anteprima di 20 pagg. su 131.
Scarica il documento per vederlo tutto.
Appunti completi del corso di Bioinformatica e genomica funzionale Pag. 91
1 su 131
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

BIOINFORMATICA DELLE PROTEINE

Struttura delle proteine:

  • Primaria: sequenza di aminoacidi;
  • Secondaria: strutture di base delle proteine, tipicamente alpha elica e lamine beta, conformazioni di base da un punto di vista strutturale, che concorrono al folding finale o struttura 3D finale;
  • Terziaria: folding finale;
  • Quaternaria: eventuale formazione di legami fra diverse strutture terziarie (subunità).

Struttura secondaria:

Alpha elica: un'elica destrorsa che di solito coinvolge qualche decina di aminoacidi (da 5 a 40, ma mediamente 10) ed avvolge circa 18 aminoacidi ogni 5 giri, per cui ha un periodo di 3.6 (ogni 5 spire si dispongono circa 18 aminoacidi). Alcuni aminoacidi sono più frequenti nella alpha eliche che in altre strutture secondarie, e ciò può aiutare nella predizione della struttura secondaria, ma non è un'informazione sufficientemente forte da garantire risultati di predizione accurati.

Lamina beta: una struttura con circa 5-10 aminoacidi.

può essere tipicamente trovato in una configurazione in cui più lamenti formano un foglietto (foglietto beta). Anche in questo caso si è osservato che ci sono degli AA più frequenti nei lamenti beta rispetto alle altre strutture secondarie. Il coil, invece, è una parte della proteina non caratterizzata particolarmente in termini strutturali, che presenta regioni variabili e a loop: funge da raccordo tra le strutture secondarie caratterizzate alpha e beta. Si è osservato nel tempo che ci sono AA più ricorrenti nel coil, come Alanina, Glicina, Serina e Treonina; in particolare, la prolina spezza la catena (interrompe le alpha eliche). Anche in questo contesto facciamo riferimento ai "motivi", come a combinazioni di strutture secondarie che possono essere ricorrenti, anche in proteine con funzionalità diverse tra loro. Il dominio è una combinazione di strutture secondarie più complessa.sempre una proteina è caratterizzata dal punto di vista funzionale: è generalmente la parte della proteina associata ad una certa funzionalità. La combinazione di domini determina la struttura terziaria della proteina. Prosite è un repository di motivi di proteina che vengono descritti in termini di pattern o profilo. Dal punto di vista della lingua italiana, pattern e profilo sono termini interscambiabili, ma in questo contesto con pattern si intende tipicamente l'espressione regolare, mentre il profilo è il pattern descritto in maniera quantitativa (weight matrix). La rappresentazione dei pattern è simile a quella vista per il DNA, con l'aggiunta delle parentesi graffe che vengono utilizzate per indicare gli AA non permessi in una determinata posizione. Se invece abbiamo la matrice delle frequenze di occorrenza (weight matrix) abbiamo il profilo, una descrizione quantitativa che è il superamento del semplice pattern, perché.

trattiene tutta l'informazione che abbiamo. Anche qui è utilizzato il sequence logo, già visto per il DNA: il contenuto informativo di ciascuna posizione è utilizzato per rendere visivamente l'informazione sulle varie posizioni. Oltre al numero di caratteri, notiamo una differenza con il DNA che riguarda il massimo valore del contenuto informativo (log2 (20) = 4.321928094887362).

Un dominio è un'unità strutturale indipendente (con una struttura secondaria distinta e che può essere trovata da sola o in congiunzione con altre unità, un core idrofobico) all'interno della proteina: possono essere osservati anche guardando proteine ortologhe per osservare la variabilità tra le specie di certe sottofrequenze (i domini sono legati a livello evoluzionistico).

Domini omologhi con funzioni comuni hanno, di solito, sequenze simili; possono occupare la sequenza nella sua interezza o essere

limitati ad una porzione di• essa, ma possono anche essere ripetuto più volta nella stessa sequenza.famiglia di proteine, proteine cheQuando parliamo di domini proteici ci riferiamo ad un insieme di proteine che condividono un dominio.
Pfam è l’equivalente di Rfam per le proteine, ed in particolare per i domini proteici.
Pro lo di idrofobicità trans-codi care la sequenza in un segnale (serie numerica), per poi elaborare tecniche tipiche dell'elaborazione di segnali. Il criterio "scale di idrofobicità": applicato per il passaggio è dato dalle cosiddette scale note in letteratura da tempo (circa 40), non indipendenti tra loro. Si tratta di tabelle in cui ad ogni aminoacido è associato un valore di idrofobicità ottenuto sperimentalmente. A seconda del tipo di esperimento avrò valori leggermente diversi, poi presentati in una certa scala.
EISENBERG (ECS) Quella di è molto utilizzata, ma una ancora

La sequenza più utilizzata è la Kyte&Doolittle. Si tratta semplicemente di tabelle con 20 valori numerici che permettono di passare dall'array di caratteri ad un segnale numerico, che evidentemente si può elaborare con tecniche più o meno sofisticate per fare delle osservazioni non immediate sui caratteri.

Esempio: la serie presenta un'alternanza di regioni con valore relativamente alto e punti di minimo in cui l'idrofobicità scende. Questo tipo di conformazione corrisponde, nel caso di proteina di membrana specifica, ad una (transmembrana) con diversi domini transmembrana idrofobici, raccordati da loop non idrofobici.

La possibilità di riconoscere un dominio transmembrana attraverso questo tipo di predittori dedicati, come quello citato, che oltre al formalismo del modello Markoviano al profilo di idrofobicità sfrutta anche il nascosto. Il vantaggio di guardare la sequenza come ad una serie.

numerica è anche sicuramente la possibilità di individuare eventuali periodicità non visibili sulla sequenza. Vediamo lo schema di un'alfa e la stessa alfa elica vista in sezione longitudinale: i pallini rossi e verdi sono rispettivamente gli AA idrofobici e idrofili, che si dispongono in particolari eliche in modo da dotare l'alfa elica di una faccia prevalentemente idrofobica e una prevalentemente idrofila, in virtù dell'alternarsi di AA con caratteristica opposta. Avevamo detto che l'elica avvolge in media 18 AA ogni 5 giri, quindi sappiamo qual è il periodo. La capacità di esporre AA con caratteristiche opposte può essere quantificata con MOMENTO IDROFOBICO: μ(delta)l'operatore, stimato a partire dalla struttura primaria della proteina. Nella sua espressione troviamo: Hn idrofobicità nell'n-esima posizione della sequenza I valori di trans-codifica in serie numerica; N: lunghezza della

proteina (numero di AA);•fi fi fi fi fifi fi fi 65 di 131va a valutare la periodicità,Questa espressione infatti ci ricorda il modulo di una DFT.delta = 360°/mAvremo quindi un momento idrofobico, che è una funzione in delta, dove(periodo). Se consideriamo l'alfa elica, il periodo caratteristico è 18/5 = 3.6 per quantodetto prima. Pertanto, il potenziale di formare un'alfa elica an lica sarà rilevato in terminidi momento idrofobico da un elevato valore (picco, massimo locale) in corrispondenza didelta = 100, ad evidenziare che c’è ripetizione di un certo pattern sul passo dell’elica. Ilpermette di identi care l'eventuale presenza di periodicitàmomento idrofobico ciaminoacidiche su determinati periodi “ sici”. valuteremo se c'è un picco inNella funzione del momento idrofobico mu(delta)corrispondenza di uno speci co valore di delta, rappresentante la caratteristicageometrica di interesse.

Questo tipo di quantificazione permette di valutare le sequenze rispetto alla possibilità di formare strutture anfipatiche (con carattere bivalente), con facce a carattere opposto in termini di idrofobicità. Siamo interessati ad una struttura che rivela un pattern di questo genere perché le alfa-eliche anfipatiche sono particolarmente utili nella localizzazione subcellulare delle sonoproteine. Dobbiamo pensare al solito flusso di informazione da gene a proteina: la proteina sintetizzata dovrà localizzarsi in un preciso compartimento subcellulare, e la localizzazione (fondamentale per la proteina stessa) è regolata dall'informazione racchiusa nella sequenza stessa. C'è un peptide guida localizzato nella parte N-terminale, dotata di caratteristiche che, se pur labili e non sempre semplici da rilevare/quantificare, sono legate alla funzionalità di guida della proteina verso la corretta localizzazione finale. Alcuni predittori di localizzazione subcellulare

Le proprietà come l'idrofobicità dell'alfa elica possono essere valutate tramite l'analisi delle proteine. PSORT, introdotto diversi anni fa, si è evoluto nel tempo e attualmente esegue un'analisi sulla sequenza per comprendere la localizzazione finale e funzionale della proteina. Nel caso dei mitocondri, ad esempio, vengono sfruttate tipicamente proprietà come la presenza di un'alfa elica nella parte iniziale della sequenza, oltre a informazioni sul motivo di sequenza che caratterizza il sito di taglio in cui la proteina perde il peptide guida per assumere la forma pura. Inoltre, in questo caso viene valutata anche la carica netta del peptide guida, che risulta generalmente positiva: una volta portata la proteina nel corretto compartimento, il peptide guida si stacca e la proteina assume la forma matura.

PREDITTORI DI STRUTTURA SECONDARIA

Chou-Fasman: è stato il primo proposto in letteratura,

eurali, ad esempio) per migliorare l'accuratezza dell'algoritmo. Inoltre, sono state introdotte nuove caratteristiche, come la presenza di residui idrofobici o carichi elettrici, per rendere l'algoritmo più completo e preciso. Oggi, grazie a questi miglioramenti, l'algoritmo è in grado di predire con una precisione superiore il tipo di struttura secondaria presente in una sequenza proteica.
Dettagli
Publisher
A.A. 2022-2023
131 pagine
SSD Ingegneria industriale e dell'informazione ING-INF/06 Bioingegneria elettronica e informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher clarapessia di informazioni apprese con la frequenza delle lezioni di Bioinformatica e genomica funzionale e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Politecnico di Milano o del prof Pattini Linda.