Bioinformatica per le proteine. La sequenza primaria cioè la seq
degli aa di una proteina determina la sua struttura 3d, la struttura 3d
ovvero il folding della proteina detrmina la sua funzione, quindi ci
poniamo il problema di predire la struttura 3d di una prot sulla base
della seq di aa.
I metodi sperimentali applicati per individuare la struttura 3d
delle prot sono la cristallografia a raggi X e la risonanza magnetica
nucleare (NMR). Il problema è difficile a causa della complessità delle
prot che sono costituite da 20 aa diversi vs le 4 basi del dna, e per la
mancanza di simmetria vs la doppia elica del dna.
Il Protein Data Bank (PDB) è un database in cui sono depositate
informazioni sulle proteine tra cui le loro strutture 3d. Le strutture
primarie conosciute sono superiori a quelle 3d risolte. Le strutt 3d sono
visualizzabili tramite WebMol.
Per predire la struttura 3d esistono tre metodi:
ab initio
Il metodo . Parte dalla seq di aa, ogni atomo genera ed
è sottoposto a un campo di forze di attrazione o repulsione
rispetto agli altri atomi, provocando una certa conformazione
spaziale. Deduco la struttura 3d esclusivamente dalla seq prim
della prot da risolvere.
Il metodo di threading o di fold recognition. Cataloga le seq
prim e le prot in famiglie, che condividono la stessa
struttura 3d, cioè sono proteine non omologhe ma analoghe. La
prot viene fatta ricadere all interno di una di queste famiglie e di
conseguenza è associata a una certa struttura 3d.
Il metodo di homology modeling. È quello +usato. Trova una
similarità alta, superiore del 20-30%, tra la prot e un'altra
prot nota, così da associare la sua strutt 3d a quella nota a
causa dell elevata similarità tra le due.
Metodo ab initio. Lo uso quando non trovo omologie per la prot. Si basa
su due ipotesi, ovvero che tutta l info necessaria per il folding sia
contenuta nella seq di aa, e che il folding segue una
minimizzazione dell energia libera. Uno di questi metodi è quello di
Rosetta: si prende la seq totale, la si spezza in tante seq +brevi, le
seq +brevi vengono confrontate con altre presenti nei database che
siano note, si fanno foldare questi frammenti singoli e poi li si
unisce formando la prot tot. È il metodo +computazionalmente
oneroso e anche poco accurato.
Metodo di threading. Esistono un numero limitato di tipologie di
folding in natura, sul migliaio. La prot viene valutata con delle cifre di
merito, dei punteggi, con cui si valuta quale tipo di folding sia
+adatto cioè a quale famiglia sia +plausibile che appartenga.
Il metodo +usato è quello basato sull omologia. Due proteine con
struttura simile possono avere un identità anche relativamente bassa, se
è di almeno il 25% la struttura sarà molto simile. La struttura si
conserva meglio rispetto alla sequenza. Questo è leggibile in questo
grafico. Sulle x c è la % di identità delle seq aa. Sull asse y la rms
deviation in angstrom ovvero la distanza quadratica media sotto
radice cioè la deviazione standard tra atomi corrispondenti nelle due
strutture 3d. I pallini sono una trentina di coppie di seq a struttura
nota, per cui è stato possibile calcolare la % di identità di sequenza e le
strutt 3d erano note e quindi si è calcolata la rms variation dei carboni
alpha. Sopra il 20-30% di identità sono sotto i 2 angstrom di
distanza media. Quindi le strutture sono relativamente simili.
Aumentando l identità la rms v scende ancora.