Il motivo è una combinazione di strutture secondarie, poche, che
ha poca rilevanza dal pov funzionale, sono sequenze ricorrenti in
molte proteine diverse. Es motivo helix-loop-helix. Il dominio è una
combinazione di strutture secondarie +complessa e specifica della
proteina, che le consente di assumere una certa struttura 3d e quindi
una certa funzione, la proteina può avere tanti domini.
PROSITE è il database dei motivi.
Per descrivere il motivo possiamo usare pattern e/o profilo. Un
pattern è una descrizione qualitativa del motivo, una proteina può
matchare o meno un pattern. Un profilo è una descrizione quantitativa.
Per pattern intendiamo l espressione regolare, cioè l espressione che
rappresenta la regola del motivo, cioè la notazione degli aa che
possono comparire lungo la sequenza del motivo. Le parentesi
quadre contengono tutti i possibili aa per quella posizione. Quando c è
un solo aa significa che va bene solo quello. Quando ci sono le
parentesi graffe, gli aa non sono consentiti in quella posizione,
quindi significa che vanno bene tutti gli aa tranne quelli messi tra
parantesi. La x indica qualunque aa.Per indicare la ripetizione di un
elemento più volte, indico l elemento e il numero di ripetizioni di fianco
tra parentesi.
Il profilo è associato all informazione completa, cioè oltre a elencare i
possibili aa per ogni posizione va anche a riportare la probabilità
per ognuno, il loro peso, av a distinguere gli aa +probabili e quelli +rari,
al frequenza degli aa che sono consentiti, vioè dà anche il contenuto
informativo. Qui abbiamo 20 aa quindi 20 caratteri, quindi il
contenuto informativo max non è 2=log2(4) ma circa 4=log2(20).
Un dominio è un unità strutturale indipendente, che si trova da sola o in
combinazione con altri domini o motivi. I domini sono in correlazione
evolutiva, troviamo in specie diverse domini simili. Ha una struttura
conservata con una strutt sec distintiva e un core idrofobico. Domini
omologhi cono sequenze simili hanno spesso funzione simile.
Un dominio può occupare tutta la proteina, oppure solo alcune
parti della prot, oppure è ripetuto più volte lungo la proteina.
Una famiglia è un insieme di proteine accumunate da almeno uno
stesso dominio, quindi una regione di omologia, sono simili quindi
provengono da uno stesso antenato.
Pfam è un database che contiene i domini. È un database derivato
non primario.
La sequenza può essere vista come profilo di idrofobicità,
transcodificata come un segnale ovvero una successione di valori
numerici. Il profilo idrofobico è ottenuto sostituendo a ogni aa un valore
di idrofobicità secondo una scala di idrofobicità, da una tabella
contenenti i 20 valori associati ai 20 aa. Se l aa è idrofobico il valore è
positivo, se è idrofilico il valore è negativo, il modulo indica l intensità
dell idrofob o idrofil. Per visualizzare meglio l andamento di solito si usa
una media mobile che è un filtro passa basso che smussa.
Esistono scale di idrofob diverse es la Eisenberg’s Consensus Scale
(ECS):
I domini transmembrana devono essere altamente idrofobici perché
devono inserirsi nel doppio strato fosfolipidico della membrana. Dal
profilo di idrofobicità della proteina trasmembrana vedo dei picchi in
corrispondenda dei domini interni e delle valli in corrispondenza delle
zone di raccordo esterne.
Esistono degli strumenti che predicono i domini transmembrana
ad alphaelica nelle proteina. Sfruttano un modello markoviano
nascosto.
Guardando il profilo di idrofobicità posso anche vedere se un alpha
elica è anfifilica, ovvero da una parte ha aa idrofobici e dall altra
idrofilici, sulle due facce laterali dell elica. Si trova vedendo se c è una
certa periodicità nel susseguirsi di aa idrofob e idrofil, quindi con una
sorta di trasformata di Fourier per vedere le frequenze.
Perché può essere impo vedere se un alphaelica è anfifilica? Per es per
guidare le proteine nel corretto organello/compartimento.
Per es. Le proteine mitocondriali hanno una parte terminale che funge
da peptide guida o sequenza segnale che viene riconosciuta dal
mitocondrio, così può entrarci e poi perde questa porzione. Una sua
catteristica è proprio una alphaelica anfifilica, oltre a una carica netta
positiva e un motivo finale debole facilmente idrolizzabile. C è una
teoria evolutiva che dice che i mitocondri prima erano organismi a
sé, contenenti i propri geni, che poi sono stati inglobati dalla cell,
parte dei suoi geni
sono migrati nel nucleo, mentre nel mitocondrio sono rimasti geni per
13 peptidi, quindi deve esistere un sit di trasporto delle proteine
codificate dai geni provenienti dal mitocondrio al mitocondrio
stesso e questo avviene con il peptide guida.
Predizione di struttura secondaria. Il primo metodo è stato l
algoritmo di Chou Fasman. Sono state prese tante seq di
alpahelica/betasheet/coil, per vedere le frequenza degli aa in
ciascuna delle tre strutture, con un analisi statistica. Scansionava la
sequenza primaria alla ricerca di finestre in cui ci fossero alemno 4 aa su