Estratto del documento

Il motivo è una combinazione di strutture secondarie, poche, che

ha poca rilevanza dal pov funzionale, sono sequenze ricorrenti in

molte proteine diverse. Es motivo helix-loop-helix. Il dominio è una

combinazione di strutture secondarie +complessa e specifica della

proteina, che le consente di assumere una certa struttura 3d e quindi

una certa funzione, la proteina può avere tanti domini.

PROSITE è il database dei motivi.

Per descrivere il motivo possiamo usare pattern e/o profilo. Un

pattern è una descrizione qualitativa del motivo, una proteina può

matchare o meno un pattern. Un profilo è una descrizione quantitativa.

Per pattern intendiamo l espressione regolare, cioè l espressione che

rappresenta la regola del motivo, cioè la notazione degli aa che

possono comparire lungo la sequenza del motivo. Le parentesi

quadre contengono tutti i possibili aa per quella posizione. Quando c è

un solo aa significa che va bene solo quello. Quando ci sono le

parentesi graffe, gli aa non sono consentiti in quella posizione,

quindi significa che vanno bene tutti gli aa tranne quelli messi tra

parantesi. La x indica qualunque aa.Per indicare la ripetizione di un

elemento più volte, indico l elemento e il numero di ripetizioni di fianco

tra parentesi.

Il profilo è associato all informazione completa, cioè oltre a elencare i

possibili aa per ogni posizione va anche a riportare la probabilità

per ognuno, il loro peso, av a distinguere gli aa +probabili e quelli +rari,

al frequenza degli aa che sono consentiti, vioè dà anche il contenuto

informativo. Qui abbiamo 20 aa quindi 20 caratteri, quindi il

contenuto informativo max non è 2=log2(4) ma circa 4=log2(20).

Un dominio è un unità strutturale indipendente, che si trova da sola o in

combinazione con altri domini o motivi. I domini sono in correlazione

evolutiva, troviamo in specie diverse domini simili. Ha una struttura

conservata con una strutt sec distintiva e un core idrofobico. Domini

omologhi cono sequenze simili hanno spesso funzione simile.

Un dominio può occupare tutta la proteina, oppure solo alcune

parti della prot, oppure è ripetuto più volte lungo la proteina.

Una famiglia è un insieme di proteine accumunate da almeno uno

stesso dominio, quindi una regione di omologia, sono simili quindi

provengono da uno stesso antenato.

Pfam è un database che contiene i domini. È un database derivato

non primario.

La sequenza può essere vista come profilo di idrofobicità,

transcodificata come un segnale ovvero una successione di valori

numerici. Il profilo idrofobico è ottenuto sostituendo a ogni aa un valore

di idrofobicità secondo una scala di idrofobicità, da una tabella

contenenti i 20 valori associati ai 20 aa. Se l aa è idrofobico il valore è

positivo, se è idrofilico il valore è negativo, il modulo indica l intensità

dell idrofob o idrofil. Per visualizzare meglio l andamento di solito si usa

una media mobile che è un filtro passa basso che smussa.

Esistono scale di idrofob diverse es la Eisenberg’s Consensus Scale

(ECS):

I domini transmembrana devono essere altamente idrofobici perché

devono inserirsi nel doppio strato fosfolipidico della membrana. Dal

profilo di idrofobicità della proteina trasmembrana vedo dei picchi in

corrispondenda dei domini interni e delle valli in corrispondenza delle

zone di raccordo esterne.

Esistono degli strumenti che predicono i domini transmembrana

ad alphaelica nelle proteina. Sfruttano un modello markoviano

nascosto.

Guardando il profilo di idrofobicità posso anche vedere se un alpha

elica è anfifilica, ovvero da una parte ha aa idrofobici e dall altra

idrofilici, sulle due facce laterali dell elica. Si trova vedendo se c è una

certa periodicità nel susseguirsi di aa idrofob e idrofil, quindi con una

sorta di trasformata di Fourier per vedere le frequenze.

Perché può essere impo vedere se un alphaelica è anfifilica? Per es per

guidare le proteine nel corretto organello/compartimento.

Per es. Le proteine mitocondriali hanno una parte terminale che funge

da peptide guida o sequenza segnale che viene riconosciuta dal

mitocondrio, così può entrarci e poi perde questa porzione. Una sua

catteristica è proprio una alphaelica anfifilica, oltre a una carica netta

positiva e un motivo finale debole facilmente idrolizzabile. C è una

teoria evolutiva che dice che i mitocondri prima erano organismi a

sé, contenenti i propri geni, che poi sono stati inglobati dalla cell,

parte dei suoi geni

sono migrati nel nucleo, mentre nel mitocondrio sono rimasti geni per

13 peptidi, quindi deve esistere un sit di trasporto delle proteine

codificate dai geni provenienti dal mitocondrio al mitocondrio

stesso e questo avviene con il peptide guida.

Predizione di struttura secondaria. Il primo metodo è stato l

algoritmo di Chou Fasman. Sono state prese tante seq di

alpahelica/betasheet/coil, per vedere le frequenza degli aa in

ciascuna delle tre strutture, con un analisi statistica. Scansionava la

sequenza primaria alla ricerca di finestre in cui ci fossero alemno 4 aa su

Anteprima
Vedrai una selezione di 3 pagine su 8
Proteine I Pag. 1 Proteine I Pag. 2
Anteprima di 3 pagg. su 8.
Scarica il documento per vederlo tutto.
Proteine I Pag. 6
1 su 8
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Ingegneria industriale e dell'informazione ING-INF/06 Bioingegneria elettronica e informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher valillo2002 di informazioni apprese con la frequenza delle lezioni di Bioinformatica e genomica funzionale e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Politecnico di Milano o del prof Pattini Linda.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community