Metodi per l'ingegneria proteica
Introduzione sulle proteine
Tutte le macromolecole biologiche sono polimeri, costituiti da mattoni che si uniscono insieme a formare la macromolecola. L’estrema variabilità delle macromolecole in natura dipende dalla diversa composizione dei monomeri. La variabilità delle proteine è molto elevata per via del fatto che possono essere costituite da 20 aa differenti; la variabilità di sequenze si riflette nella variabilità strutturale.
Le proteine vengono sintetizzate al livello del ribosoma dove si lega il mRNA che viene quindi tradotto. Questa enorme macchina molecolare è formata da due subunità (maggiore e minore) e la subunità maggiore contiene tre diversi siti funzionali all’attività di traduzione che avviene all’interfaccia delle due subunità. La determinazione della struttura a livello atomico del ribosoma ha permesso di capire che questo è un ribozima, costituito da RNA ribosomiale e proteine con funzioni strutturali. Non essendo però delle vere e proprie proteine, non è stato possibile ottenere la loro struttura attraverso tecniche di produzione di proteine ricombinanti come invece di solito si fa per le proteine normali, ma si sono purificate da una cellula originaria.
L’estrema variabilità strutturale delle proteine fa sì che abbiano moltissime funzioni biologiche diverse: enzimi con attività catalitica, trasporto di molecole, immagazzinamento di sostanze nutrienti, proteine dedicate alla protezione dell’organismo vivente, proteine contrattili nei muscoli, ormoni con funzione di segnale, proteine strutturali (come il collagene) e proteine patogene. È proprio la struttura che determina la funzione delle proteine e per questo, da molti anni, si stanno studiando metodi sempre più precisi per ottenere la struttura delle proteine. Il metodo più usato è la cristallografia perché è una tecnica che non ha limiti di dimensioni, ma negli ultimi anni si è passati anche all’NMR e alla microscopia elettronica. Attualmente, grazie a sistemi bioinformatici, è anche possibile predire la struttura secondaria delle proteine a partire dalla sola sequenza perché ci sono pattern di aa che, a seconda delle catene laterali, vanno a formare un’elica o uno strand. La predizione della struttura terziaria/quaternaria con tool bioinformatici (sistemi di modeling), invece, non è così precisa.
Esempio: una dimostrazione del fatto che la struttura globale della proteina influenza la sua funzione è data da due proteine con una struttura opposta: collagene ed emoglobina. Il collagene, infatti, forma lunghe fibre con strutture elicoidali a dare una tripla elica perché è una proteina extracellulare che deve essere in grado di conferire struttura ed elasticità al tessuto, mentre l’emoglobina ha una struttura quaternaria compatta, dove ciascuna subunità ha una struttura globulare al cui interno lega ossigeno per poterlo trasportare senza che interagisca con l’ambiente extracellulare (possibile tossicità).
Studiare la struttura di una proteina non è solo importante per capire la funzione, ma da un punto di vista ingegneristico è utile per modificare la proteina target affinché si possano cambiarne le proprietà molecolari.
Interazioni all’interno delle proteine
La struttura di una macromolecola e, in particolare, delle proteine si basa su interazioni deboli che si instaurano tra i diversi monomeri che la compongono. Nonostante le interazioni siano deboli, sono in grado di conferire una notevole stabilità alla struttura poiché sono molteplici ed agiscono in concerto, mentre la mancanza di queste interazioni fa sì che la struttura non sia più stabile.
- Legami idrogeno tra le catene laterali degli aa polari (contenenti un atomo di ossigeno o di azoto) o anche con l’acqua. L’acqua è un componente fondamentale della struttura di una proteina per mantenerne la struttura.
- Ponti salini, ossia interazioni ioniche tra una catena laterale acida e una basica.
- Interazioni idrofobiche che tipicamente coinvolgono il nocciolo centrale di una struttura (parte più interna della proteina).
- Interazioni di Van Der Waals (interazioni tra dipoli indotti) che sono strettamente dipendenti dalla distanza (generalmente piuttosto bassa).
- Eventuali ponti disolfuro che sono legami covalenti e stabilizzano ulteriormente la proteina. Queste interazioni intervengono sia a livello locale, formando le strutture secondarie, sia a livello più generale, contribuendo alla struttura terziaria.
Struttura secondaria delle proteine
Sono caratterizzate da interazioni a idrogeno che avvengono unicamente tra gruppi della catena principale, ossia tra l’azoto del legame peptidico e l’ossigeno del gruppo carbonilico di un altro legame peptidico.
α-elica
È una struttura che crea un oggetto piuttosto compatto. Dipende dalla formazione di un legame a idrogeno tra un aa e un altro aa distante 4 posizioni. Questa struttura fa sì che si crei un perfetto susseguirsi di giri di elica tali per cui tra due catene laterali (innalzamento di un aa rispetto all’altro) di due aa che sporgono esternamente rispetto all’alfa-elica ci sia una distanza di 5.4 Å. L’elica è quasi sempre destrorsa per via della polarità degli aa che hanno tutti una configurazione L (sono molecole chirali). È una struttura polare con un delta + all’estremità N-terminale e un delta – all’estremità C-terminale.
β-sheet
Struttura secondaria più distesa che occupa, a parità di lunghezza amminoacidica, uno spazio minore in quanto si formano dei legami a idrogeno tra l’azoto ammidico e il carbonio carbonilico di due beta-strand fiancheggianti. I beta-strand sono formati da 5-6 aa e possono essere tra di loro paralleli (interazione più debole perché i gruppi che interagiscono non sono perfettamente allineati) o antiparalleli (interazione più forte perché i gruppi che interagiscono sono perfettamente allineati). Generalmente tra due beta strand antiparalleli si trova un piccolo beta-loop che li collega, ma spesso i beta strand sono piuttosto distanti tra di loro all’interno della sequenza ma si trovano vicini per via del particolare ripiegamento. I beta-foglietti sono comunque caratterizzati da una struttura 3D dovuta al fatto che, se il legame peptidico è planare, i legami con il carbonio alfa possono invece ruotare liberamente.
Struttura terziaria delle proteine
Un grado ulteriore di organizzazione della proteina è dato dalla struttura terziaria data dalla combinazione delle strutture secondarie (per interazione tra catene laterali degli aa) e associate o meno a molecole aggiuntive (cofattori e ioni). Questi ioni e cofattori sono, a volte, fondamentali per la funzione e per la struttura della proteina, per cui sono parte integrante della stessa, mentre in altri casi il cofattore/ione interagisce in maniera dinamica e può associarsi o dissociarsi alla proteina, non facendo quindi parte integrante della stessa.
Ogni amminoacido è caratterizzato da specifici angoli diedri di torsione psi e phi che definiscono la rotazione del carbonio alfa rispettivamente rispetto all’azoto e al carbonio. Questi angoli definiscono come ciascun aa è posizionato rispetto al precedente e al successivo. Per convenzione gli angoli f e Ψ sono uguali a 180° quando il peptide è nella conformazione completamente estesa (cioè tutti i gruppi peptidici sono sullo stesso piano). Per ogni amminoacido i valori che possono assumere phi e Ψ sono limitati a causa dell’ingombro sterico tra gli atomi. Il grafico di Ramachandran mostra le combinazioni di angoli diedri possibili e quali strutture ciascuna combinazione può determinare.
Gli aa che formano i loop si posizionano invece in zone meno energeticamente favorite ma che comunque si posizionano vicino ai gruppi che definiscono le due strutture secondarie principali. Questo può essere utile nella caratterizzazione della struttura della proteina per validare la struttura stessa poiché queste strutture vengono determinate in modo indiretto sulla base di dati sperimentali ottenendo un modello che però va validato. Quindi, una struttura determinata correttamente risponde ai vincoli dovuti all’ingombro sterico e quindi i suoi amminoacidi assumono angoli di torsione compatibili con quelli che si ritrovano nel grafico di Ramachandran. Quindi, se ottengo un Ramachandran plot del primo tipo relativo alla struttura che ho determinato, significa che c’è stato un errore nella determinazione della struttura. Attualmente, comunque, i diversi tools informatici limitano questi errori. Le predizioni con i tools sono comunque più soggette ad errori rispetto alla formazione di un modello grazie ai dati sperimentali.
Motivi strutturali e domini (folds) di una proteina
Molte strutture proteiche ricadono in un framework strutturale conservato, nonostante abbiano sequenze e dettagli strutturali diversi. Un primo raggruppamento è stato quello che divide le proteine in:
- Costituite esclusivamente da alfa eliche
- Costituite esclusivamente da beta-sheet (come nei beta barrel caratteristici delle proteine di membrana)
- Costituite da un mix di strutture secondarie
A loro volta, le strutture alfa-beta possono essere classificate in base al modo con cui le strutture secondarie si posizionano l’una rispetto all’altra, come ad esempio:
- TIM barrel: i beta strand si concentrano internamente a formare un anello mentre le alfa eliche sono disposte tutte intorno
- Roll- sandwich (come le flavoproteine): il cofattore si trova nella porzione centrale chiuso a sandwich tra due alfa-eliche. Queste ultime possono ulteriormente essere suddivise.
Un dominio può corrispondere ad una parte della sequenza oppure comprendere segmenti che sono molto distanti tra loro in termini di sequenza ma che vengono a trovarsi vicini quando la proteina si ripiega. Spesso le proteine sono caratterizzate da più domini con funzioni differenti come, nel caso dell’enzima, un dominio per il legame del cofattore e uno per il legame del sito attivo oppure, nel caso dei fattori di trascrizione, un dominio per il legame al DNA e un dominio per il legame all’enhancer o ad altri fattori di trascrizione.
I domini sono importanti anche per il fatto che sono piuttosto conservati, molto più della sequenza, e questo rappresenta un vantaggio per la biologia strutturale poiché, nel momento in cui ci si pone l’obbiettivo di trovare una struttura di una nuova proteina, se si conosce una proteina omologa, il lavoro risulta molto semplificato. Da qui la possibilità di fare un modeling semplificato per proteine che condividono un’omologia di sequenza con un’altra proteina nota, partendo da quest’ultima. Quello che varia è il dettaglio strutturale, ossia quali aa ci sono soprattutto a livello del sito attivo, cosa che determina la diversa funzione.
Globin fold
È una struttura costituita da alfa-eliche caratteristica dell’emoglobina e della mioglobina. In particolare, comprende 8 alfa-eliche collegate da brevi loop e impaccate a coppie che si ripiegano intorno al sito attivo per l’eme.
Antibody fold
È una struttura costituita da catene pesanti e leggere, tutte caratterizzate da beta-foglietti, che si ritrova negli anticorpi.
Rossman fold
È una struttura mista alfa-beta, costituita da 6 beta-strands paralleli e 4 alfa-eliche. È un dominio caratteristico delle flavoproteine in quanto presenta un buon sito di ancoraggio per la parte adenosinica del FAD. Questo dominio si associa poi a domini più specifici per il legame del substrato. Generalmente il Rossman fold si trova nella parte N-terminale della proteina, ma spesso coinvolge anche porzioni della proteina che fanno parte del C-terminale o della porzione centrale per via del ripiegamento tridimensionale della proteina.
Struttura ed interazioni tra le proteine
La struttura di una proteina determina la sua funzione e il fatto che una proteina vada a svolgere una funzione ben precisa all’interno della cellula è fondamentale per il corretto funzionamento della cellula e dipende appunto strettamente dalla struttura. Le proteine e i complessi macromolecolari costituiscono un ambiente affollato nella cellula stessa (concentrazione proteica nei batteri è pari a 3 mM), anche se gli studi delle diverse proteine vengono effettuati in vitro, in un ambiente estremamente semplificato. Nonostante ciò, una certa proteina è in grado di riconoscere in maniera specifica i componenti del processo biologico in cui interviene quella proteina (processo di riconoscimento molecolare). Questo è reso possibile in virtù del fatto che, grazie alla propria struttura, il riconoscimento molecolare risulta estremamente specifico ed efficiente. La proteina può eventualmente incontrare un altro ligando o macromolecola, ma, poiché l’incontro non è produttivo, l’interazione non avviene o comunque si rompe subito in modo che la proteina possa andare ad interagire produttivamente solo con il proprio ligando. Da qui la necessità da parte della proteina di essere in grado di assumere la struttura corretta pur in un ambiente affollato come la cellula, in quanto le proteine, appena prodotte dal ribosoma, risultano non strutturate.
Il folding proteico
Per problem folding si intende il processo che spiega come la struttura primaria di una proteina determina la sua struttura terziaria. Il folding, cioè l’insieme dei meccanismi con cui la proteina si ripiega e assume la sua struttura tridimensionale. La struttura che la proteina assume è funzionale alla sua attività e dipende da interazioni deboli che nell’insieme concorrono a formare una struttura stabile e biologicamente funzionante. Tutte le informazioni per il folding sono già contenute all’interno della sequenza amminoacidica. L’ambiente di una cellula è abbastanza affollato per via delle macromolecole, ma, comunque, le interazioni che si instaurano tra gli aa della proteina e che permettono di arrivare alla corretta struttura 3D della proteina sono estremamente precise e non sono disturbate dalle altre macromolecole che si trovano nella cellula.
Lo studio del processo di folding inizia con Anfinsen negli anni ’50 il quale si concentrò su una ribonucleasi (enzima di cui risulta semplice misurare l’attività enzimatica in vitro). Anfisen denaturò la proteina, azione che inattiva l’enzima, con urea; successivamente, sottopose la proteina a dialisi (per eliminare l’urea) e vide che la proteina riprendeva la sua funzione. Questo voleva dire che la proteina era in grado di rinaturarsi spontaneamente senza l’aiuto di componenti cellulari in quanto il processo di rinaturazione osservato in questo esperimento avveniva in vitro. Tuttavia, la ribonucleasi analizzata da Anfinsen era stata estratta da una cellula e sorse il dubbio che la proteina estratta potesse contenere alcune componenti cellulari che si era portata dietro con il processo di estrazione.
Quindi, successivamente, Bruce Merrifield sintetizzò chimicamente un peptide corrispondente alla sequenza della ribonucleasi (che quindi non poteva contenere alcune componente cellulare) e dimostrò che esso era in grado di riavvolgersi spontaneamente in una struttura con caratteristiche biofisiche ed enzimatiche indistinguibili dalla proteina nativa. Da qui, la dimostrazione definitiva che una proteina possiede nella sua sequenza tutte le informazioni necessarie per il folding corretto che ne definisce la funzione.
Dinamica di denaturazione delle proteine
La denaturazione di una proteina, cioè la perdita della struttura nativa causata dalla rottura delle interazioni deboli, può essere indotta in vari modi (calore, urea, detergenti, …) ed essere monitorata attraverso metodi calorimetrici e spettroscopici. Dall’analisi del processo di denaturazione si ottiene una curva che mostra un inizio più lento ma poi una fase esponenziale (perché il meccanismo si velocizza e autoalimenta) fino ad arrivare ad un plateau (tutto denaturato). L’unfolding (o denaturazione) di una proteina è un processo rapido e altamente cooperativo che può in certi casi essere reversibile: tra questi due stadi esistono stadi intermedi o si passa direttamente da una forma all’altra?
Possibili processi che inducono il folding
Si è visto che le strutture delle proteine contengono un certo numero di molecole d’acqua sia sulla superficie che all’interno e che sono parte integrante della struttura proteica fungendo da ponte tra un aa e l’altro. Siccome, quindi, le proteine interagiscono con le molecole d’acqua, si è pensato che una driving force del folding fosse la desolvatazione. Quando la proteina è denaturata, le molecole d’acqua che interagiscono con la proteina anche a livello della catena principale, oltre che a livello delle catene laterali degli aa; durante il folding, queste interazioni con le molecole d’acqua vengono sostituite dalle interazioni tra aa e soprattutto dalle interazioni a idrogeno che caratterizzano la struttura secondaria. Si mantiene il 40-60% di acqua con cui una proteina può potenzialmente interagire. Un altro meccanismo del folding è il collasso idrofobico: in una struttura denaturata anche gli aa idrofobici sono esposti al solvente creando una repulsione che porta gli aa idrofobici a formare un nocciolo (molten globule) al centro della struttura (in caso di proteine idrosolubili). Questi due meccanismi, comunque, non spiegano completamente il meccanismo di folding in quanto sono meccanismi generici ma non spiegano come proteine con diverse sequenze diano strutture diverse.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Folding proteico - Metodi per l'ingegneria proteica lezione
-
Espressione eterologa di proteine - Metodi per l'ingegneria proteica
-
Metodi numerici per l'ingegneria
-
Corso completo metodi analitici e numerici