vuoi
o PayPal
tutte le volte che vuoi
Banche di dati per le strutture tridimensionali delle macromolecole
Esistono dei database, letteralmente banche dati, in cui sono conservate le strutture tridimensionali di macromolecole, come recettori, proteine ecc., che sono state determinate attraverso tecniche sperimentali. Un esempio di questi database è il PDB (Protein Data Bank), in cui sono riportate le strutture tridimensionali delle proteine.
Nella maggior parte dei casi le strutture 3D riportate in questa banca di dati vengono determinate grazie alla cristallografia a raggi x (per la tecnica vedi capitolo successivo). Prima di andare avanti però, per capire meglio, è bene dire cosa è un cristallo: un cristallo è un sistema periodico, composto, cioè, da atomi equidistanti e paralleli. Esiste un motivo nel cristallo che si ripete indefinitivamente per traslazione semplice nelle tre dimensioni. Si può individuare nel motivo che si ripete, costituito da ioni e atomi, una porzione di spazio che contiene tale motivo: questa è la
cella elementare del cristallo. Nella banca dati PDB si è passati, nel corso degli anni, dalla presenza di strutture 3D di proteine semplici alla presenza di strutture via via più complesse, tra cui le proteine di membrana. Queste sono le molecole più difficili da risolvere a livello cristallografico, perché sono immerse nel doppio strato lipidico e hanno molte componenti associate ad esse. La cosa più importante è mantenere il loro stato compatto. Immaginiamo un'alfa elica che attraversa la membrana cellulare: essa è disposta in un determinato modo per via dello strato fosfolipidico che la rende più stabile; se noi andassimo ad eliminare questo strato lipidico, di conseguenza andremmo a cambiare la forma. Dovremmo essere in grado di "sfilare" la proteina nel modo migliore possibile, senza far variare nulla e questo risulta essere molto difficile. In passato, per poter studiare proteine come le proteine G si attaccava alla
proteina daisolare una proteina P-merica e si sfilava la molecola di mio interesse. Ovviamente,però, il risultato era falsato per via della proteine P-merica attaccata alla proteina diinteresse. Prima che la struttura tridimensionale di una macromolecola sia resapubblicamente disponibile attraverso l'interrogazione di PDB, i dati provenienti dallavoro sperimentale che hanno permesso di determinare la struttura 3D di quella dataproteina sono accuratamente controllati e convalidati attraverso l'utilizzo diprogrammi appositi, che nell'insieme prendono il nome di ADIT (AutoDep Input Tool).E' necessario sottolineare comunque che, nonostante l'utilizzo di tali procedure e larevisione finale della entry da parte dei curatori di PDB, non è infrequente rilevareerrori e mancanze di uniformità nella struttura di tali file. Questa banca dati puòessere usata anche nella modellistica molecolare per effettuare poi degli studisuccessivi eL'accuratezza di questi studi dipende dalla qualità delle strutture depositate: a volte accade che prendiamo una struttura che non è ben risolta e prendiamo degli AA al posto di altri. Oppure nel caso più frequente mancano delle sequenze amminoacidiche, perché nonostante la cristallografia faccia del suo meglio, a volte non riesce a trovare tutti gli AA.
Vediamo come si usa PDB, facendo un esempio con la proteina avente codice 1LYZ.
Google -> PDB (clicca sul primo link: RCSB PDB Homepage) Si apre la seguente pagina:
Qui ci scrivi il codice "1LYZ"
Dopo aver cliccato su "Go", si apre la seguente pagina:
Numero identificativo dell'articolo in cui è stata pubblicata la struttura della proteina corrente
Qui sono riportate le informazioni che riguardano il metodo sperimentale utilizzato per determinare la struttura della proteina. In questo caso è stata utilizzata la
diffrazione a raggi x. La qualità dei risultati risoluzione indica la minima distanza presente tra due oggetti affinché essi appaiano separati tra loro. Quindi si tratta della distanza di legame. L'unità di misura della risoluzione è l'Angstrom che equivale a 10^-10 m (o a 10 cm). Parlando, appunto, di risoluzione, è bene dire che la risoluzione cristallografica per essere ottimale deve essere compresa tra 2.4 e 1.5 Å (e minore a 2.7 Å). Una buona risoluzione è importante perché con la cristallografia a raggi x si visualizza la posizione degli atomi pesanti e se la risoluzione non fosse buona verrebbe restituita un'immagine sfocata e, quindi, non sarebbe possibile distinguere bene la posizione degli atomi. Attualmente ci sono anche strutture risolte a 1°, quindi per dire che si sta riuscendo ad avere risoluzioni sempre migliori. È chiaro che la risoluzione è più scarsa tantoquanto più complesse sono le strutture. Per esempio, le proteine G o le proteine di membrana hanno una risoluzione che difficilmente è minore a 2 A° per via della loro elevata complessità. La banca dati PDB risulta essere ridondante: significa che se una struttura è stata cristallizzata più volte, è stata più volte inserita nella banca dati. Attualmente si sta cercando di alleggerire questa ridondanza, per cui se una struttura si riferisce a una proteina già presente in PDB, quella struttura già presente viene sostituita con quella nuova. Scorrendo in basso a questa pagina arriviamo alle seguenti informazioni: Sono informazioni più dettagliate del metodo sperimentale utilizzato per determinare la struttura della proteina. Nella tabella sotto la voce “Unit Cell” vengono riportate le dimensioni relative alla cella unitaria, cioè il volume di spazio più piccolo che contiene il motivo strutturale del“legame di solfuro”, che si forma tra i residui tiolici (SH) di due cisteine. Se guardiamo la prima riga, notiamo che in questa c’è scritto che un legame di solfuro si forma tra la cisteina in posizione 101 della catena A e la cisteina in posizione 164 della catena A; la seconda riga, invece, dice che il legame si forma tra la cisteina in posizione 203 della catena A e la cisteina in posizione 259 della catena A. Lo stesso discorso vale per le restanti righe contrassegnate dalla sigla “SSBOND”.
Scorrendo ancora più in basso, ci sono delle righe contrassegnate dalla sigla “ATOM”: (mancano altre righe, ma per motivi di spazio riporto solo queste)
In queste righe vengono riportate le coordinate cristallografiche di ciascun atomo di ciascun aminoacido. Le proteine cristallizzate vengono utilizzate per eseguire tecniche di diffrazione a raggi X, che è la tecnica utilizzata, appunto, per determinare la struttura di questa proteina.
coordinate cristallografiche di ciascun atomo che compongono gli aminoacidi permettono di capire la porzione di spazio della cella elementare del cristallo occupata da ciascun atomo. Gli atomi di ogni aminoacido sono, ad esempio, l'azoto del gruppo aminico, l'idrogeno del gruppo aminico, il carbonio del gruppo carbossilico e così via. Quindi vediamo come si interpreta la grafica riportata sopra: Le lettere (N, CA che significa carbonio alfa, C, O ecc.) sono le sigle degli atomi che compongono gli aminoacidi. N sta per azoto, O per ossigeno, C per carbonio e così via. Ovviamente non compaiono gli idrogeni perché la tecnica della diffrazione a raggi X non riesce a percepirli, essendo gli idrogeni caratterizzati da una densità elettronica troppo bassa. A fianco alle lettere sono riportate le sigle degli aminoacidi. Quindi è facilmente comprensibile a quale aminoacido appartengono gli atomi elencati. A fianco alle sigle degli aminoacidi sonoriportate le lettere che indicano la catena polipeptidica cui appartengono gli amminoacidi corrispondenti. A fianco alla lettere indicante la catena polipeptidica sono riportati dei numeri. Ad esempio, il numero 1 significa che quel determinato aminoacido è il 1° aminoacido della catena polipeptidica considerata. Le tre colonne successive sono le coordinate x, y e z. La colonna a fianco alle coordinate riporta dei numeri che stimano il movimento degli aminoacidi. Ovviamente gli aminoacidi non sono statici ma tendono, ad esempio, ad avere dei movimenti vibrazionali quindi quei numeri indicano di quanto si muovono gli aminoacidi rispetto alla posizione indicata dalle coordinate. Nel caso in cui ci imbattiamo nella sigla HETATOM (Heteroatoms) significa che si sta facendo riferimento a un atomo, che può essere un ligando della molecola, che non fa parte degli aminoacidi standard che compongono quella determinata proteina. Le coordinate cristallografiche sono in genere.riportate con valore compresi tra +1 e -1. Queste coordinate vengono spesse convertite in coordinate cartesiane, che sono quelle che noi conosciamo come una successione di tre numeri reali che individuano un punto p nel piano cartesiano tridimensionale (x,y,z). Una piccola molecola è in media lunga 12-15 Angstrom e pertanto le coordinate x,y,z sono comprese tra 0 e 15 se la posizione di uno dei suoi atomi viene considerata l'origine degli assi (0,0,0). Per molecole più grandi come le proteine, le coordinate cartesiane possono essere dei numeri molto più grandi. Quando si parla, invece, di coordinate interne si fa riferimento alla distanza relativa di un atomo rispetto agli altri; quindi è come se osservassi la molecola dall'interno e il mio sistema di riferimento è la molecola stessa (cioè considero un solo atomo come riferimento e vedo cosa succede a tutti gli altri, rispetto a quello di riferimento). L'insieme delle coordinate interne.Si dice matrice.