Estratto del documento

Strumenti computazionali per la bioinformatica

Introduzione

La bioinformatica, in generale, è una disciplina che utilizza strumenti informatici per descrivere da un punto di vista matematico determinati fenomeni biologici. Le sue applicazioni sono molto diverse e includono la modellazione di network e system biology, big data analysis, analisi filogenetiche, allineamenti e analisi di sequenze fino ad arrivare alla predizione di strutture delle proteine e simulazioni quanto-meccaniche. Il molecular modelling può essere applicato più in generale a qualsiasi molecola; nel caso della bioinformatica strutturale viene applicato allo studio di molecole biologiche.

Modello: semplificazione del sistema o del processo di interesse, solitamente in termini matematici, con lo scopo di facilitare calcoli e predizioni. È importante studiare cosa succede a livello molecolare in quanto qualsiasi proprietà macroscopica di un sistema dipende più o meno direttamente dai sistemi molecolare e da come interagiscono. È quindi fondamentale decidere il cutoff, ovvero il limite oltre il quale non andare negli studi di modellistica molecolare. Ad esempio, nel caso in cui si stiano studiando proprietà spettroscopiche magnetiche che dipendono da nuclei ed elettroni, è necessario avere una descrizione microscopica del sistema in esame a livello delle particelle subatomiche.

Dimensione del sistema

Più un fenomeno viene descritto nei dettagli microscopici, più è ridotta la dimensione del sistema (non è possibile descrivere in termini microscopici qualsiasi atomo all’interno di una cellula).

  • Quantum mechanics: tecnica più dettagliata, consente di studiare un sistema di un migliaio di atomi al massimo. Ad esempio la struttura dell’eme.
  • Hybrid QM-MM: permette di descrivere in maniera dettagliata ad esempio il sito attivo di un enzima e la reazione che avviene al suo interno descrivendo l’intorno di esse in maniera meno dettagliata.
  • Molecular Mechanics: consente di studiare le proteine nella loro completezza.
  • Coarse-Grained Molecular Mechanics.

Fenomeno da studiare

È importante anche considerare il fenomeno da studiare e quindi le tempistiche coinvolte. Quantum mechanics consente di studiare reazioni chimiche molto veloci nell’ordine dei fs eps. Per studiare cambi conformazionali e folding proteico è necessario passare a tecniche meno dettagliate come la Molecular Dynamics (MD), che consente di simulare fenomeni più lunghi che arrivano ai μs e ms.

Applicazioni principali

Visualizzazione

Utilizzando software dedicati alla visualizzazione delle molecole è possibile:

  • Studio della superficie: ad esempio andare a cercare canali piuttosto che siti di binding. Questo si può fare sia manualmente, sia attraverso l’uso di algoritmi che consentono di identificare dimensioni e proprietà chimico-fisiche del sito. Si può anche mappare il potenziale elettrostatico di superficie, la stima delle cariche parziali di superficie è estremamente utile nel drug design perché a seconda delle proprietà della superficie del target si possono progettare molecole con un’affinità maggiore.
  • Identificare residui chiave nella catalisi.

Simulazione

  • Interazione fra molecole: proteina-ligando, visualizzando come si lega e i residui chiave in modo da poter agire sulla molecola per modificarne il binding. Proteina-proteina, proteina-peptide, proteina-DNA ma anche l’interazione fra DNA e molecole (ad esempio farmaci).
  • Dinamica di un sistema: ad esempio identificare porzioni più flessibili, cambi conformazionali in seguito al legame con una molecola piuttosto che cambi conformazionali in seguito alla mutazione di specifici residui (mutagenesi in silico). Si possono simulare anche folding proteico per proteine che foldano molto velocemente, non si può fare per proteine che impiegano secondi.
  • Studio di membrane cellulari: molto onerose computazionalmente, si possono studiare fenomeni di autoassemblamento e simulare nanoparticelle per studiarne le proprietà.
  • Reazioni chimiche: è possibile determinare in modo dettagliato il meccanismo di reazione di un enzima e capire come avviene la reazione.
  • Studio della struttura elettronica e degli orbitali di una molecola.

La bioinformatica e la struttura delle proteine

Le proteine possono svolgere una vasta gamma di funzioni all’interno delle cellule, non esiste fenomeno cellulare che non ne coinvolga almeno una. Inoltre, costituiscono la frazione maggiore di una cellula, escludendo l’acqua. Per strumenti computazionali si intendono due cose: i programmi e i computer, ovvero l’hardware con cui andare a effettuare i calcoli. La scelta di hardware e software dipende strettamente dal problema biologico da studiare, da come si vuole modellare il sistema e dal metodo scelto per la simulazione. La struttura della molecola è il centro della bioinformatica strutturale, la relazione struttura-reattività è univoca (se cambia la struttura cambia l’energia del sistema e conseguentemente la tendenza e il modo con cui reagisce). Piccoli errori nella struttura della molecola possono portare a conclusioni errate delle simulazioni.

Richiami della struttura delle proteine

  • Struttura primaria: sequenza degli amminoacidi.
  • Struttura secondaria: riarrangiamento locale determinato dal pattern di legami H lungo la catena principale. Queste possono essere regolari come α-eliche e β-foglietti o irregolari come i loop.
  • Strutture supersecondarie: combinazioni ricorrenti di elementi di struttura secondaria.
  • Struttura terziaria: riarrangiamento di elementi di struttura secondaria.
  • Struttura quaternaria: assemblamento di più subunità.

Rotazione dei legami

Il legame ammidico, data la risonanza fra C=O e il doppietto libero di N dell’NH, è rigido e planare. Di conseguenza, 1/3 dei legami del backbone non può ruotare liberamente, la flessibilità è data dalla rotazione dei legami Cα-N e Cα-C. Il ripiegamento avviene quindi grazie alla rotazione intorno a questi legami ed è guidata dalle interazioni che si instaurano fra le catene laterali. Gli angoli diedri φ e ψ si riferiscono rispettivamente ai legami che uniscono Cα-N e Cα-C e dai due legami peptidici coinvolti. Essi non possono assumere qualsiasi valore a causa di problemi di ingombro sterico, inoltre ogni tipo di struttura secondaria ha una combinazione caratteristica di angoli (Ramachandran Plot).

Strutture secondarie periodiche

Eliche: esistono diverse tipologie di eliche che introducono un elemento di chiralità nella struttura della proteina perché la rotazione intorno ad un asse può avvenire verso destra o verso sinistra. Per quanto riguarda le α-eliche, si instaura un legame H fra il residuo i-esimo e i+4, la struttura è stabile solo per residui non molto ingombrante e ogni giro contiene 3.6 amminoacidi. Le eliche 310, non molto frequenti, spesso si trovano come estensioni N- e/o C-terminali delle α-eliche; si ritiene siano conformazioni intermedie al folding-unfolding. Infine le eliche π si trovano come “rigonfiamento” all’interno delle α-eliche e si possono interconvertire le une nelle altre tramite inserzione o delezione di un amminoacido.

β-sheets: struttura molto stabile caratterizzata da legami H fra N-H e C=O di due diversi filamenti. I due filamenti possono essere paralleli o antiparalleli e generalmente una struttura a β-sheet contiene almeno 5 filamenti.

Strutture supersecondarie

Dimensione delle proteine e problemi di computazionabilità

Le proteine sono molecole molto complesse, quella più grande è formata da 27.000-33.000 amminoacidi. Il primo problema è che bisogna estrarre le informazioni dalla struttura proteica e per farlo sono necessari degli appositi algoritmi, il secondo è il costo computazionale. Il costo computazionale dipende dal tipo di simulazione che si vuole fare, nel caso di simulazioni di dinamica molecolare con sistemi di grosse dimensioni servono supercomputer che permettono la parallelizzazione dei calcoli. Per fare questo servono algoritmi parallelizzabili, un sistema operativo distribuito (Linux è il più usato).

Modellare una proteina

La proteina per essere modellata deve essere espressa come stringa di carattere che identificano le coordinate di tutti gli atomi, esistono diversi formati usati da diversi programmi (il formato standard è pdb). Nel file pdb sono contenute non solo le informazioni circa le coordinate di tutti gli atomi ma anche informazioni sulla proteina, metodi sperimentali per la risoluzione della struttura ecc. Il programma di modellazione legge quindi le coordinate presenti nel file e le processa secondo le istruzioni raccolte nell’input, ovvero secondo il tipo di simulazione che si vuole effettuare. I software di computer grafica a questo punto consentono di visualizzare e editare le strutture molecolari e di monitorare l’andamento della simulazione.

Risoluzione della struttura 3D di una proteina

Le tecniche più utilizzate ad oggi per la risoluzione della struttura 3D di una proteina sono l’NMR e da diffrazione a raggi X. In entrambi i casi quello che si ottiene sono le informazioni relative alla disposizione spaziale degli atomi all’interno della proteina.

Spettroscopia

Si basa sull’interazione fra la radiazione elettromagnetica e la materia, ci sono moltissime tecniche diverse che danno informazioni diverse. Da un punto di vista concettuale la diffrazione ai raggi X non è una spettroscopia perché non si ha un assorbimento di radiazione elettromagnetica. In linea di massima si ha una sorgente di radiazione elettromagnetica che andrà ad incidere sul campione. Quest’ultimo può assorbirla e trasmetterla, deviarla o rifletterla, sarà compito del rilevatore registrare la radiazione in uscita dal campione. In base a quali sono le differenze fra la radiazione in uscita rispetto a quella in entrata è possibile determinare come il campione interagisce con essa. La spettroscopia può essere classificata sulla base di:

  • Natura dell’analita: molecole in soluzione o cristalli.
  • Natura dell’interazione: trasmissione-assorbimento, scattering elastico-riflessione o scattering anelastico-diffusione.
  • Meccanismo: oltre che in assorbimento esistono spettroscopie di emissione o in fluorescenza.

Radiazione elettromagnetica

Secondo la definizione di Maxwell è un’onda che trasporta energia caratterizzata da due campi ortogonali (elettrico e magnetico) che si propagano in modo ondulatorio. L’intensità della radiazione non è altro che il massimo del vettore campo elettrico. E e B oscillano alla stessa frequenza, il periodo è dato dall’intervallo di tempo che intercorre fra due massimi ed è proporzionale a λ/c, la frequenza è l’inverso del periodo. L’energia trasportata dalla radiazione elettromagnetica è quantizzata, ovvero viene trasportata in pacchetti chiamati fotoni e equivale a hv. Gli atomi e le molecole possono trovarsi in stati aventi valori determinati e caratteristici di energia; in assenza di stimoli esterni si trovano nel loro stato fondamentale a cui è associato un determinato valore di energia. Ci sono tuttavia altri stati, ad energia crescente, che possono essere popolati fornendo l’energia necessaria a determinare la transizione, questa energia è uguale a hv. La probabilità di questa transizione è legata alla distribuzione di Boltzmann:

N/N0 = e-ΔE/kT e ΔE = hv = hc/λ

L’interazione energetica avviene quindi solo a particolari frequenze. Questo significa che tanto più piccola è la variazione di energia fra i due livelli, tanto minore è la frequenza della radiazione emessa o assorbita (e maggiore è la lunghezza d’onda). Ad esempio l’energia necessaria a far avvenire una transizione fra i livelli elettronici è maggiore rispetto a quella necessaria a far avvenire transizioni fra i livelli vibrazionali o rotazionali. L’assorbimento di una data radiazione è una proprietà caratteristica di una determinata molecola e non di altre, questo è dovuto al fatto che ad ogni sistema molecolare è associata una distribuzione caratteristica dei livelli energetici, di conseguenza lo spettro generato è unico per ogni sostanza. La spettroscopia può quindi essere classificata sulla base del range energetico, a seconda della loro frequenza le onde elettromagnetiche sono prodotte da sorgenti diverse e hanno modalità diverse di interazione con la materia. In altre parole, diverse onde elettromagnetiche generano diverse transizioni, quindi l’informazione che si ricava dal fenomeno fisico osservato dipende dalla frequenza della radiazione utilizzata.

Può anche essere classificata sulla base di quale componente della radiazione interagisce con la molecola:

  • Spettroscopie ottiche: il dipolo elettrico molecolare interagisce con la componente elettrica della radiazione (assorbimento-emissione, UV-vis, dicroismo circolare, fluorescenza, IR, Raman, XAS e XES).
  • Spettroscopie magnetiche: il dipolo magnetico molecolare (nucleare o elettronico) interagisce con la componente magnetica della radiazione (NMR e Mossbauer, EPR).
  • Scattering: non prevede un fenomeno di assorbimento ma semplicemente il cambiamento di traiettoria in seguito alla collisione dell’onda elettromagnetica e il campione.

NMR

In generale è una spettroscopia di assorbimento; la sorgente produce onde radio a bassa energia che è sufficiente a determinare delle transizioni di spin nucleare nel campione in esame. Il campione viene immerso in un campo magnetico e l’assorbimento della radiazione causa la transizione di spin degli atomi che possiedono un momento magnetico nucleare di spin. Affinché un nucleo sia NMR attivo il suo spin nucleare deve essere frazionario; protoni e neutroni possiedono spin ½ e si associano in coppie di spin opposti, di conseguenza per essere NMR visibili protoni e neutroni devono essere necessariamente uno pari e l’altro dispari (1H, 13C, 15N ecc.).

Possiamo considerare i nuclei come dei piccoli magneti; in assenza di un campo magnetico esterno essi assumono un’orientazione random. Tuttavia nel momento in cui vengono immersi in un campo magnetico B0, essi possono assumere due orientazioni: una parallela e una antiparallela al campo applicato. Le due diverse orientazioni hanno energie differenti ed è possibile determinare la transizione da uno stato all’altro fornendo l’energia necessaria data dalla formula: ΔE = hν = γħB0. L’energia necessaria a determinare la transizione di spin è dunque funzione del nucleo in esame e del campo magnetico applicato.

Le informazioni strutturali si ricavano da:

  • Interazione fra B0 e Blocale (Chemical Shift): ciascun nucleo non risente esattamente del campo magnetico B0, ma bensì di un campo magnetico effettivo Beff che deriva dall’interazione dal campo magnetico applicato e da quello locale che dipende dall’intorno chimico del nucleo. Questo determina che, cambiando il campo magnetico locale, cambia anche la separazione dei livelli energetici e quindi anche la frequenza di assorbimento dei nuclei, questo si riflette sulla frequenza del segnale generato. Il campo magnetico locale è dovuto al fatto che gli elettroni, essendo particelle cariche in movimento, quando si trovano in un campo magnetico generano a loro volta un campo magnetico indotto che si oppone a B0. Questo determina che nuclei legati ad atomi poco elettronegativi si trovano più immersi negli elettroni di legame che con il loro Blocale schermano tale nucleo da B0 e lo fanno risuonare a frequenze minori (Beff minore).
  • Interazione magnetica tra diversi spin nucleari adiacenti (accoppiamento di spin): dà informazioni circa la presenza di nuclei NMR visibili adiacenti a quelli che originano il segnale.
  • Integrazione dell’area dei picchi: informazione quantitativa.

Uno dei problemi principali è dato dal fatto che una proteina è composta da migliaia di atomi, servono dunque delle strategie efficaci per risolvere lo spettro generato. Per farlo si utilizzano spettri bidimensionali in cui si correlano le frequenze di risonanza di nuclei uguali (COSY, TOCSY e NOESY) o diversi (HSQC); più aumenta la dimensionalità degli spettri, più aumenta il contenuto di informazione perché vengono correlati fra loro segnali che si trovano in un punto specifico della struttura. È quindi possibile ricavare le interazioni spaziali tra i vari nuclei siano essi collegati attraverso legami chimici o semplicemente vicini nello spazio. Quello che si ottiene tramite NMR non è una singola struttura, bensì un insieme di strutture che sono molto simili fra loro nelle regioni più rigide ma diverse nelle regioni più libere di movimento (loop ecc).

Cristallografia ai raggi X

Non si tratta di una spettroscopia di assorbimento ma semplicemente di una deviazione dei raggi X da parte del campione senza determinarne una variazione di intensità. Il cristallo viene posizionato su un supporto che ruota e viene colpito dai raggi X (lunghezza d’onda fra 0.2 e 2 Å, particolarmente indicata per rilevare le distanze atomiche), la sorgente deve essere monocromatica. Questo tipo di analisi necessita di un cristallo, ovvero una struttura tridimensionale regolare delle molecole che compongono il campione.

Anteprima
Vedrai una selezione di 13 pagine su 58
Strumenti computazionali per la bioinformatica Pag. 1 Strumenti computazionali per la bioinformatica Pag. 2
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Strumenti computazionali per la bioinformatica Pag. 6
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Strumenti computazionali per la bioinformatica Pag. 11
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Strumenti computazionali per la bioinformatica Pag. 16
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Strumenti computazionali per la bioinformatica Pag. 21
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Strumenti computazionali per la bioinformatica Pag. 26
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Strumenti computazionali per la bioinformatica Pag. 31
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Strumenti computazionali per la bioinformatica Pag. 36
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Strumenti computazionali per la bioinformatica Pag. 41
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Strumenti computazionali per la bioinformatica Pag. 46
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Strumenti computazionali per la bioinformatica Pag. 51
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Strumenti computazionali per la bioinformatica Pag. 56
1 su 58
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Albe94UniMiB di informazioni apprese con la frequenza delle lezioni di Strumenti computazionali per la bioinformatica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Arrigoni Federica.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community