Genetica umana
Lezione 1: Introduzione alla genetica umana
In questo corso, come avrete già dedotto dal titolo, ci occuperemo di genetica ed in particolare di quella umana. Questa scienza è intesa classicamente come lo studio dei singoli geni e delle malattie che da essi possono essere generate. Di tutte le malattie genetiche, quelle che sono causate dall'alterazione di un singolo gene sono la minoranza e sono dette "monofattoriali". Esempi che tratteremo più avanti sono: la fenilchetonuria, l'anemia di Fanconi, la fibrosi cistica e l'emocromatosi.
Le malattie genetiche non monofattoriali sono definite multifattoriali e possono essere causate da vari eventi: dalla combinazione negativa di particolari sequenze di più geni, dalla loro attivazione, dall'ambiente in cui si trova a vivere il soggetto, ecc. Un esempio molto noto di malattia genetica multifattoriale è rappresentato dal cancro. Questo tipo di malattie genetiche e il numero elevato di fattori che ne sono alla base ha fatto sì che negli ultimi decenni del ventesimo secolo si sia sviluppata enormemente la genomica, la scienza che studia essenzialmente l'espressione dei geni (epigenetica), la loro attività nel loro complesso, l'organizzazione del DNA (metilazione, acetilazione, ecc.) e cerca risposte terapeutiche alle malattie genetiche non monofattoriali (cellule staminali, cure personalizzate).
Il progetto genoma umano
Parliamo ora del progetto genoma umano. Già prima di intraprendere un'opera così ambiziosa, la comunità scientifica sapeva che il sequenziamento completo del genoma umano non avrebbe portato ad una sua piena comprensione. Tuttavia, esso è stato di fondamentale importanza per altre ragioni:
- Sviluppare metodi di sequenziamento sempre più efficienti e meno costosi, permettendo ad oggi di poter sequenziare il genoma di un individuo in pochi mesi ed a un prezzo contenuto sui 1000-1500 $.
- Vedere se l'individuo possiede dei geni che lo predispongono a determinate malattie e studiare e indagare i geni nella loro interezza, quantificando così la suscettibilità genica di un individuo per una data malattia (= la sua predisposizione).
Il poter studiare i geni di un individuo nella loro totalità permette anche di osservare come individui malati diversi (che possiedono dunque forme diverse degli stessi geni) rispondono alla stessa terapia. Le informazioni raccolte possono pertanto aiutare a produrre farmaci individuali più efficienti e meno costosi.
Inoltre, oltre a tutte queste informazioni raccolte, si aggiungono quelle derivate dall'epigenetica che monitora il compattamento del DNA e rileva quali geni vengono espressi in esso.
Importanza del sequenziamento del DNA
Un concetto molto importante emerso dal sequenziamento del DNA consiste nel fatto che la complessità di un organismo non è determinata dal numero dei suoi geni. Per esempio, un topo ha più o meno lo stesso numero di geni posseduti dall'uomo. La grande differenza che ci diversifica dai murini sta nel numero delle sinapsi possedute nel nostro cervello. Infatti, l'uomo aumenta enormemente il numero dei collegamenti all'interno del suo cervello nei primi 3/5 anni di vita. Il diverso "comportamento" deve essere ricercato nell'epigenetica.
Tornando alla sequenza del DNA, troviamo che tra un individuo e l'altro vi è una differenza all'interno delle sequenze del 2 per mille. Inoltre, se il nostro genoma fosse considerato come un libro scritto in una lingua con solamente quattro lettere, sarebbe grande quanto 7024 divine commedie messe insieme!
Malattie genetiche monofattoriali
Come già accennato, ci occuperemo anche delle malattie genetiche monofattoriali. Esse costituiscono complessivamente solo il 10% delle malattie genetiche totali nell'adulto e il 25% di quelle genetiche nel bambino. Alcune sorgono in età avanzata come la Còrea di Huntington e l'Alzheimer, altre ancora nel primo anno di vita (distrofia muscolare di Duchenne) o durante la pubertà.
Un aspetto sempre rilevante delle malattie genetiche è che possono essere legate a determinate popolazioni o gruppi. Ad esempio, la sindrome di Tay-Sachs è diffusa nella comunità degli ebrei ashkenaziti.
La prima malattia monofattoriale di cui parliamo è la sordità infantile. Si tratta di una malattia molto difficile da diagnosticare. Circa un bambino su mille ne soffre. La causa scatenante della malattia è per il 40% dovuta a cause ambientali mentre il restante 60% da cause genetiche. In questi casi, si tratta di una malattia genetica sindromica ed eterogenea (= causata dalla mutazione di un gene ma non sempre lo stesso, ce ne sono diversi sia dominanti che recessivi). Pertanto, a differenza della maggioranza delle altre malattie monofattoriali, da due genitori affetti possono nascere bambini sani semplicemente perché i geni mutati nei due genitori appartengono a loci differenti. I vari geni che mutando portano alla sordità infantile sono legati allo sviluppo corretto delle varie parti che compongono l'orecchio.
Lezione 2: Identificazione delle malattie monofattoriali
Oggi parleremo delle malattie monofattoriali ed in particolare di come vengono identificate. Per malattie monofattoriali intendiamo quelle malattie genetiche causate dalla mutazione di un solo gene. Ne sono esempi la fibrosi cistica e l'emocromatosi.
Metodi di rilevazione del gene mutato
La prima tecnica che andiamo ad analizzare per la rilevazione del gene mutato è il clonaggio funzionale. Per clonaggio si intende un metodo di produzione che a partire da una singola sequenza di DNA ne produce molte copie dello stesso. Con funzionale si intende la scoperta del luogo dove è localizzato il gene sui cromosomi a partire dalla sua funzione. Per trovare quest'ultima, in passato si andava a isolare una determinata proteina e poi a partire da questa se ne ricavava la sequenza amminoacidica che (seguendo la regola del codice genetico) portava a varie sequenze di DNA. Dopo questo, si andava a ricercare sul genoma se vi era la presenza di una di esse. Una volta trovata, si capiva qual era la funzione del gene. Il processo era molto complicato poiché ci voleva una grandissima quantità di proteina e le tecniche per determinare le sequenze di aminoacidi sono complesse e laboriose.
Ad esempio, questo metodo è stato utilizzato per trovare il gene dell'emofilia (in essa il fattore VIII della coagulazione non funziona. A partire dalla sequenza aminoacidica di esso si è trovato il gene mutato) e della fenilchetonuria (malattia causata dall'impossibilità di metabolizzare fenilalanina che causa ritardo mentale. Oggigiorno viene diagnosticata con un semplice test dopo la nascita e per curarla basta eliminare la fenilalanina dalla propria dieta). Questa tecnica di ricerca della funzione dei geni è un'operazione di genetica inversa ovvero si parte dal prodotto per risalire al gene, normalmente le proteine necessarie per la ricerca vengono prelevate dal fegato (grande produttore di tantissime proteine). Oggi questa metodologia è stata superata da altre più moderne.
Un altro metodo per rilevare la mutazione di un gene consiste nel saggio di complementazione. Si tratta di un saggio funzionale poiché si usano le singole cellule come se fossero singoli individui. Rispetto all'altro metodo è più interessante poiché più veloce e permette di ricavare da un'unica malattia eventualmente più di un gene mutato. Questo metodo è stato utilizzato ad esempio per trovare i geni responsabili e le diverse varianti dell'anemia di Fanconi (malattia autosomica recessiva (AR) che colpisce un individuo su 100000 e porta a effetti come anemia e trombocitopenia, neutropenia, causate da insufficienza di emopoiesi, e aberrazioni cromosomiche) causata da mutazioni di geni che sintetizzano per enzimi che riparano il DNA (geni FA o FANC).
Il saggio di complementazione su questa malattia si basa sul fatto che le cellule affette dalla sindrome non possono riparare i crosslinking causati da radiazioni. Se queste rotture del filamento di DNA sono troppo elevate la cellula muore. Per cominciare si prende un DNA di individuo sano, lo si digerisce con enzimi di restrizione e i segmenti ottenuti si inseriscono in plasmidi che andranno a costituire una libreria di cDNA dell'individuo normale (wild type). Si prende poi una coltura di cellule malate e si transfettano i plasmidi in esse. Dopodiché si mette la coltura sotto dei raggi. Le cellule che muoiono sono quelle che non possiedono i geni FA corretti mentre quelle che sopravvivono hanno ottenuto dal plasmide il gene corretto. A questo punto si riestrae il plasmide dalle cellule sopravvissute e si analizza il gene in esso contenuto. Anche questa tecnica è ormai caduta in disuso.
Questo saggio (che si basa su una tecnica di diagnostica molecolare) permette anche di verificare se esistono altri geni che portano alla stessa malattia e quindi se ci sono ceppi diversi della sindrome, come avviene sempre nella sindrome di Fanconi. Possiamo prendere ad esempio una coltura con cellule di tipo FA-A (Fanconi A) e le si fondono con altre cellule di Fanconi (il cui ceppo è sconosciuto). Dalla loro unione abbiamo due possibilità basate sul fatto che i geni che causano ceppi differenti sono diversi e presentano la malattia solo in omozigosi: o ci sarà una cellula di FA-A (in questo caso il ceppo sconosciuto è di tipo A) oppure una cellula wild type (in questo caso il ceppo non sarà A e dovremo condurre un altro esperimento per determinarne la natura).
Clonaggio posizionale e analisi del linkage
Una volta trovato il gene, si procede con il clonaggio posizionale per trovarne la posizione sul cromosoma: l'analisi del linkage. Si può utilizzare anche l'analisi delle anomalie cromosomiche per comprendere dove il gene risiede (ne sono un esempio le trisomie). Analizziamo adesso il caso in cui noi sappiamo già qual è il cromosoma su cui è situato il gene e si vuole vedere la sua posizione rispetto ad un altro. Procediamo utilizzando dei marcatori che possono essere paragonati a dei paletti di indicazione chilometrici dell'autostrada. Essi infatti si posizionano sempre in determinati punti del cromosoma e pertanto sono un riferimento oggettivo di posizione rispetto alla quale possiamo ricavare la distanza del nostro gene. Questi marcatori consistono normalmente in RFLP (restriction fragment length polymorphism, marcatori basati su siti di restrizione che oggi non vengono più usati in quanto pericolosi perché la radioattività usata per marcarli è troppo elevata), microsatelliti (che sono distribuiti uniformemente all'interno dei cromosomi) e SNP (polimorfismi a singolo nucleotide). Questi marcatori si vanno a legare a determinate sequenze in cui è possibile che ci sia il gene malato. Per vederlo e per circoscriverne massimamente la sua posizione all'interno della sequenza evidenziata devo condurre un'analisi su un albero genealogico. Il nome che viene dato a ciascuno di questi marcatori è indicato con una D iniziale, segue il numero del cromosoma e poi una S più un numero arbitrario, ad esempio abbiamo i marcatori D22S277, D22S1142, D22S445.
In questo albero è stato evidenziato il cromosoma 22 del "capostipite malato" in ogni ramo familiare evidenziando in giallo una sequenza di DNA abbastanza grande e specifica delle sequenze di DNA del soggetto (SNP). Il marcatore utilizzato si attacca dunque a delle determinate sequenze del soggetto malato che non si trovano nel suo coniuge. Pertanto, nel figlio avremo marcate solamente quelle sequenze che ha ereditato dal padre. Dato che il marcatore è presente in sequenze che coprono tutto il cromosoma, una di quelle evidenziate sarà più vicina delle altre al gene malato e generalmente segregherà con esso. Il problema sta nello scoprire qual è questa sequenza. Una volta trovata, sapremo che il gene malato è vicino ad essa e dunque andremo ad indagare più approfonditamente intorno a quella regione.
Per trovare la sequenza correlata al gene dobbiamo fare dei confronti sulle varie generazioni. Ci saranno individui malati con alcune sequenze colorate e altri con alcune diverse (ma almeno una è sempre in comune ed è quella correlata al gene malato) sempre colorate, oppure individui sani che hanno ereditato sequenze colorate (le quali ovviamente non saranno correlate con il gene malattia). Questa tipologia di ricerca della posizione del gene su un determinato cromosoma possiede dei problemi di tipo pratico perché necessita di più generazioni (nel diagramma ne sono state studiate tre) e un numero cospicuo di soggetti da studiare (= famiglie con un buon numero di figli per condurre un paragone tra i vari cromosomi).
Tutta la metodologia si basa sul principio della ricombinazione, ovvero sul fatto che due sequenze di DNA molto vicine non ricombinano quasi mai. Si tratta però di una misurazione di "distanza" abbastanza empirica che non dà un numero preciso (come ad esempio il numero di paia di basi, = misurazione fisica) ma un numero indicativo (misurato in cM (un cM corrisponde a circa 106 paia di basi), 100 cM corrispondono al 100% di ricombinazione, 50 cM corrispondono al 50%, ecc.). La frequenza di ricombinazione viene indicata con il valore θ (che è un valore percentuale). Concettualmente esso può arrivare al 100% (i due alleli si ricombinano sempre) ma dal punto di vista pratico non può andare oltre la soglia del 50%.
Nel caso precedente abbiamo parlato di frequenza di ricombinazione di geni che si trovano sullo stesso cromosoma. Tuttavia, la situazione diventa più complessa quando noi sappiamo che due geni sono su un cromosoma di numero n però non sappiamo se sono sullo stesso cromosoma o ciascuno su uno dei due cromosomi omologhi. Per formalizzare in termini matematici questa situazione e comprendere se i due geni sono sullo stesso cromosoma o no dobbiamo calcolare il cosiddetto lod score ("logarithm of odds score").
Partiamo calcolando la probabilità che due geni siano sullo stesso cromosoma ad un determinato θ (possiamo ipotizzare diversi valori di theta e dunque calcolare diverse probabilità). Calcoliamo poi la probabilità che i due geni siano su cromosomi omologhi (calcolo più complesso). A questo punto eseguiamo il rapporto tra i due valori. Più alto è il rapporto più sarà probabile che i due geni siano sullo stesso cromosoma, più basso è e meno sarà probabile. Infine, per una esigenza meramente pratica di semplificazione dei calcoli, si compie il logaritmo in base 10 del rapporto.
Esempio di stima del lod score
Vediamo un esempio di stima del lod score per due geni all'interno di uno studio condotto su varie famiglie.
Lezione 3: Metodologie avanzate e tecniche di sequenziamento
Nella scorsa lezione abbiamo parlato del lod score. Vi faccio vedere in questa slide la curva di lod score che è stata fatta per il gene PCSK con vari marcatori. Il marcatore più vicino (e con la theta più probabile) risulta essere quello con lod score più alto. Vediamo che il valore è circa 5 pertanto avremo 100000 casi a 1 che il marcatore si trovi sullo stesso cromosoma rispetto al caso che si trovi su cromosomi diversi. A questo punto andremo a cercare nella regione del marcatore e approfondiremo la nostra ricerca per ottenere la posizione esatta del gene. Una ricerca di questo tipo si conduceva di routine fino a qualche anno fa mentre da una decina d'anni a questa parte si preferisce il sequenziamento intero (il quale non necessita dello studio familiare che è molto complesso da condurre per la difficoltà di trovare famiglie con molti figli). Con il sequenziamento si conducono le cosiddette genome wide associations ovvero si sequenziano le parti del cromosoma e andiamo a confrontare la sequenza del gene malattia con quelle ricavate (così ricaviamo la posizione in base pair del gene studiato all'interno del cromosoma).
Come vediamo in questa slide nel 1990-2003 è stato condotto il progetto genoma umano che ha evidenziato nel nostro DNA circa 25000 geni. In realtà si è scoperto che non è importante tanto conoscere quali sono i geni in un individuo ma come e dove vengono espressi.
Clonaggio posizionale e malattie identificate
Andiamo ora a vedere quali sono le malattie identificate grazie al clonaggio posizionale (tecnica che come abbiamo detto è caduta in disuso). Vedremo due delle malattie rappresentative: la fibrosi cistica (importante dal punto di vista storico poiché è stata la prima malattia di cui si è scoperto il gene mutato grazie al clonaggio posizionale) e l'emocromatosi (una malattia tra quelle definite "a iceberg" ovvero che sono molto difficili da diagnosticare (ne viene diagnosticata solamente una piccola parte dei casi)).
La fibrosi cistica del pancreas è una malattia autosomica recessiva in cui il gene che regola la concentrazione di cloro nelle secrezioni risulta difettoso. La conseguenza di ciò è un aumento rilevante del muco che porta all'ostruzione dei dotti pancreatici e dei bronchi. Normalmente la si diagnostica grazie al test del sudore. Vediamo ora come è stato localizzato questo gene. Nel 1985 si era riusciti grazie a due marcatori (che ricombinano con il gene malato e sono il Cmet e il D7S8) a localizzare una regione cromosomica sul cromosoma 7 di circa 500 kb (0.5 cM) in cui si trova il gene. Per restringerla ulteriormente si sono utilizzati dei vettori YAC che contenevano il gene malato (con la stessa mutazione del gene studiato): dove due YAC ibridavano voleva dire che lì c'era il gene malato (più la possibilità di avere altre sequenze, l'ibridazione avvenuta veniva verificata con il microscopio elettronico). Andando a studiare più approfonditamente e con vettori più piccoli dei BAC (come ad esempio i plasmidi e i cosmidi) le regioni ibridate si riuscì ad isolare completamente il gene e a trovare la sua posizione esatta (in cM) sul cromosoma 7, si trattò comunque di una operazione molto faticosa, dispendiosa e che richiese molto tempo.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.