Che materia stai cercando?

Genetica e basi di genomica Appunti scolastici Premium

Appunti di Genetica presi alle lezioni del prof. Cenci dell’università degli Studi La Sapienza - Uniroma1, Interfacoltà, Corso di laurea in biotecnologie, con particolare riferimento ai metodi di sequenziamento e le basi delle sperimentazioni su topi in laboratori. Scarica il file in formato PDF!

Esame di Genetica docente Prof. G. Cenci

Anteprima

ESTRATTO DOCUMENTO

Il genoma

Il progetto ENCODE sta cercando di conoscere le funzioni regolative della parte non codificante

del nostro genoma e coinvolge un consorzio mondiale, l’obettivo di questo progetto e’

l’identificazione di elementi del DNA appartenenti al reguloma (promotori, enhancer, silencer,

regioni della cromatina suscettibili di intense modificazioni epigenetiche, geni per trascritti

regolatori), la disfunzione di esso sara’ alla base del processo di patogenesi, la quantita’ totale di

DNA di un organismo non correla con la complessita’ dell’organismo (paradosso del valore C), non

ci sono rivelazioni sorprendenti su cosa rende l’uomo diverso da uno scimpanze’, circa il 40% del

genoma eucariotico e’ occupato da G e C, inoltre rispetto ai procarioti si osserva una marcata

variazione intra-genomica della composizione in basi (anche se negli eucarioti superiori e nei

vertebrati a sangue caldo la composizione in basi del DNA e’ pressoche’ omogenea), modello delle

isocore: il genoma dei vertebrati e’ un mosaico di segmenti di DNA, isocore (>>300 bp), ciascuno

caratterizzato da una propria omogenea composizione in basi, nei vertebrati a sangue caldo si

osservano 5 zone: L1 ed L2 (definite isocore leggere e piu’ frequenti) con piu’ AT e H1, H2 e H3

con piu’ GC, le zone H2 e H3 costituiscono il genome core: sono zone di densita’ molto elevata e

comprendono il 12% del genoma; l’88% del genoma e’ occupato, invece, dall’empty space (L-H1)

in cui la frequenza genica e’ molto bassa, la presenza di geni e’ piu’ alta nelle zone dove sono piu’

frequenti le GC, la definizione di gene e’ in continua evoluzione, un gene non codifica per una

proteina come si pensava una volta ma per una catena polipeptidica e puo’ codificare anche per

un RNA funzionale, esso puo’ avere piu’ inizi, piu’ terminazioni e piu’ processamenti del suo RNA,

puo’ utilizzare diversi promotori, la trascrizione di un gene si puo’ arrestare in corrispondenza di

diversi terminatori, i trascritti espressi possono subire splicing alternativo, i geni possono essere

sovrapposti tra loro, nello stesso orientamento o in orientamento opposto, oppure alcuni geni

possono essere all’interno di un altro gene (gene fibromatosi NF1, a esempio, presenta nell’introne

26 3 geni, gene fattore VIII F8 nell’introne 22 presenta 2 geni e un’isola CpG), non e’ stata data

una funzione a tali geni ma c’e’ una produzione tessutospecifica del gene, alcuni trascritti sono

originati dalla ligazione di diverse molecole di RNA attraverso il meccanismo del transplicing (al

contrario del cisplicing che definisce il processamento canonico), si possono formare trascritti

chimerici in seguito alla cotrascrizione di geni disposti in tandem, si possono trascrivere RNA che

esprimono proteine con funzioni opposte (es. gene proapoptotico CARD presenta un’isoforma piu’

corta CASP9S che perde il dominio catalitico che gli permette di funzionare come inibitore della

apoptosi), un gene puo’ codificare proteine indirizzare a diversi compartimenti cellulari (es. NFS1

fornisce zolfo inorganico alle proteine ferro zolfo prendendo lo zolfo dalla cisteina formando

alanina, questo gene utilizza siti d’inizio alternativi della traduzione per generare un’isoforma

mitocondriale, con il peptide segnale, e un’isoforma citoplasmatica, senza peptide segnale e tale

scelta e’ data molto probabilmente dalla variazione del pH cellulare), uno stesso gene puo’

codificare trascritti soggetti a un diverso meccanismo di regolazione post-trascrizionale (es. gene

SLC11A2), gene: specifica regione di DNA la cui trascrizione e’ regolata da uno o piu’ promotori e

altri elementi di controllo trascrizionale che contiene l’informazione per la sintesi di proteine ed

RNA non codificanti funzionali, tra loro correlati, per la condivisione d’informazione genetica (con

un tratto d’informazione in comune) a livello dei prodotti finali, il DNA ripetitivo puo’ essere

suddiviso in ripetizioni intersperse (46%), ripetute a tandem (DNA satellite, maggior parte delle

regioni eterocromatiche in particolare quella pericentrica e centromerica di 5-171 nt; DNA

minisatellite, ipervariabile in dimensioni e telomerico, di 64 nt; DNA microsatellite, STR 1-6 nt),

probabilmente sequenze a tandem derivano da crossing over ineguale ed errori nella replicazione

del DNA ma ancora non si conosce la loro funzione (probabilmente le sequenze (CA)n

contribuscono a conferire la forma Z al DNA; nei cormosomi acrocentrici, invece, oltre al

restringimento a livello del centromero si nota una seconda restrizione sul braccio corto in cui e’

situato il cluster di sequenze a tandem di rDNA), esistono retrotrasposoni LINE (autonomi, presenti

nelle bande scure o bande G), SINE (non autonomi, provenienti da pseudogeni maturati) e

trasposoni LTR (autonomi), derivanti dai retrovirus, per dedurre la sequenza genomica i geni che

codificano per le proteine si individuano dei moduli di lettura aperti (ORF) mediante analisi

computazionale, ogni orf presenta un AUG, un codone di terminazione (TAA, TAG, TGA) e una

sequenza nel mezzo che sia compatibile con la sintesi della proteina (ogni sequenza presenta 6

possibili cornici di lettura), se il DNA ha una sequenza casuale di nucleotidi e un contenuto in CG

uguale al 50%, le sequenze corrispondenti ai 3 codoni di terminazione si presenteranno con una

frequenza di 4^3 (64nt), se CG > 50% i tre stop ( ricchi in AT) avranno una frequenza minore (100-

200 nt), pero’ le orf hanno una lunghezza decisamente maggiore (circa 450 aa): se una sequenza

non presenta sequenze di stop allora probabilmente sara’ una orf poiche’ la loro lunghezza non e’

casuale, nel DNA eucariotico e’ molto difficile ed esistono software per l’analisi delle orf che

prendono in considerazione codoni preferenziali specie-specifiche, le orf possono essere pescate

da collezioni di cDNA o di EST (evidenza diretta della trascrizione di una sequenza) come sonde,

una trascrizione di cDNA non si riesce ad avere una full lenght ma si ha semplicemente una

piccola parte del gene come cDNA, la GenBank contiene tutte le EST da utilizzare nei vari

organismi a seconda del tessuto, non tutti i geni hanno delle ORF in quanto esistono come RNA

funzionali e hanno capacita’ di appaiamento intramolecolare (es. long non-coding RNA, rRNA,

tRNA…), questi RNA funzionali presentano strutture secondarie che permettono loro di interagire

con il DNA e le proteine; un indicatore della presenza di un gene per RNA non codificante e’ la

costituzione di strutture a forcina abbastanza stabili con un minimo contenuto di CG, anche nel

caso di geni per RNA si possono individuare sequenze regolative, che sono diverse da quelle dei

geni codificanti proteine, l’analisi di omologie di sequenza tra specie, oltre a permettere la

validazione di esoni la cui ORF non si e’ certi, serve ad assegnare funzioni ad un gene appena

scoperto, nei genomi compatti bisogna fare molta attenzione al DNA che rimane dopo un’estensiva

ricerca e individuazione dei geni codificanti: gli “spazi vuoti” sono spesso occupati da geni per

RNA, tra le specie codificanti per RNA funzionali non sono comparabili tra le varie specie, la

sintenia e’ la conservazione dell’ordine dei geni anche in specie diverse le cui somiglianze

risiedono maggiormente in zone intrageniche che intergeniche, le famiglie geniche si sono formate

grazie alla duplicazione genica (es. emoglobina in 800000000 di anni fa), l’analisi di geni viene

fatta con la formazione di mutanti come il lievito: il saccharomyces pombe, si divide per fissione (la

cellula si allunga fino ad arrivare a una lunghezza critica della replicazione del DNA che permette

la separazione delle due cellule figlie), e saccharomyces cerevisiae gemmante che vengono

utilizzati per studiare il ciclo cellulare attraverso mutazioni temperatura sensibile, all’innalzamento

della temperatura tali cellule si fermano nello stadio del ciclo in cui si trovavano a causa di

mutazioni essenziali per il folding naturale delle proteine, e in base allo stadio in cui sono stati

fermati, i geni che sono maggiormente espressi in quegli stadi saranno mutati, il C. elegans sono

stati studiati per l’apoptosi (durante lo sviluppo puo’ arrivare a 1090 cellule, ma il verme maturo ne

manda in apoptosi 131 cellule), studio su mutanti antiapoptotici con 1090 cellule e con essi si sono

riusciti a scoprire meccanismi proapoptotici dell’uomo, un esperimento in cui sono stati incrociati

topi sordi con topi wild type, si e’ identificata una regione deleta del cromosoma 17 necessaria per

il sistema vestibolare, in seguito e’ stato tolto il gene mutato dalla blastocisti e immesso in un BAC,

formando un transgene in un ovulo ospite, fin quando non si trovava un topo in cui e’ stata

complementata la mutazione, e’ stata trovata poi lo stesso locus nell’uomo sul braccio corto del

cromosoma 11, i geni reporter possono essere utilizzati per localizzare dove e quando i geni

vengono espressi (organi o tessuti specifici, particolari momenti dello sviluppo) e consentono di

analizzate l’espressione del gene in modo semplice, idealmente tramite un esame visivo con

cellule che diventano blu (con lacZ) o fluorescenti (con la GFP, un’acquaporina delle meduse con

una particolare struttura tridimensionale, la cui sequenza puo’ essere messa a valle del

promotore). In media ogni 2000 bp sono presenti i microsatelliti o STR (short tandem repeat),

alcune triplette ripetute inserite in regioni codificanti (assumendo strutture tridimensionali con la

successione di glutamine molto spesso) e in regioni regolative, quando sono presenti in un allele,

quando raggiunge uno stretch troppo lungo si puo’ definire allele patologico (espansione allelica),

l’espansione oltre una determinata soglia puo’ influire sull’espressione genica e sulla stabilita’ del

mRNA causando l’insorgenza di sintomi clinici, i loci coinvolti nella mutazione dinamica sono

sottoposti a un elevato polimorfismo ma il numero di ripetizioni si mantiene entro un certo limite;

per un evento mutazionale iniziale la sequenza si puo’ espandere introducendo nella popolazione

un nuovo allele non ancora patologico, poiche’ asintomatico (allele pre-mutato), percio’ possiamo

definire delle mutazioni dinamiche creando un paradosso della genetica classica che considerava

le mutazioni come eventi che modificano i geni con l’introduzione di un nuovo allele che viene

trasmesso invariato, probabile spiegazione di quest’espansione e’ il modello dello slippage: mentre

la polimerasi replica il DNA, parte dei nucleotidi precedentemente sintetizzati si appaiano formando

strutture a forcina che fanno slittare il 3’ in zone che sono gia’ state replicate provocando

un’espansione e una delezione alla replicazione successiva, anticipazione genica: espressione del

fenotipo che viene preventivata la patologia alla generazione successiva, come conseguenza

dell’instabilita’ introdotta dalla mutazione dinamica, che portera’ all’espansione delle ripetizioni, la

gravita’ e la precocita’ dei sintomi (direttamente proporzionali al numero di triplette) tendono ad

aumentare nelle generazioni successive, un individuo ereditario di questa mutazione espande la

sua predisposizione alla mutazione dalle cellule germinali, soprattutto in quelle maschili in continua

proliferazione, ogni spermatozoo contiene una forma diversa dell’allele espanso (instabilita’

meiotica), alle cellule somatiche (instabilita’ post-zigotica), quest’ultimi individui sono dei mosaici,

distrofia miotonica (e’ causata sall’espansione di ripetizioni di CTG nella regione 3’ non tradotta del

gene DMPK sul cromosoma 19q13.3 codifica per una miosin kinasi espressa nei muscoli

scheletrici, la tripletta risulta espansa), sindrome dell’X fragile e atassie spino-cerebellari, le

malattie a decorso progressivo causano una degenerazione a livello nervoso e sono caratterizzate

con un carattere autosomico dominante, in malattie neurodegenerative ripetizioni di CAG in regioni

tradotte che codificano per poliglutammina, che porta alla formazione di eccessivi foglietti beta che

rendono idrofiliche le proteine e porta a un’aggregazione eccessiva che provoca la precipitazione

di tali proteine e la conseguente morte cellulare (con acquisizione di funzione), nella corea di

Huntington si rileva una mutazione nel gene codificante la huntingtina con l’espanzione di

sequenze poli-CAG: essa ha la funzione di controllare la produzione del fattore BDNF, una

neurotrofina fondamentale per la sopravvivenza dei neuroni striatali; l’acquisizione di funzione

porta alla mancanza di nutrimento allo striato e alla morte delle cellule produttrici per tossicita’

d’accumulo, mentre malattie non degenerative ripetizioni CGG, CTG, GAA in regioni trascritte e

non tradotte, soprattutto in sequenze regolative alterando, probabilmente, l’espressione del gene in

questione

Evoluzione dei genomi

Il meccanismo della duplicazione e’ il piu’ importante poiche’ una volta duplicato il gene, una delle

due copie acquista la liberta’ di mutare e di specializzarsi per svolgere una funzione diversa, un

ciclo che ha impiegato milioni di anni, e puo’ evolvere in due direzioni: un gene funzionante che

puo’ duplicarsi nuovamente oppure uno pseudogene, la genomica comparata ci permette di

ricostruire i prodotti dell’evoluzione, noi abbiamo perso la capacita’ di sintetizzare la vitamina C a

causa di una data distribuzione filogenetica di questa capacita’ nei mammiferi (dovuta alla

formazione dello pseudogene L-gulonolattone ossidasi, GULO, nell’uomo sono presenti solo 5 dei

12 esoni primitivi di questo, inoltre presenta molti codoni di stop e mutazioni puntiformi), ogni

organismo, quindi, contiene un set diverso di pseudogeni, l’emoglobina e’ data da una famiglia

genica il cui ancestore da una sola catena data da un unico gene e’ stato duplicato, geni globina

alfa sono 2 (cromosoma 16) e globine beta sono vari (cromosoma 11), tutti questi geni hanno 3

esoni e 2 introni, alfa1 e alfa2 duplicazione recente (nessun aa diverso), gamma G gamma A

duplicazione recente, beta e delta piu’ remota 10 aa di differenza, delta destinato a diventare un

gene non funzionale in quanto, in primati come le scimmie, che stanno percorrendo una vita

genomica parallela alla nostra, e’ gia’ diventato un gene non funzionale, i gruppi genici della

globina alfa e beta si trovano su cromosomi separati nei mammiferi e negli uccelli ma rimangono

sullo stesso cromosoma nello Xenopus, il crossing over ineguale e’ dovuto alle sequenze ripetute,

in tutti i casi la ricombinazione avviene tra due copie di brevi sequenze ripetute e porta alla

duplicazione della sequenza tra le ripetizioni, crossing over diseguale tra cromatidi di cromosomi

omologhi, o scambio diseguale tra cromatidi dello stesso cromosoma, scambio tra due doppie

eliche figlie appena sintetizzate (nella replicazione del genoma a livello della forca di replicazione

che puo’ riconoscere sequenze omologhe dopo aver tagliato il filamento per essere duplicato), la

duplicazione puo’ avvenire anche per retrotrasposizione: un mRNA maturo puo’ essere

retrotrascritto e reinserito nel genoma a valle del promotore (retrogene privo d’introni), viene

retrotrascritto un RNA frutto di una trascrizione del filamento di DNA non coding (RNA antisenso),

se il retrotrascritto, non trascrivibile, viene reinserito nel genoma puo’ dare origine a un retrogene

con introni, c’e’ stata anche la duplicazione di un intero genoma (autopoliploidizzazione): quando

due gameti diploidi si fondono danno origine ad un autopoliploide, gli autopoliploidi, a differenza

della maggior parte dei trisomici, possono essere vitali ma, non da progenie vitale, anche negli

uomini si puo’ assistere a una triploidizzazione a causa di errori di fecondazione che portano

all’entrata di due spermatozoi nell’uomo, autopoliploidia e’ un meccanismo di speciazione, puo’

esistere una sintenia intragenomica che porta all’omologia di geni in cromosomi diversi dello

stesso organismo e presenti su posizioni nei rispettivi cromosomi comparabili, questo sta a

significare il genoma umano contiene cosi’ tanti duplicati di geni che si presume sia avvenuto un

evento di duplicazione dell’intero genoma almeno 350-650 milioni di anni fa, la speciazione implica

anche il riarrangiamento cromosomico e dei geni esistenti, possono duplicarsi non solo geni interi

ma anche parti di geni (soprattutto esoni), rimescolamento esonico

Capitolo 9

Per studiare il DNA bisogna munirsi di macchinari in grado di frammentare tale sostanza per

ottenere un’analisi ben accurata del genoma: a tal proposito vengono utilizzati gli enzimi di

restrizione, presenti nei batteri, in grado di tagliare sequenze specifiche nel genoma; i frammenti

cosi’ “digeriti” vengono detti frammenti di restrizione. Sono utilizzati in questi organismi come

difesa da acidi nucleici virali e la loro azione viene raggirata dai batteri attraverso meccanismi

complessi di riconoscimento: i nucleotidi specifici probabili bersagli di queste proteine sono

sottoposti a una metilazione preventiva. La digestione puo’ avvenire secondo una simmetria

palindroma delle sequenze tagliate, producendo delle estremita’ nette oppure in modo sfalsato

creando due estremita’ sporgenti dette estremita’ coesive, perche’ libere di appaiarsi con

sequenze complementari. Assumendo che ognuna delle 4 basi e’ presente nelle stesse proporzioni

nel genoma e che siano distribuite in modo casuale nel genoma allora tali enzimi taglierano in

media 4^n sequenze di riconoscimento, per n definito come il numero di basi presenti nel

frammento di restrizione; più è lungo il sito di riconoscimento, minore è il numero di frammenti di

digestione. Se si espone il DNA a un tempo sufficiente a un dato enzima si avra’ infine una

digestione completa che puo’ essere parzializzata o diminuendo la concentrazione dell’enzima in

soluzione o accorciando il tempo di esposizione del DNA oppure offrendo al taglio parte del

genoma in esame.

Per distinguere i diversi frammenti si usa l’elettroforesi su gel: l’elettroforesi e’ il movimento delle

cariche in un campo elettrico. Si inserisce una soluzione di molecole di DNA all’interno di pozzetti

che si trovano a un’estremita’ di un supporto gelatinoso d’agarosio, riversandolo poi in una

soluzione tampone a cui si applica una differenza di potenziale ai poli che permette la migrazione

delle molecole cariche, attraverso i pori che forma il gel, verso l’elettrodo di carica opposta (il DNA

e’ attratto dall’elettrodo positivo). La velocita’ con cui si muovono le molecole di DNA e’ data:

dall’intensita’ del campo elettrico applicata, che risulta costante in tutto il pozzetto, dalla

composizione del gel, dalla densita’ di carica delle molecole, uguale per tutte le molecole in

esame, e dalla loro grandezza, che costituisce l’unica variabile. Percio’ maggiore e’ il volume

occupato da una molecola, minore e’ la probabilita’ che riesca a trovare nella matrice un poro

abbastanza grande per passarci attraverso e percio’ minore e’ la velocita’ di migrazione.

Completata l’elettroforesi, il gel viene incubato con un colorante, il bromuro d’etidio, che viene

lavato l’eccesso a operazione conclusa e,

infine, si sottopone l’estratto alla luce

ultravioletta che fara’ emergere i diversi

frammenti in posizioni differenti in base

alla loro velocita’ di migrazione. Allo

stesso modo possono essere frazionate le

proteine, immerse pero’ in un gel di

poliacrilammide, con pori piu’ piccoli, e

includendo un detergente acido, il sodio

dodecil solfato (SDS), che si lega alle

regioni idrofobiche per compromettere il

legame con altre proteine; inoltre si

aggiunge anche il riducente

mercaptoetanolo per scindere i legami

disolfuro. Per identificare le proteine nel

gel si espongono a un anticorpo specifico

accoppiato a un fluorocromo, un enzima facilmente rilevabile o un isotopo radioattivo e si

inseriscono su un foglio di nitrocellulosa (Western blot).

Gli enzimi di restrizione possono essere utilizzati per costruire delle mappe genetiche, chiamate

mappe di restrizione, grazie all’elettroforesi e in base alla grandezza dei campioni digeriti

possiamo avere una generica disposizione dei geni in esame; una mutazione associata a una

malattia puo’ pero’ provocare un’alterazione nel pannello di restrizione originario diagnosticando

l’insorgenza di un genotipo patologico. Per analizzare genomi piu’ grandi, come quelli animali, si

necessita l’amplificazione e la purificazione dei frammenti da analizzare attraverso due tecniche

principali: il clonaggio e la PCR.

Il clonaggio consiste nella replicazione e purificazione naturali di un dato segmento nucleotidico

che viene inserito in una gamma di trasportatori chiamati vettori, sequenze di DNA in grado di

accettare materiale genetico esogeno e di essere trasportate nella cellula bersaglio; il DNA

ricombinante puo’ essere creato inserendo il potenziale vettore in una soluzione di enzimi di

restrizione e una ligasi. I plasmidi costituiscono una classe di vettori molto utili per le

sperimentazioni in quanto il suo contenuto di resistenza a un antibiotico denota un buon

marcatore di selezione che permette ai ricercatori di isolare gli organismi in esame, ma possono

ospitare sequenze molto piccole. I genomi virali, come quello del fago lambda, possono essere

utilizzati per infettare una cellula dal DNA ricombinante all’interno del fago: il suo DNA contiene il

gene da replicare attorniato dai geni essenziali per la per la formazione delle particelle all’interno

del bersaglio. Queste particelle si

riproducono molto frequentemente

portando a infettare nuove cellule e in

questo modo replicando non solo i suoi

geni ma anche il gene esogeno. I

cromosomi artificiali (BAC) sono

molecole ricombinanti formate da elementi

nucleotidici per la replicazione e la

segregazione e l’inserto di DNA, anche di

dimensioni molto elevate. Tali vettori, in

seguito, possono essere addizionati negli

organismi bersaglio attraverso

trasformazione, elettroporazione o, nel caso di E.Coli, sospensione delle cellule in cloruro di calcio

freddo. In E.Coli, solitamente, una volta selezionati i batteri con i plasmidi, per verificare che i

plasmidi contengono realmente l’inserto, il gene viene aggiunto in mezzo al gene lacZ che quando

reagisce con il substrato X-Gal produce un caratteristico colore blu alla parete dell’organismo.

Questa proprietà visiva permette ai ricercatori di dedurre l’assenza di colore nei Coli con i plasmidi

ricombinanti. Per separare i plasmidi dai cromosomi, si lisano, dapprima, le cellule estraendone il

DNA che viene trattato con bromuro d’etidio; i plasmidi raggiungeranno prima la saturazione col

colorante rispetto ai cromosomi, più lunghi, e, in seguito alla centrifugazione in soluzione di cloruro

di cesio, i plasmidi avranno una densità minore e stratificano in provetta più in alto. I vettori

vengono poi digeriti dagli stessi enzimi riconoscenti le stesse sequenze nucleotidiche da clonare e

il tutto sottoposto a elettroforesi dove verranno separati i vettori dagli inserti clonati.

Le genoteche sono raccolte di frammenti di DNA clonato che rappresentano l’archivio di tutti i geni

e possono essere prelevate per eventuali esperimenti senza procedere con la lunga operazione

discussa precedentemente. Dato che nella realta’ si e’ lontani dal raggiungere un efficienza del

100% nella costituzione di genoteche con un numero di geni pari a tutto il genoma, si

sottopongono piu’ organismi campione alla digestione del DNA da parte di uno specifico enzima in

modo da avere almeno una copia per ogni gene superando l’equivalente genomico, il numero di

cloni in una genoteca perfetta (un numero maggiore di 20000 cloni se si taglia il genoma in

frammenti di restrizione da 150 kb su 300 Mb). Si utilizza, spesso, il subclonaggio: a partire da un

vettore BAC clonato viene fatto digerire da enzimi specifici e i frammenti cosi’ ottenuti clonati

nuovamente, oppure infettiamo i BAC clonati con un vettore lambda per poi subclonare i frammenti

e inserirli nei plasmidi. Dato che la maggior parte del genoma e’ costituito da introni, possiamo

restringere il campo alla ricerca di sequenze esoniche con genoteche a cDNA, sequenze copiate

dai trascritti di RNA attraverso le trascrittasi inverse, funzionante anche da trascrittasi DNA-

dipendente, impiegando l’azione di retrovirus. In una preparazione di mRNA, una volta inserite le

trascrittasi, esse hanno bisogno di un primer: si aggiunge alla soluzione degli oligo-dT primer in

grado di legarsi alla coda poli-A dei messaggeri da cui le trascrittasi inizieranno la trascrizione;

vengono denaturati gli ibridi DNA-RNA con l’esposizione a temperature elevate e gli mRNA

vengono trattati con RNAsi. Molti dei cDNA formati formeranno delle strutture a forcina (hairping-

loop) dovute da appaiamenti di sequenze omologhe nel trascritto che serviranno da primer per la

trascrizione del secondo filamento; a partire da questo DNA neo-sintetizzato, con l’utilizzo di enzimi

di restrizione e ligasi si inserisce lo stampo in un vettore.

Attraverso l’uso di vettori d’espressione, come i DNA plasmidici, costituiscono un ottimo metodo

d’analisi: un vettore avente promotore e sequenze di regolazione riconosciute dall’apparato

regolativo della cellula ospite. A partire da un plasmide di E.Coli, l’organismo ospite, si inserisce

all’interno del vettore il gene da clonare, senza introni, (es. insulina) di modo che possa essere

prodotto normalmente con l’apparato trascrizionale del batterio e venga sintetizzato in larga copia.

Dato che l’ambiente citoplasmatico dei batteri non e’ compatibile con i processi di ripiegamento

eucariotici (in quanto i geni batterici non presentano introni che permettono lo splicing), tale

proteina non funzionale deve essere in seguito somministrata a un organismo eucariotico evoluto,

come un mammifero (troppo costoso) o a una cellula di lievito (a meta’ per resa e funzionalita’). In

seguito le cellule vengono sottoposte all’azione di anticorpi per la proteina legati con fluorocromo

per individuare la presenza della proteina clonata. In questo modo e’ possibile cotruire una

genoteca di vettori d’espressione. Oppure possiamo inserire un cDNA in un plasmide in modo da

avere facilmente la proteina senza essere sottoposta a splicing: questi inserti, in base al gene

d’interesse, possono essere raccolti attraverso l’uso di anticorpi specifici. Una volta piastrate

colonie batteriche, che contengono cloni di una genoteca, in un terreno selettivo con antibiotico,

quest’ultime vengono conservate e fatte crescere in un microtitier, un piattino con diverse fossette

dove si incanalano le cellule, e in seguito stampate su una membrana filtrante e fatte crescere su

terreno, permettendo la produzione del prodotto proteico del cDNA inserito. Il filtro viene tolto e le

cellule vengono lisate in situ mentre il prodotto rimane attaccato al filtro; viene poi sottoposto

all’azione di un anticorpo radioattivo che si lega alla proteina e si lavano via le sonde in eccesso.

Infine viene fatta un’autoradiografia del filtro per localizzare il clone d’interesse. La necessita’ per

identificare un dato clone risiede prevalentemente nella: comprensione della fase di sviluppo o il

tessuto in cui e’ espresso quel dato clone, lo studio dei vari processamenti a cui e’ sottoposto

(splicing alternativo e/o tessuto specifici), la produzione di una proteina d’interesse terapeutico,

oppure utilizzarlo come sonda in grado di appaiarsi con il gene in una banca genomica della

stessa specie (sonda omologa) o di specie diverse (sonda eterologa).

Per pescare una data sequenza da studiare da una genoteca si utilizza la tecnica dell’ibridazione:

si denaturano le molecole con NaOH per promuovere il distaccamento delle basi appaiate tra di

loro naturalmente per permettere di appaiarsi con la regione complementare in questione al DNA

sonda, come accennato precedentemente, inserito (prodotto, solitamente da un sintetizzatore

automatizzato di DNA che forma piccoli oligonucleotidi, oppure si costruisce la sequenza a partire

da una sequenza polipeptidica nota, traduzione inversa); in seguito si lavano dalla piastra le sonde

in eccesso e su una pellicola a raggi X (autoradiografia) si puo’ notare la presenza delle sonde

immesse grazie alla loro radioattivita’ (sonde calde) o alla loro fluorescenza. Oppure si possono

marcare le sonde con biotina o vitamina H, che si lega alle basi, e digossigenina, uno steroide

vegetale che modifica i nucleotidi pirimidinici, associati a fluorocromi o enzimi con attivita’ visibili: la

biotina di queste sonde fredde si lega, a sua volta, ad alta affinita’ con la streptavidina e la

digossigenina con l’anticorpo specifico. Gli ibridi si formeranno solo se la complementarieta’ delle

basi e’ maggiore dell’80%; gli ibridi imperfetti sono meno stabili, ma i genetisti possono servirsi di

questa’ proprieta’ per verificare la similarita’ tra le molecole di diversa provenienza (ad esempio in

specie diverse).

Il Southern blot, attraverso l’utilizzo dell’elettroforesi su gel e l’ibridazione, permette di partire da

una miscela molto complessa e di scovare quel piccolo numero di frammenti che sono correlati al

clone originario. Partendo da un genoma tagliato con un enzima, per elettroforesi si isolano, su un

gel di agarosio, una striscia di frammenti della molecola in esame per poi trasferirli su una piastra e

marcarli con una sonda. Questo metodo d’analisi dei campioni permette di fare diagnosi

molecolare di malattia. Quando il gene d’origine della patologia in questione non e’ conosciuto

bisogna ricostruire un pattern polimorfico delle sequenze di restrizione usando l’analisi del

polimorfismo di lunghezza dei frammenti di restrizione (RFLP). Questo metodo consiste

nell’individuazione di questi siti la cui localizzazione è stimata nei pressi di un allele patologico e

permangono invariati nei pazienti affetti: infatti, sono strettamente associati al gene della malattia

sul cromosoma e la probabilità che avvenga un crossing over tra il gene patologico e questi risulta

quasi nulla. Di conseguenza Il procedimento usato viene suddiviso in 3 tappe principali

concernenti: lo studio di sequenze non codificanti adiacenti al gene, la digestione enzimatica del

genotipo malato e il confronto con individui sani per quel gene.

Un secondo modo per ottenere cloni molecolari e’ l’utilizzo

della reazione a catena della polimerasi (PCR), un metodo

molto piu’ efficiente e pratico rispetto al clonaggio: in questa

operazione e’ richiesta la capacita’ di una particolare

polimerasi presente nei batteri acquatici, Taq polimerasi, che

resiste alle alte temperature e polimerizza anche in condizioni

restrittive. Si inserisce il DNA duplex (DNA target) da clonare

in una soluzione che viene portata a una temperatura elevata

in grado di compromettere gli appaiamenti tra le basi e

costruire cosi’ i primer per le polimerasi. Una volta abbassata

la temperatura per

dare tempo alle

polimerasi di

poggiarsi sullo stampo, tali filamenti vengono sintetizzati

dalla polimerasi rialzando la temperatura, per poi

continuare il ciclo.

Per il sequenziamento del genoma fu utilizzato per primo

il metodo Sanger dei didesossinucleotidi: questi

particolari nucleotidi presentano un 3’H e non OH di modo

che una volta la polimerasi li incorpora sul DNA, essa

ferma la replicazione non disponendo di un OH per

formare il legame fosfodiesterico; cio’ permette di formare

molecole di grandezza differente in base al punto dove il

nucleotide viene incorporato. Si usano 4 provette con il

DNA da sequenziare che verra’ riempita ognuna da un

ddNT diverso (ddTTP, ddATP, ddGTP, ddCTP). Poi si

denaturano le molecole polimerizzate dagli stampi e si

sottopongono all’elettroforesi ciascuna soluzione su un

gel di poliacrilammide che separa le molecole per

grandezza. Si confrontano i risultati ottenuti ottenendo un sequenziamento base per base

dell’acido nucleico.

Per sequenziare grandi inserti di genoma sono stati utilizzati due approcci: metodo shotgun (si

frammenta il genoma in piccole unita’ sequenziabili, con enzimi, ultrasuoni o raggi X, e si affida ad

algoritmi del computer la ricostruzione dell’ordine dei frammenti ed eventuali buchi nella sequenza

potranno essere colmati con il secondo metodo) e sequenziamento gerarchico o primer

walking. Il primo passaggio e’ quello di costruire un sentiero principale che serva ad assicurarsi

che la sequenza sia ottenuta in grandi pezzi ordinati tra di loro (tramite precedente mappatura) e

attraverso una polimerasi che riconosce il primer dell’inserto costruito e passa alla replicazione di

uno dei filamenti del vettore. L’importanza dei progetti genomici e’ stata rilevante sotto diversi punti

di vista: grazie ad essi e’ stato possibile descrivere ogni singolo gene di un dato genoma (anche di

funzione ignota), identificare regioni regolative fondamentali per l’espressione genica, lo studio di

geni isolati (ad esempio responsabili di malattie ereditarie o codificanti prodotti proteici di rilevanza

industriale), individuare funzionalita’ singolari riguardanti regioni di DNA non codificante attraverso

la genomica comparata. Con una compresione sempre piu’ ampia del genoma e dei sui

meccanismi intrinseci di ereditarieta’ e di regolazione, abbiamo avuto modo di sviluppare metodi

innovativi e tecnologici per analizzare questo tipo d’informazione e applicarli per: diagnosi

molecolare di malattie rare e di origine dapprima sconosciuta, esposta precedentemente,

individuare una determinata predisposizione genetica per una malattia (ad esempio il cancro), la

creazione di farmaci specifici basati sul profilo genetico del paziente per definire terapie geniche

specifiche per ogni paziente e per creare farmaci fondati su informazioni molecolari.

Capitolo 10

Per sequenziare l’intero genoma non bastano solamente le tecniche esposte precedentemente in

quanto su un genoma di circa 3000000000 di bp ne riusciamo a sequenziare 600 bp alla volta e

inoltre l’errore di sequenziamento e’ dell’1% e da questi errori possono uscir fuori anche dei

polimorfismi che nel genoma si presentano uno ogni 500 bp. Ancor maggiore e’ la difficolta’ di

decifrazione delle sequenze ripetute, che possono essere poche basi o assetti cromosomici ripetuti

a tandem o dispersi nel genoma che possono divergere con il tempo; un ulteriore dilemma lo

costituisce l’eterocromatina che non e’ clonabile e rappresenta piu’ del 30% del genoma e contiene

pochi geni. La strategia utilizzata per far fronte a tali problemi e’ detta “divide et impera”: si e’ soliti

frammentare i cromosomi in piccoli pezzi parzialmente sovrapposti per poi essere clonati e dopo

aver sequenziato 1000 bp ad ambedue le estremita’, i cloni con le estremita’ sovrapposte vengono

allineati per costruire il costrutto cromosomico originale. Per ridurre il tasso d’errore ciascuna

sequenza deve essere sequenziata da cloni indipendenti (solitamente se ne sequenziano 10, per

ridurre il tasso a 1/10000, tecnica denominata copertura decupla della sequenza). Vengono

utilizzati 3 metodi differenti per la mappatura: mappe d’associazione, fisiche o di sequenza. La

mappatura di associazione ti permette, attraverso gli incroci, di stabilire la posizione dei vari geni

sul cromosoma e stabilire quali dei geni presi in esame sono associati o su due cromosomi diversi;

questo tipo di mappatura pero’ presenta alcune limitazioni in quanto, essendo una costruzione

basata sul fenotipo, il numero dei marcatori fenotipici e’ molto minore rispetto ai geni totali. Inoltre

un singolo fenotipo può essere determinato dall’azione di piu’ geni. Il genoma umano contiene

milioni di polimorfismi che vengono utilizzati per le mappature su larga scala come marcatori e

possono presentarsi come: polimorfismi di singoli nucleotidi (SNP), che costituiscono il 90%

delle variazioni genetiche individuali, e sequenze semplici ripetute (SSR) o microsatellite, con

tendenza ad espandersi e contrarsi durante la replicazione. Possono risiedere all’interno di un

gene e causare danni alla sua funzione oppure in posizione intergenica e sembrano avere leggeri

effetti sul fenotipo degli eucarioti. 60000 SNPs si trovano all’interno di regioni geniche e hanno un

impatto sulla loro attivita’ determinando quelle differenze che rendono ognuno di noi un organismo

unico. Quelli che non si trovano in sequenze codificanti possono avere conseguenze sullo splicing

o sul legame di fattori di trascrizione e influenzare l’espressione genica. Esse possono costituire

sonde d’ibridazione per sequenze in una genoteca. Geni omologhi si definiscono come geni simili

in specie diverse correlabili in termini evolutivi; si presentano in due forme: geni ortologhi, ovvero

geni simili derivati da un antenato comune, o paraloghi, originati dalla duplicazione di un gene

all’interno della stessa specie, spesso sullo stesso cromosoma, formando famiglie multigeniche.

Con le mappe fisiche riusciamo a definire quante basi separano un locus da quello adiacente nel

cromosoma. Per mappature ad ampio raggio vengono, preferibilmente, utilizzati come vettori dei

BAC e per la localizzazion degli inserti si usa o un approccio dall’alto (top-down) o dal basso

(bottom-up). I siti di sequenze-etichetta (STS) sono brevi sequenze facilmente localizzate e e

amplificate per PCR che definiscono posizioni uniche nel genoma. Ogni cromosoma colorato con

Giemsa mostrano in metafase un bandeggio caratteristico, costituito da bande chiare, ricche di AT

e povere di geni, e bande scure, ricche di GC e di geni, comune negli omologhi. L’ibridazione in

situ (FISH) permette la caratterizzazione del cariotipo e la mappatura di una qualsiasi sequenza

clonata in uno specifico sito del cromosoma. Una singola sonda viene marcata con una molecola

fluorescente e ibridata sui cromosomi, cosi’ il sito d’ibridazione appare al microscopio come un

punto luminoso che indica la localizzazione della sonda; ogni clone apparterrà a un singolo

cromosoma colorando ogni cromosoma secondo un colore distintivo in base al tipo di fluorocromo

utilizzato. Questo approccio top-down si applica secondo la seguente procedura: si lasciano

cadere delle goccie di una sospensione di cellule in metafase su un vetrino, il cui contatto porta

all’esplosione delle cellule e alla dispersione del cariotipo di ogni cellula; in seguito i cromosomi

vengono fissati e viene denaturato blandamente il loro DNA con una base, in modo da conservare

la struttura cromosomica. Si marca in seguito la sonda con un colorante fluorescente, la si

aggiunge sul vetrino e si lascia incubare e, a fine operazione, si lava via la sonda non ibridata. Si

puo’ osservare infine il preparato con un microscopio a fluorescenza che irradia i cromosomi con

lunghezze d’onda selezionate. Questa tecnica e’ molto piu’ vantaggiosa dell’analisi del linkage in

quanto con questa tutti i cloni possono essere mappati, al contrario la mappa d’associazione

mappa solo i cloni con polimorfismi; i ricercatori possono effettuare con la FISH un’analisi per ogni

locus clonato singolarmente, mentre la mappa d’associazione richiede l’analisi di un locus in

relazione all’altro; inoltre, per la prima si ha bisogno di una goccia di cellule su

un vetrino, mentre per la secodna si necessita di un’analisi genotipica da una

grande corte di individui. Con questa abbiamo anche riscontri diretti con

aberrazioni cromosomiche dei loci clonati. la FISH

, però, presenta un potere di

risoluzione molto piu’ basso rispetto alla mappa d’associazione (possiamo infatti

analizzare materiale di 4-8 cM, contrariamente alla mappa d’associazione che

analizza locus distanti a frazioni di cM).

Dato un cromosoma, con marcatori distanti a non piu’ di 1 cM, e alcuni cloni che utilizzano i

marcatori come sonde d’ibridazione, si analizzano sul cromosoma i siti

di restrizione di tali cloni, piu’ lunghi delle sequenze ibridate, e la

localizzazione dei geni, si creano in seguito delle mappe di cloni

genomici che si sovrappongono e si combina l’informazione derivante

dai cloni in una singola mappa fisica continua che si estende per tutta

la lunghezza del cromosoma. I marcatori che mappano uno vicino

all’altro sono utili per analizzare una genoteca YAC e recuperare cloni

genomici usando come sonda le estremita’ dei loro frammenti; tali cloni

parzialmente sovrapposti l’un l’altro e costituenti una regione genomica

formano un contig. I marcatori si trovano approssimativamente 0,5 cM

(500 kb nel genoma umano) l’uno all’altro; dato che ciascun YAC nella

genoteca porta un inserto di circa 1 Mb, c’e’ una buona probabilita’ che

il clone YAC individuato con un

marcatore si sovrapponga a un

clone YAC identificato nella stessa genoteca. Utilizzando un

marcatore M1 e M2 come sonde, si analizza il loro livello

d’ibridazione; se le sonde si ibridano allora appartengono alla

stessa regione cromosomica, al contrario si ibrida M1 con un

ulteriore marcatore. Si isola poi, in caso di appaiamento,

l’estremita’ del frammento M1 e si sottopone il clone con M1

e l’estremita’ ibridata ad elettroforesi preceduta dalla

digestione enzimatica per identificare i siti di restrizione

coinvolti nell’appaiamento. Una volta ripetuto questo

prcedimento piu’ volte ottenendo vari contig, possono presentarsi delle interruzioni tra i cloni, a

causa dello spazio piuttosto variabile tra un marcatore all’altro, che non permettono di mappare

quell’intervallo: per far fronte al problema si possono utilizzare piccoli frammenti ottenuti dalle

estremita’ dei contig come sonde per analizzare nuovamente la genoteca YAC allo scopo di

trovare uno o piu’ cloni che possano collegare le interruzioni (chromosome walking).

Possiamo anche costruire una mappa genomica con sole tecniche fisiche creando una genoteca di

cosmidi contenenti singoli cloni che coprono l’intero genoma d’interesse e vengono esaminati

grazie al loro pattern di restrizione o impronta genetica (DNA fingerprint). In seguito, verra’

usato il computer per ricercare sovrapposizioni tra i fingerprint per utilizzarle per organizzare i

cosmidi in 24 contig cromosomali (bottom-up); in questo modo le interruzioni vengono colmate

grazie alla sovrapposizione dei contig cromosomali.

Gli inserti clonati sovrapposti possono essere identificati grazie anche a tecniche richiedenti STS:

identificata una sequenza nel genoma, si legano alle estremita’ dei primer sintetizzati per poi

amplificarla e costituire cosi’ un STS. Le STS possono essere polimorfiche, indirizzate a un unico

cromosoma, possono provenire da estremita’ di inserti clonati, da sequenze genomiche generate

casualmente, da cloni di cDNA, o da SSR o SNP. Si puo’ saggiare una STS usando le sue coppie

di primer per esperimenti di PCR su diversi cloni BAC, identificando cosi’ tutti i cloni contenenti la

sequenza STS, e dato che la sequenza e’ unica, ogni clone sara’ sovrapponibile. Ripetendo il

processo piu’ volte e utilizzando come marcatori SSR e SNP, si riesce a costruire una mappa fisica

altamente attendibile anche con l’aiuto del subclonaggio, la mappatura di restrizione, l’ibridazione e

il computer.

Le mappe di sequenza sono quelle a piu’ alta risoluzione e vengono plasmate attraverso due

strategie principali: approccio per shotgun gerarchici (utilizzati dalla Celera Genomics ) e

dell’intero genoma (usati dal HGP o Progetto Genoma Umano ) .

La prima strategia consiste nel generare una genoteca BAC (o PAC, che deriva da cloni del

genoma del fago P1), si sviluppa in seguito una mappa di cloni BAC sovrapposti e infine si

seleziona un pannello di cloni BAC che si sovrappongono parzialmente (minimal tiling path) e

vengono sequenziati con la tecnica divide et impera. Per sequenziare i cloni si suddivide ciascun

BAC in frammenti di 2 kb (shotgun), si clonano in seguito in plasmidi e poi si sequenziano

entrambe le estremita’ di un numero sufficiente di inserti plasmidici per garantire una copertura

decupla di sequenza per l’assemblamento in un unico contig cromosomale. Un vantaggio di questo

tipo di approccio e’ la necessita’ di assemblare pochi inserti plasmidici (circa 1700 con un minimo

di 1000 plasmidi per BAC da 200 kb suddivisi in frammenti di 2 kb) e favorisce la ricostruzione di

mappe fisiche e genetiche ad alta risoluzione e permette a gruppi di lavoro di tutto il mondo di

formare consorzi e lavorare insieme senza rischiare di ripetere le stesse ricerche (in modo da

creare un gruppo di lavoro per ogni cromosoma). La Celera Genomics ha utilizzato per

l’assemblamento degli scaffolds sia i dati ottenuti dal consorzio pubblico che STS (ibrido tra

shotgun e strategia di mappatura-sequenziamento)

Il secondo approccio si sostanzia nel taglio triplo dell’intero genoma: il primo frammento serve per

costruire una genoteca plasmidica con inserti di circa 2 kb (copertura sestupla), il secondo taglio

per generare un’ulteriore genoteca plasmidica con inserti da 10 kb (copertura tripla) e con la terza

divisione si otterra’ una genoteca di cloni BAC con inserti di 200 kb (copertura singola) ottenendo

in totale una copertura decupla dell’intero genoma. Infine, tali sequenze verranno assemblate da

un software di una macchina computerizzata. Questa tecnica presenta diversi vantaggi: non

richiede la costruzione di una mappa fisica; raggira il problema delle sequenze ripetute, poiche’ le

sequenze terminali appaiate, da cloni con inserti di diverse misure, rendono possibile la risoluzione

di questi tipi di errori di appaiamento; infine, si affida solo al sequenziamento automatizzato del

DNA. Tutti i tipi di sequenziamento a larga scala sono limitati da due principali ostacoli: le

sequenze che non possono essere clonate (quelle appartenenti all’eterocromatina) e al

riarrangiamento o alla delezione di alcune sequenze in seguito alla clonazione (ad esempio le

sequenze ripetute in tandem).

Per identificare geni all’interno di sequenze cromosomiche si possono far appaiare sequenze-

etichetta espresse (EST), frammenti di sequenze di mRNA ottenute mediante sequenziamento di

cloni di librerie di cDNA selezionati randomicamente, o sequenze di cDNA, differenziando gli esoni

e gli introni. Data una sequenza nucleotidica con quadro di lettura aperto (ORF, open reading

frame) puo’ non essere cosi’ facile l’identificazione del gene: la lettura corretta sara’ data da una

sequenza priva di frequenti codoni di stop e, per i genomi piu’ semplici, solitamente, contano come

geni solo sequenze piu’ lunghe di 100 codoni; per i genomi complessi, con esoni di 150 nt in

media, e’ piu’ difficile, percio’ esistono programmi cibernetici gene-finding, come ASPIC, che

analizzano le caratteristiche specifiche dei geni ( siti di inizio e terminazione, giunzione

introne/esone, attraverso l’analisi delle regione GT dopo il taglio, regioni regolative al 5’ dei geni,

come siti di riconoscimento di fattori trascrizionali e isole CpG* e promotori …) e si avvalgono del

fatto che alcuni organismi prediligono l’uso di codoni per particolari aminoacidi (codon bias) e

riesce a ricostruire i possibili prodotti post-traduzionali di un gene.

Con la realizzazione del sequenziamento del genoma l’identificazione di geni simili nei vari

organismi e’ facilitata ed e’ proprio attraverso queste conoscenze che si sono definiti i geni

paraloghi e ortologhi, inoltre si e’ scoperto che i geni codificano per uno o piu’ domini proteici,

ovvero piu’ unita’ funzionali discrete e analogamente molti geni sono composti da regioni distinte

che codificano domini proteici discreti. Ogni gene, attraverso l’exon shuffling, l’addizione o la

delezione di esoni, puo’ esprimere differenti regioni codificanti i domini proteici. Infine, con il

sequenziamento si sono potuti identificare molti polimorfismi umani ed e’ stato possibile correlarli

alle predisposizioni alle malattie e ad altri aspetti fisiologici rilevanti. Sono state scoperte, in

seguito, della associazioni geniche in specie diverse, come l’uomo e il topo, testimonianze della

divergenza evolutiva; questi loci associati vengono detti blocchi sintenici e dentro ognuno di

questi blocchi umani si trova l’informazione utile per assemblare le sequenze omologhe di topo

corrispondenti e viceversa e sono state scoperti grazie all’utilizzo di sonde e primer per PCR, se la

sequenza dell’organismo a confronto non e’ conosciuta. Esistono famiglie geniche che sono tipiche

dei vertebrati e codificano per proteine attive per il sistema immune o in altri tipi di difesa e nel

sistema nervoso e c’e’ un incremento nella complessita’ del proteoma dal lievito all’uomo.

Le sequenze ripetute corrispondono a circa il 50% del genoma e si suddividono in 5 categorie

principali: ripetizioni intersperse, pseudogeni, semplici sequenze ripetute con multimeri,

duplicazioni di segmenti e blocchi di sequenze ripetute ai centromeri e telomeri e altre

caratteristiche strutture cromosomiche.

Le ripetizioni intersperse dipendono dal movimento dei trasposoni o TE che si suddividono in:

trasposoni a DNA, tratti di DNA escissi e reinseriti in altri punti del genoma e possono codificare

per enzimi trasposasi che li rendono autonomi nel processo di trascrizione e riescono a

riconoscere la localizzazione del gene originario per poi posizionarsi in una regione nuova, e

retrotrasposoni che derivano da trascritti di RNA copiati dalla trascrittasi inversa e integrati nel

genoma (trasposizione replicativa). I retrotrasposoni sono sequenze e tradotte in orf1 e 2 il cui

RNA poi rientra nel nucleo associato alle proteine a cui ha dato origine; data la capacita’

endonucleasica e di trascrittasi inversa di orf2, converte RNA in cDNA e lo reinserisce in una

nuova localizzazione (le attivita’ enzimatiche di orf2, appartenenti a questi elementi autonomi,

possono essere utilizzate anche da trasposoni che non codificano per essi, gli elementi non

autonomi).

Uno pseudogene convenzionale e’ un gene che e’ stato inattivato a causa di un accumulo di

mutazioni e non viene piu’ riconosciuto come tale, acquisendo l’appellativo di relitto evolutivo.

Sono stati riconosciuti diversi tipi di pseudogeni: duplicati e retrotrasposti; quelli duplicati sono

originati da un crossing-over ineguale che ha provocato una duplicazione del gene; lo pseudogene

processato o maturato o retrotrasposto deriva, invece, dall’mRNA di un gene su cui e’ stata

sintetizzata una copia di DNA e successivamente replicata e reinserita nel genoma (stesso o

diverso cromosoma), non contiene sequenze introniche e sequenze 5’-UTR che regolano

l’espressione di un gene (questo gene e’ inattivo).

L’organizzazione del genoma consta di differenti regioni: famiglie di geni strettamente correlati

possono essere raggruppati su uno stesso cromosoma o interdispersi nei vari cromosomi per

ragioni ancora a noi sconosciute e possono essere costituiti anche da pseudogeni. In alcune

regioni ricche in GC vi e’ un tasso maggiore di geni (la regione del HLA rappresenta la zona piu’

ricca di geni in tutto il genoma), ma anche regioni, ricche in AT, povere di geni: una spiegazione

plausibile a tale raggruppamento e’ che esse presentano geni di difficile identificazione. Esiste una

classe detta dei grandi geni che comprendono geni da 500 kb e il piu’ lungo consta di 2 Mb i cui

mRNA rappresentano l’1% del trascritto primario e poiche’ sono maturati molto lentamente, non

vengono completati in cellule a rapida divisione (sono espletati soprattutto nei neuroni).

Attraverso l’amplificazione combinatoria si possono costruire una molteplicita’ di segmenti genici

codificanti (es. geni per gli anticorpi), oppure diverse combinazioni introniche ed esoniche, grazie

allo splicing alternativo, possono portare alla formazione di piu’ prodotti all’interno dello stesso

gene. Per comprendere i livelli d’espressione genica nelle varie cellule i ricercatori si avvalgono

della conoscenza degli array di DNA, ovvero una grande collezione di frammenti di DNA disposti

in file ordinate su un supporto solido (il chip), costruiti o attraverso la sintesi di geni specifici su

questo supporto in punti specifici oppure depositano goccie di filamenti presintetizzati in spazi

precisi. Vengono poi ibridati da una miscela di cDNA o mRNA, marcati radioattivamente o con

fluorocromi, per analizzare la quantita’ di geni espressi. Esistono diversi tipi di array: i macroarray,

i cui componenti sono depositati su una membrana di nylon da una macchina che raccoglie i

frammenti immersi nell’agarosio dai micropozzetti dove sono stati immessi dopo il loro prelievo

dalla genoteca; i microarray, in cui i frammenti

amplificati per PCR vengono poggiati su un vetrino come

singole gocce (il livello di fluorescenza corrisponde al

livello di espressione del gene e permette di analizzare

due campioni di cDNA); gli array di oligonucleotidi, in

cui dei segmenti di 20-60 nt vengono deposti in

goccioline. Quest’ultimo tipo di analisi presenta alcuni

vantaggi rispetto alle prime due: sono in grado di rivelare

eventuali SNP dell’organismo in analisi e geni

strettamente correlati o prodotti di splicing alternativo del

mRNA e non necessita di una grossa genoteca di cDNA.

Per aumentare la densita’ degli oligonucleotidi, si usano

fibre ottiche di 1mm di diametro che presenta numerosi pozzetti per immetterci perline di

oligonucleotidi pronti per essere sondati. Con lo spettrometro di massa si possono misurare le

masse delle molecole in analisi secondo un percorso ben preciso: la molecola deve essere prima

ionizzata, attraverso uno ionizzatore e passare all’interno di un tubo che lo trasporta su un

rivelatore che distingue i frammenti piu’ grandi da quelli piu’ piccoli, passando prima in rassegna a

un analizzatore che separa i frammenti in base al loro rapporto massa/carica. Il sequenziamento

del DNA spetta, invece, al sequenziatore automatico: si è sviluppata una tecnica chiamata

analisi in serie dell’espressione genica (SAGE) in cui si e’ in grado di sintetizzare piccole

targhette di cDNA dall’estremita’ 3’ degli mRNA e unire queste piccole targhette insieme in una

sequenza di 1000 bp da sequenziare. Le analisi di sequenza di migliaia di queste targhette

permettono una stima degli mRNA presenti in una cellula. Il sequenziamento massiccio di

sequenze d’identificazione parallele (MPSS) ci permette di definire la maggior parte del

trascrittoma della cellula in questione: estrapolando un numero di cloni di cDNA per poi essere

amplificati con la PCR, ogni clone verra’ attaccato da una perlina di nylon; queste perline saranno

visualizzate in una cella a flusso e le sequenze in ogni cella saranno sequenziate simultaneamente

per generare sequenze targhetta.

Il proteoma, invece, puo’ essere analizzato grazie ad alcune strategie che tengono conto sulle

modificazioni chimiche e processi di splicing post-trascrizionali. Solitamente, le proteine vengono

digerite con tripsina, che effettua un taglio al livello dell’ arginina e della lisina

, per poi essere

parzialmente frazionati su una colonna a fase inversa (in base alla loro idrofobicita’); le aliquote

cosi’ formate vengono immesse in uno spettrometro di massa per ottenere le misure dei peptidi.

Oppure possono essere separate in un gel elettroforetico bidimensionale in cui si ha una

doppia corsa elettroforetica: 1. in base al punto isoelettrico delle proteine in esame su un gradiente

di pH nel quale si fermeranno in un punto dove si e’ raggiunto il loro pH ottimale, su gel di

poliacrilammide (focalizzazione isoelettrica) 2. la seconda corsa separera’ proteine per dimensione

per poi venir colorate su una piastra ed essere razionalizzate in uno spettrometro di massa. La

macchina piu’ frequentemente utilizzata e’ MALDI-TOF (matrix-assisted laser desorption

ionization-time-of-flight spectrometry): una macchia ritagliata dal gel e’ digerita da proteasi che la

trasformano in piccoli peptidi (analiti) immersi in una matrice densa; essi vengono poi caricati e

ionizzati, attraverso un laser, e resi volatili per poi essere messi in un tubo sotto vuoto (TOF), che

costituisce un cronometro, e migreranno in esso in tempi determinati in base alla loro massa, uno

spettro di massa sara’ confrontato con spettri teorici di una data base e la proteina potra’ essere

identificata (macchie vicine possono essere date da modifiche post-traduzionali), la decifrazione

della proteina in esame e’ data dall’analisi dei frammenti proteasici prodotti, distintivi di ogni

proteina. Per studiare i pattern di variazione dell’espressione proteica in due differenti stati cellulari,

possono essere utilizzati marcatori d’affinita’ codificati da un isotopo (ICAT): esso contiene un

marcatore biotinato, un ligando al quale si possono legare otto atomi d’idrogeno o di deuterio e un

gruppo chimico legante le cisteine di una proteina. L’analisi si compie marcando due cellule in

analisi con l’isotopo leggero e l’altra con quello pesante per poi essere miscelate per avere una

purificazione proteica delle proteine prese in esame per digerirle con tripsina e i peptidi marcati dal

legame Cys-ICAT vengono purificati per cromatografia d’affinita’ (vengono fatti passare in un

tubo saturo d’avidina, che lega strettamente la biotina, a cui si attaccheranno le proteine ICAT

facendo passare i peptidi non biotinati). Vengono, in seguito frazionate su colonna a fase inversa

per essere poi analizzate allo spettrometro di massa.

La complessita’ interattiva delle proteine e delle molecole tra di loro viene studiata

dall’interattomica: poche sono le proteine che generano nodi da cui partono molte interazioni ma,

le mutazioni inattivanti le proteine dei nodi possono essere letali

(ridondanza). Alcune proteine stanno in nodi da cui partono

interazioni simultanee che sottostanno ad una funzione cellulare

(nodi party), mentre altre sono al centro di nodi che collegano tra di

loro le reti di interazione delle singole funzioni cellulari (nodi date);

queste ultime sono il vero fulcro del proteoma e le loro mutazioni sono

gravissime.

In una data popolazione cellulare, eterogenea o monomorfa,

possiamo distinguere ogni singola cellula grazie al citometro a

flusso e al fluorescence activated cell sorter (FACS), se in seguito

vengono separate. Il FACS presenta diverse funzioni: una funzione

fluidica, che trasforma la miscela in un flusso laminare di cellule in fila indiana; una funzione ottica,

che consiste nella somministrazione alle cellule di un raggio laser che viene deviato in angolature

diverse al contatto con la cellula (ogni cellula devia il raggio in base alla propria morfologia in un

modo specifico); una funzione elettronica, che elabora la diffrazione in valori digitali salvati in un

computer e una funzione sorter, in cui le cellule vengono separate dalla popolazione. In aggiunta si

possono marcare le cellule con anticorpi con fluorocromi. Possiamo distinguere due categorie

principali di deviazione: la deviazione forward scatter, correlata alla dimensione della cellula, o

deviazione a 180 gradi rispetto al raggio incidente, e scatter laterale, correlata alla granulosita’, o

deviazioni laterali. L’elaborazione dei dati, poi, viene visualizzata sul citogramma attraverso il

riconoscimento da parte di particolari filtri della frequenza d’onda dei fluorocromi. Un filtro dicroico,

posto a 45 gradi dal laser, blocca il fascio di luce di una specifica lunghezza d’onda, deviandolo di

90 gradi; un band-pass filter, invece permette il passaggio di luce a una particolare lunghezza

d’onda e un fotomoltiplicatore (PMT) riceve il segnale e lo mostra sul citogramma. La separazione,

infine, avviene tramite l’interruzione del flusso laminare con ultrasuoni in goccioline di grandezza

poco piu’ elevata di una cellula (le cellule da sortare vengono elaborate prima che si formino le

gocce; tali goccioline caricate poi saranno successivamente indirizzate da due elettrodi (uno

positivo l’altro negativo) in provette diverse, una per cellule positive, una per cellule neutre e una

per cellule negative.

Per decifrare in che stadio del ciclo cellulare si trovano le cellule prese in esame bisogna

osservare la quantita’ di DNA nella cellula grazie all’intensità della fluorescenza che emette il

fluorocromo: mentre le cellule di controllo possiedono la classica distribuzione di DNA, modificando

le condizioni di crescita delle cellule, ovvero aggiungendo un agente antimitotico, si osserva che,

mentre per dosi intermedie si ha un accumulo delle cellule in G1, per dosi alte si ha un blocco delle

cellule preferenzialmente in G2/M e la comparsa di un picco pre-G1 (costituito anche dai corpi

apoptotici). Questo tipo di modificazione puo’ essere apportata per simulare un modello tumorale

di cellule proliferanti (appartenenti ad esempio a uno stereotipo di carcinoma ovarico)

*Le isole CpG sono zone in cui la metilazione della citosina e’ frequente ed e’ operata da una

metil-transferasi che causa modificazioni epigenetiche. La 5mC e’, successivamente, soggetta a

deaminazione formando l’uracile che si tramuta in timina durante la fase replicativa a seguire; il

risultato di questo processo e’ che il dinucleotide CpG e’ generalmente evitato e tali sequenze

presentano una frequenza minore di quella attesa nel genoma. Per distinguere le 5mC dalle C si

tratta il DNA con bisolfito di sodio che induce la modifica della citosina metilata in uracile, in questo

modo la PCR amplifica il DNA modificando introducendo T al posto di C. Nota una sequenza

genomica, e’ possibile predire la localizzazione delle isole CpG con programmi bioinformatici. La

definizione che comunemente viene usata per isola CpG e’: una sequenza maggiore di 200 bp con

una percentuale in C e G maggiore del 50%, in cui si stima un rapporto tra le metilazioni osservate

e le attese maggiore di 0,6; infatti, nei vertebrati, circa il 10-30% delle C e’ metilato. Si distinguono

due tipi di metilazione: una metilazione di mantenimento, che ripristina il pattern alchilati in seguito

alla replicazione (grazie alla DNa MetilTransferasi 1, DNMT1) e una modificazione de novo dovuta

all’azione di DNMT 3a e 3b. sono localizzate nella regione del promotore di circa il 50% dei geni

umani, la maggior parte dei quali di tipo costitutivo (housekeeping, espresso in piu’ tessuti diversi):

un alto livello di metilazione si e’ riscontrato nelle zone in cui risiedono gli pseudogeni e anche in

ambiente eterocromatinico; il 5% dei geni espressi ha un promotore metilato (che costituisce un

segnale di espressione tessuto’specifica).

Capitolo 11

Le variazioni nel DNA dei geni che vengono mantenute in una popolazione colpiscono delle regioni

non codificanti e non regolative e queste variazioni rendono il locus in questione polimorfico e puo’

essere utilizzato come marcatore per studi scientifici ma, se questo sito ha una funzione ignota si

dira’ locus anonimo. Le differenze di sequenza tra due omologhi di uno stesso individuo o di due

individui differenti possono variare di 1 su 1000 bp. Gli SNP, oltre alla PCR e al Southern blot,

possono essere riconosciuti con l’ibridazione con oligonucleotidi allele-specifici (ASO): si

sintetizzano oligonucleotidi di 20 basi appartenenti a due alleli differenti dei locus SNP; il DNA in

seguito viene suddiviso in 2 aliquote, in seguito denaturate e trasferite su nitrocellulosa.

Un’aliquota di ogni campione viene ibridata con L’ASO riconoscente l’allele selvatico e l’altra con

l’ASO che riconosce l’allele delle cellule in questione; l’autoradiografia, infine, ci indichera’ il

genotipo delle varie aliquote, eliminando quelle che non si sono ibridate. Le ASO possono essere

utilizzate anche per l’analisi clinica di mutazioni in protoncogeni che presentano diversi tipi di

mutazioni molecolari che potrebbero essere decifrate in seguito all’attento esame dell’intero

genoma; data la spesa eccessiva richiesta per una tale operazione si puo’ ricorrere alla sintesi di

alcuni ASO di sequenza identica nella regione circostante alla posizione che si vuole analizzare,

disposte sul microarray, ma con quattro diverse basi nella posizione stessa e si ripete il

procedimento fino a coprire tutte le zone d’interesse del gene. Una volta clonato il gene di ricerca,

viene attaccato a un fluorocromo ed esposto al microarray in condizioni ottimali per l’ibridazione

con sole sequenze perfettamente complementari; la diagnosi verra’ verificata su piastre

rettangolari in cui ogni colonna presenta quattro rettangoli che contengono separatamente ASOs

che differiscono solo per la posizione nucleotidica in analisi e il DNA esaminato puo’ essere

complementare a solo uno di questi quattro ASO. Un’analisi automatizzata della fluorescenza per

ognuno degli ASO del microarray permette di determinare quale base si trova in ognuna delle

posizioni studiate della sequenza codificante il gene.

I polimorfismi che provocano cambiamenti nelle dimensioni del locus possono essere facilmente

riconosciuti tramite elettroforesi su gel. I microsatelliti, com’e’ stato detto, consistono in 2 o 3

coppie di basi ripetute da 15 fino a 1000 volte, esse sono altamente polimorfiche e sono facilmente

identificabili per mezzo di semplice ibridazione e si originano da errori durante la replicazione

(durante il processo la polimerasi mentre replica la regione ripetuta puo’ fermarsi perche’ non trova

i nucleotidi giusti, cosi’ puo’ capitare che una sequenza per caso si alzi dietro di essa e una volta

che la replicazione riparte i nucleotidi che si sono aperti non vengono riappaiati; l’errore verra’

corretto solo in seguito provocando l’amplificazione delle sequenze); i minisatelliti (che provocano

eventi di crossing over ineguale data la loro dispersivita’), invece, sono presenti in specifici loci

genici le cui variazioni alleliche possono essere studiate attraverso la digestione con gli enzimi di

restrizione, l’elettroforesi e l’ibridazione Southern blot con una sonda che ibrida tutto il minisatellite.

Dato che forniscono un’immagine chiara del genoma piuttosto che un singolo locus e dato il loro

grado di polimorfismo, sono ideali per un confronto della correlazione genetica che intercorre tra

due individui e un campione di DNA rinvenuto (genetica forense). Vengono analizzati soprattutto i

minisatelliti, i microsatelliti (STR) e gli SNPs: quest’ultimi piu’ usati in quanto sono altamente

automatizzati e sono sufficienti amplificati di PCR molto corti con un numero di basi inferiore a 100

bp ma sono marcatori di alleli, ed esistono due copie possibili per ogni coppia di loci. Pertanto, per

conseguire un elevato potere di discriminazione si richiede l’analisi di un maggior numero di

marcatori.

La probabilita’ che due individui non imparentati abbiano un genotipo identico con due alleli

ugualmente frequenti e’ del 37,5% ma, la probabilita’ che gli stessi due individui siano identici in 10

loci di questo tipo e’ solamente del 0,005%. Possiamo affermare quindi che i minisatelliti, come altri

tipi di polimorfismi, sono unici in ogni individuo e da questi si ricava il cosiddetto fingerprint del

DNA che può essere ottenuto secondo il seguente modo: bisogna digerire il DNA con un enzima di

restrizione che non digerisce all’interno del minisatellite stesso, ma taglia i siti fiancheggianti molto

vicini; i frammenti vengono poi sottoposti a elettroforesi su gel e ibridati su nitrocellulosa con un

frammento di DNA derivato dal minisatellite. Infine, si giungera’ ad un’autoradiografia che mostrera’

il pattern dei frammenti di diverse dimensioni, rappresentanti tutti i loci di quel minisatellite nel

genoma. Per ottenere le impronte digitali del DNA bisogna conoscere la posizione dei marcatori

del DNA per determinare la posizione cromosomica di geni responsabili di fenotipi patologici e di

altre differenze tra persone, animali o piante. Per determinare il sito di mutazione in un locus si

puo’ ricorrere al metodo del clonaggio posizionale: si crea, dapprima una mappa d’associazione

del locus d’interesse identificando il genotipo di tutti i membri della famiglia, manifestanti la

mutazione, attraverso il posizionamento di marcatori di DNA a 10 cM su ogni cromosoma; se la

distanza tra i marcatori e’ piu’ grande, la possibilita’ di dimostrare un’associazione tra un marcatore

e il locus della malattia sono molto ridotte; se e’ minore allora bisogna analizzare una numero

maggiore di genotipi. L’associazione del gene in questione con uno dei marcatori conosciuti ci

permettera’ di stabilire una regione d’interesse di circa 1000 kb causa del fenotipo mutante. Una

volta individuata la regione, e’ necessario catalogare i geni presenti in quella regione attraverso

diversi approcci: il primo basato sulle differenti forze di selezione naturale che agiscono sulle

regioni codificanti e quelle non funzionali; le mutazioni nelle regioni regolatrici, solitamente, non

sono tollerate dall’organismo, e quindi evolvono piu’ lentamente. Un secondo approccio si fonda su

un algoritmo in grado di rilevare le regioni codificanti simili agli esoni, grazie a un ORF, sulla

conoscenza dell’uso dei codoni e sulla struttura dei siti di splicing. Un ulteriore metodo e’ basato

sulla verifica di piu’ cloni EST, presenti in data base genomici conosciuti, con sequenze omologhe

a piu’ geni d’interesse. Ora, occorre conoscere quali tra i geni identificati e’ responsabile del

fenotipo mutante: grazie al pattern d’espressione di ogni gene possiamo restringere il campo di

ricerca. Due metodiche principali ci possono aiutare a comprendere i pattern d’espressione: la

consultazione di librerie genomiche pubbliche di EST, in modo da ricercare il tessuto d’interesse di

tale mutazione, e il Northern blot. In questo metodo, l’RNA trascritto nelle cellule di un particolare

tessuto viene separato per elettroforesi su gel, per poi essere trasferito su nitrocellulosa, ibridato, e

sottoposto ad autoradiografia; dai risultati possiamo ricavare due tipi d’informazione: le dimensioni

reali dell’RNA, le capacita’ codificanti del trascritto e, di conseguenza, le dimensioni della proteina

analizzata; inoltre, l’analisi di diversi campioni di RNA ottenuti da diversi tessuti permette di

determinare in quale tessuto specifico e’ espresso il gene e anche i relativi livelli d’espressione di

quel gene in tutte le cellule dove viene trascritto. Si puo’ anche frammentare nuovamente la

regione genomica per creare marcatori sonda per il Northern blot: i frammenti che non

comprendono regioni codificanti non appariranno come bande in nessuno dei campioni di RNA;

quelli espressi in tutti i tessuti daranno una banda caratteristica in tutti i campioni; quelli espressi

solo in tessuti specifici daranno una banda solo in alcuni campioni. Infine, per determinare quale

tra i geni candidati e’ realmente responsabile del fenotipo in questione, bisogna confrontare gruppi

di individui sani con gruppi aberranti: se la sequenza del trascritto del gene candidato e’

consistentemente alterata in tutti gli individui mutanti, allora con buone probabilita’ il gene e’ la

causa della mutazione. Una prova inconfutabile dell’origine della malattia e’ data dall’induzione di

tale mutazione in organismi cavie di laboratorio, con la creazione di animali transgenici, come i

topi. Un transgene e’ un pezzo di DNA che viene iniettato attraverso una pipetta o in un embrione

in uno stadio precoce dello sviluppo o nel pronucleo di una cellula germinale, solitamente un ovulo.

A questo punto, l’embrione o l’ovulo viene inserito all’interno di una madre adottiva, topo knock in,

e lasciato sviluppare. Questo topo crescera’ acquisendo una funzione additiva che gli permettera’

di manifestare il fenotipo mutante in esame.

Questo meccanismo di acquisizione viene utilizzato per lo studio dei tumori umani su esemplari

murini in laboratorio per creare degli oncotopi condizionali: solitamente, viene utilizzato un

sistema d’inserzione dell’operone della tetraciclina presente in E.Coli. questa sequenza presenta

tre elementi: TeT repressor (TeTR), repressore per la trascrizione della tetraciclina, Tc-Dox, gene

della tetraciclina e TRE (tetracyclin response element), sito di legame di TeTR; se si utilizza un

plasmide che accende il gene (Tet-OFF), Dox si lega a TeTR e il gene tumorale non viene

espresso, ma se non si evidenzia la funzionalita’ di Dox, il gene viene espresso; contrariamente, il

plasmide con Tet-ON presenta una versione mutata del gene TeTR che e’ inattivo se non si lega a

Dox. La tecnica del clonaggio posizionale, pero’, puo’ essere complicata per definire fenotipi

mutanti con penetranza incompleta, espressivita’ variabile, fenocopia o presentante

un’eterogeneita’ genetica. Un esempio di applicazione di topi knock in tumorali sono dati

dall’induzione di mutazioni per l’insorenza della cirrosi epatica: essa e’ causata da un deficit di

alfa1antitripsina che reprime l’attivita’ dell’elastasi, una proteasi molto frequente nelle vie

respiratorie prodotta dal fegato che se accumulata provoca danni importanti al fegato e ai polmoni.

Il knock in e’ dato dal fenotipo d’accumulo dell’elastasi che e’ correlato a un allele dominante e allo

stesso tempo si ha un deficit di alfa1antitripsina che e’ provocato da un allele recessivo.

Per causare, invece, una delezione o sostituzioni nucleotidiche che provocano una perdita di

funzione in una cavia, definita topo knock out condizionale, si usufruisce della tecnologia della

mutagenesi mirata che sfrutta la ricombinazione Cre-Lox. Nel campo della genetica, e’

conosciuta come una tecnologia di ricombinazione sito-specifica che permette modificazione del

DNA in uno specifico tipo cellulare o l’innesco da uno specifico stimolo esterno in un dato stadio

dello sviluppo. Si ricorre all’utilizzo di un enzima, la ricombinasi Cre, che e’ in grado di ricombinare

un paio di sequenze, chiamate sequenze LoxP (locus of crossover in P1) con sequenze

palindromiche di 13 bp alle estremita’ e una sequenza spaziatrice di 8 bp all’interno, presenti nel

batteriofago P1; quest’ultime permettono di attivare, reprimere o sostituire un gene. La

ricombinazione provoca delezione se le sequenze Lox si presentano in tandem (come in figura),

inversione se a tandem in palindrome, duplicazione, se posizionate su due cromatidi fratelli e

integrazione, se si posiziona un elemento in un plasmide e un altro nella sequenza dove si integra.

In laboratorio si possono selezionare dei topi Cre e LoxP (con costrutto floxed) in modo da essere,

in seguito, incrociati per portare avanti lo sviluppo di un topo Cre-LoxP rappresentante il fenotipo

mutante che si sta studiando per creare mutanti condizionali. Il costrutto di DNA che viene prodotto

deve constare di due sequenze Lox P circostanti il gene target e un gene codificante per Cre, in

grado di far funzionare il meccanismo d’azione di ricombinazione; in generale, questi sistemi

usufruiscono di una o piu’ proteine e agiscono su sequenze di DNA uniche. I prodotti della

ricombinazione dipenderanno dalla relativa orientazione di queste sequenze asimmetriche.

Durante la ricombinazione sito-specifica, che porta un riarrangiamento genetico come avviene in

un’integrazione virale seguita da un escissione e una segregazione cromosomica, questa

ricombinasi riconosce le sequenze Lox, le quali si sovrappongono l’un l’altra, e catalizza il

reciproco scambio di filamenti tra questi siti. Due fattori possono alterare l’escissione della

sequenza: una modificazione nella regione spaziatrice Lox, per la risoluzione in un intermedio

meno efficiente, e la lunghezza del DNA tra le Lox. Tale tecnica e’ preceduta da un meccanismo di

gene targeting che seleziona il gene da mutare: questo processo e’ dato dall’ingegnerizzazione di

un costrutto ad omega costituito da sequenze omologhe al gene target alle estremita’ (spalle) e un

gene che conferisce la resistenza a un

antibiotico all’interno (a esempio la

neomicina che causa la mutazione del

gene e quindi una perdita di funzione

al topo, che si definisce knock out) e

due geni reporter (lacZ, GFP, …) che

evidenziano la posizione del costrutto

(quest’ultimi vengono controllati da

promotori costitutivi o inducibili). Viene

iniettato in seguito per transfezione un

gene per la sensibilita’ a un ulteriore

antibiotico (a esempio la timidina

chinasi Tk, presente nell’herpes

simplex, sensibile al ganciclovir). In

caso di ricombinazione non omologa, il

gene Tk sara’ ancora presente e le

cellule potranno essere selezionate

con il farmaco suddetto; al contrario, se avviene tra sequenze omologhe la resistenza si estende a

entrambi i farmaci. Una volta eliminata la resistenza alla neomicina per induzione del gene Cre, le

cellule mutanti sono pronte per essere inserite nella blastocisti murina, che se non presentasse

una mutazione condizionale, avrebbe buone probabilita’ di morte fetale per omozigosi recessiva; la

ricombinazione puo’ provocare anche l’eliminazione di un gene reporter che viene compensata

dalla presenza dell’altro gene.

Si possono studiare mutanti in una zona in particolare legata all’attivita’ di un processo biologico

patologico, inoltre, attraverso l’analisi dell’epistasi, che permette di trovare la correlazione tra i

vari geni mutanti coinvolti; quando le mutazioni mantengono una funzione parziale, le loro

interazioni epistatiche possono essere difficili da interpretare. Talvolta un doppio mutante mostrera’

un fenotipo nuovo o piu’ grave dei singoli mutanti: tale fenotipo e’ detto sintetico, e, nella maggior

parte dei casi, e’ causato da un’alterazione di due geni che agiscono in due diverse vie parallele,

capaci entrambi di mediare lo stesso processo cellulare; quando entrambe le vie sono interrotte, il

processo si blocca completamente.

Nell’uomo l’analisi d’associazione non e’ molto usata a causa dell’esiguo numero di membri in una

famiglia e dal modesto numero della progenie; a tal proposito viene utilizzata un approccio basato

sull’analisi d’associazione dell’aplotipo o del linkage disequilibrium. L’aplotipo e’ la

combinazione di due o piu’ alleli marcatori di DNA situati uno vicino all’altro sulla stessa molecola

di DNA, i cui marcatori piu’ frequenti sono gli SNPs: essi si generano quando una serie di

mutazioni si accumulano una dietro l’altra nei cromosomi che discendono da un cromosoma

ancestrale. Si possono estendere da 1 a 100 kb e la ricombinazione in questi loci e’ estremamente

rara e possiamo dire che un particolare aplotipo puo’ generarsi solamente una volta nella storia

umana. L’associazione statistica tra questi loci si manifesta in assenza di ricombinazione tra essi

stessi. Per quanto riguarda gli autosomi e le regioni pseudoautosomiche dei cromosomi sessuali,

questa associazione puo’ essere dovuta alla vicinanza fisica tra i loci considerati e all’assenza di

hot-spot di ricombinazione tra di loro. Invece gli alleli della regione non ricombinante del

cromosoma Y (NRY) sono sempre associati a formare aplotipi, cosi’ come gli alleli del genoma

mitocondriale, poiche’ sono ereditati con modalita’ uniparentale.


PAGINE

41

PESO

1.64 MB

PUBBLICATO

+1 anno fa


DETTAGLI
Esame: Genetica
Corso di laurea: Corso di laurea in biotecnologie (I e II Facoltà di Medicina e Chirurgia, di Farmacia e di Scienze Matematiche, Fisiche e Naturali)
SSD:
A.A.: 2016-2017

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Davidino14 di informazioni apprese con la frequenza delle lezioni di Genetica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università La Sapienza - Uniroma1 o del prof Cenci Gianni.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Corso di laurea in biotecnologie (i e ii facoltà di medicina e chirurgia, di farmacia e di scienze matematiche, fisiche e naturali)

Biologia dello Sviluppo - Appunti
Appunto
Fisiologia Umana - Appunti
Appunto
Microbiologia I
Appunto
Lezioni, Fisiologia Vegetale
Appunto