Genetica 2 - Anno Accademico 2017-2018
Studio del gene
Il genoma umano è grosso circa 3 miliardi di paia di basi. Attraverso lo studio del genoma è possibile capire i meccanismi evolutivi, capire la regolazione e la correlazione tra geni diversi ed identificare la struttura fisica dei geni.
Mappatura genica: localizzazione del gene sul cromosoma
Esistono diverse classi di genomica:
- Strutturale: genome mapping
- Funzionale: analisi delle funzioni geniche
- Comparativa: confronto tra genomi di specie diverse in ottica evolutiva
- Medica: medicina personalizzata
Bioinformatica
È l’integrazione di elementi matematici e di elaborazione dati alla genetica.
Applicazioni:
- Identifica geni entro la sequenza completa del DNA.
- Allinea e confronta sequenze geniche in un database per determinare la funzione.
- Predice struttura e funzioni dei prodotti genici.
- Descrive interazioni tra geni e prodotti genici.
- Stima relazioni filogenetiche e di popolazioni.
Progetto genoma umano (1990-2003)
Per sequenziare il genoma umano si suddivise il lavoro tra diversi laboratori. L’analisi fu effettuata tramite due metodologie:
- Mappatura: allineamento progressivo di cloni contigui o divisione del genoma o clonaggio o sequenziamento
- Shotgun: si digerisce l’intero genoma e poi il PC sequenzia i vari segmenti e li allinea evitando sovrapposizioni.
Dopo il sequenziamento si iniziò un’analisi più approfondita:
- Individuazione dei geni codificanti per proteine: ci si aspettava un’alta percentuale ma in realtà solo il 2% del genoma umano è codificante per proteine
- Individuazione trasposoni: circa il 45% del genoma
Ci si rese conto che non c’è correlazione tra grandezza del genoma, numero di geni e complessità evolutiva. L’uomo ha circa 21,000 geni (dimensione media del gene 50kb) mentre le amebe hanno genomi grossi più del doppio. Esistono famiglie geniche che si sono diversificate per divergenza evolutiva. Quasi tutti i geni sono soggetti a splicing alternativo.
Subito non si ebbe ben chiara l’importanza degli elementi non codificanti dato che la maggioranza delle sequenze conservate sono proprio quelle non codificanti. Più o meno tutto il genoma può essere trascritto anche se a bassi livelli. Ci sono moltissime varianti genetiche con frequenze maggiori del 5% nella popolazione umana. Il genoma può essere diviso a blocchi e una sola variante può far riconoscere l’intero blocco. Molti tratti somatici sono controllati da diversi loci, ad esempio la statura di un individuo è influenzata da circa 180 loci diversi.
Lo studio del nostro genoma ha permesso di capire i nostri adattamenti evolutivi:
- Pelle chiara è evolutivamente recente
- Adattamento delle popolazioni andine a basse concentrazioni di ossigeno
- Permanenza in fase adulta della lattasi
Composizione del genoma umano
Vettori di clonaggio
I vettori sono:
- Plasmidio
- Fago λ
- Cosmidio
- YAC
- BAC
Le caratteristiche che un vettore deve avere sono la replicazione indipendente dall'ospite, possedere marcatori per il riconoscimento e possedere geni per le resistenze agli antibiotici.
Plasmidio: contiene circa 10kb
| Pro | Contro |
| Piccoli | Un gene medio è troppo grande per essere contenuto |
| Facili da ottenere |
YAC/BAC: contengono circa 500kb
| Pro | Contro |
| Ampie librerie | Molto grossi da analizzare |
Fago λ: vettore di circa 15-20kb. È il virus batteriofago.
- Ciclo litico: distrugge il batterio
- Ciclo lisogeno: si ibrida con il genoma batterico e attende le condizioni ideali per proliferare
Si rimuovono i geni del ciclo lisogeno (circa 15kb) e li si sostituisce col DNA studiato per trasformare il virus in un vettore. Gli inserti di DNA esogeno non devono discostarsi molto da 15kb perché altrimenti il sistema di impacchettamento del capside non riconosce quel DNA.
Librerie genomiche
Clonaggio: serve per sequenziare tutto il genoma. Contiene tutti gli elementi del genoma studiato. Librerie di clonaggio di cellule diverse dello stesso organismo sono identiche. Il punto di partenza è il genoma.
cDNA
Il cDNA è il DNA retrotrascritto dall’RNA. Ci dà la fotografia dei trascritti di quella cellula in quel momento. Le librerie cDNA sono diverse per cellule diverse dello stesso organismo. Ci fornisce informazioni sul trascrittoma.
Espressione: serve per far esprimere delle proteine alla bisogna. La libreria di espressione si costruisce a partire dal cDNA. Anche se nel cDNA restasse un introne la cellula lo eliminerebbe con lo splicing. Delle volte lasciare delle piccole sequenze introniche permette una miglior espressione del cDNA nella cellula esogena. Le cellule HeLa sono quelle più usate per questo tipo di sperimentazione. Avendo sequenziato il genoma per capire se ci sono sequenze codificanti bisogna poi cercare le ORF; le possibili ORF sono 6 per ogni trascritto.
Procarioti vs Eucarioti
Procarioti: si cerca sempre la ORF più lunga perché una ORF lunga meno di 20-30aa non è plausibile sia tradotta in proteina. La tecnica di ricerca degli ORF è efficace nei procarioti perché essi non presentano introni.
Eucarioti: dato che presentano molti introni si cercano i siti di splicing per isolare le sequenze esoniche. Si possono anche cercare i TATA-box che sono i siti dove l’elica si apre per iniziare la trascrizione. Inoltre, le sequenze codificanti sono quelle più conservate nell’evoluzione: quindi se il mio tratto di genoma è altamente conservato è probabile che sia un segmento codificante.
Per gli eucarioti si eseguono diverse analisi:
- Analisi informatiche:
- Segnali di splicing
- Isole CpG
- TATA, CACC, CCAAT-box
- Segnali di terminazione
- Conservazione in specie diverse
- Analisi sperimentali:
- Northern blot
- Zooblot
Allineando i genomi di diverse specie le zone che più si sovrappongono sono le regioni codificanti. Negli eucarioti il sito ATG di inizio traduzione non coincide quasi mai con il sito di inizio della trascrizione. L’unico confronto sperimentale di controllo è il confronto tra mRNA e DNA. Questo confronto è la prova del nove per capire se si è interpretata bene la sequenza di DNA.
Studio sequenze regolative
Identificazione sequenze regolative
Anche in questo caso si usa la conservazione di queste sequenze in specie diverse. Sequenze altamente conservate sono le candidate per essere sequenze regolatorie importanti. Per capire l’effettiva validità del candidato si deve fare un esperimento utilizzando LacZ come gene reporter. LacZ deve essere associato ad un promotore minimo (di trascrizione basale) e deve essere posto dopo il candidato enhancer. Se il candidato è effettivamente una sequenza regolatoria allora attiverà molto LacZ e si può visualizzare il risultato con la classica colorazione blu. Questi esperimenti si effettuano su topi transgenici (tutte le cellule sono modificate) e la colorazione blu si avrà solo nelle popolazioni cellulari dove il candidato enhancer si attiva. In questo modo si capisce la localizzazione topologica delle cellule che hanno l’enhancer attivato. Lo step successivo è capire quando e che geni l’enhancer regola.
- Test di ipersensibilità dalla DNAasi-I: le sequenze regolative sono più accessibili al taglio da parte di nucleasi. Le sequenze regolative sono infatti srotolate perché devono essere disponibili per il legame con i fattori di trascrizione. Se si utilizza DNAasi-I per breve tempo solo le regioni regolatorie saranno attaccate perché sono le più accessibili. Questo test si effettua sulla cromatina e non sul DNA purificato.
Questo esempio raffigura DNA di 7kb con una sequenza regolatoria di 1kb. Dopo il trattamento con DNAasi si fa correre su gel il risultato della digestione: ottengo segmenti da 7 o da 6kb a seconda se la DNAasi ha agito o meno. L’utilizzo di enzimi di restrizione serve per visualizzare la posizione della sequenza regolatoria all’interno del frammento digerito.
- Southern Blot: ibrido il DNA con una sonda radioattiva per visualizzare visivamente i punti di taglio degli enzimi di restrizione o i punti in cui la DNAasi-I ha agito.
Caratterizzazione sequenze regolative
Si deve capire che fattore di trascrizione si lega a quella specifica sequenza regolativa. Confronto siti che so essere target di quel fattore così da capire la sequenza di basi ottimale che quel particolare fattore bersaglia. La validazione del sito di legame si ha tramite l’uso di una particolare tecnica:
- Gel shift: legare in vitro DNA-proteina. Se il DNA marcato lega la proteina la sua corsa elettroforetica è minore perché il complesso è molto pesante. Per capire se si è legata la proteina specifica utilizzo un anticorpo per quella proteina che me la fa individuare in modo univoco.
Epigenetica
Modificazioni chimiche delle code istoniche che determinano l’apertura o chiusura della cromatina. Studia tutte le modificazioni ereditabili che variano l'espressione genica pur non alterando la sequenza del DNA.
Immunoprecipitazione della cromatina (ChIP)
Si parte dalle cellule studiate e le si tratta con formaldeide per congelare la cellula in quel particolare momento. Si digerisce ora il DNA per ridurre la cromatina in piccoli segmenti. Ora si aggiunge l’anticorpo specifico per la proteina di interesse. Quindi si aggiungono delle “beads” di sepharose (Separation-Pharmacia-Agarose) o di magnetite per isolare i complessi proteina-anticorpo. Si toglie quindi il DNA con bicarbonato a 60°C. Alla fine con una PCR si visualizza se in vivo quel sito di DNA era effettivamente legato alla proteina di interesse. A questo punto posso sequenziare i tratti di DNA immunoprecipitati così da sapere quali sequenze sono legate alla proteina di interesse in quella data linea cellulare.
ChIP sequencing
La ChIP-seq unisce la tecnica ChIP con un parallelo sequenziamento massivo del DNA. In questo modo si sono trovate nuove sequenze target e si è potuto seguire la dinamica delle modificazioni della cromatina. Questo è utile perché ci sono numerosi siti diversi per lo stesso fattore trascrizionale ma non tutti sono usati allo stesso modo. Alcuni siti potrebbero inoltre essere tessuto-specifici.
Transfezione
Introduzione di costrutti di DNA in cellule eucariotiche attraverso l’utilizzo di: fosfato di calcio, lipidi cationici ed elettroporazione. Con la trasfezione posso rispondere alle seguenti richieste riguardo alla sequenza di DNA appena sequenziata:
- È un promotore, enhancer o silencer? Uso geni reporter clonati su plasmidi. Il promotore sta all’immediato 5’ del gene. Quindi se LacZ è vicino al gene e viene espresso so che la sequenza è un promotore. Per capire invece se è un enhancer (lontano dal gene) devo vedere un aumento dell’espressione di LacZ rispetto ai livelli basali. Se la sequenza è un silencer invece si osserva una diminuzione dell’espressione.
- In quali cellule funziona? La sequenza può essere attiva ubiquitariamente o essere tessuto-specifica. Se è ubiquitaria la trasfezione in diverse cellule porta tutte a colorarsi di blu (LacZ attivo).
- Mutando il sito posso osservare l’effetto delle diverse mutazioni sull’espressione dei geni a valle.
- Il fattore proteico è attivatore o repressore? Utilizzo la overespressione del gene che lo codifica. Se il gene a valle perde di espressione il fattore è un repressore, altrimenti è un attivatore.
Analisi di funzione genica
Per capire la funzione del gene si può:
- Overespressione del gene: si usano librerie di cDNA
- Espressione ectopica: si usano librerie di cDNA
- Knock-out del gene
- Knock-down
Overespressione: clonaggio del cDNA nel vettore con un promotore apposito. MCS: Multiple Cloning Site. Questo sito si interpone tra gene e promotore così che il clonaggio sia più facile. La cassetta di espressione è dunque composta da promotore, MCS, gene e terminatore. Ogni plasmide deve poi avere dei geni per le resistenze agli antibiotici così da poter selezionare le cellule transfettate. L’efficienza di transfezione di solito non supera il 20%. I vettori retrovirali si basano sullo scambio del genoma virale con la cassetta di espressione ed inoltre possiedono una elevata efficienza di transfezione.
Espressione ectopica: si basa sugli stessi principi della overespressione.
miRNA - Introduzione
Silenziamento genico: esperimenti di RNA-Interference. Il silenziamento del gene può avvenire per blocco della traduzione o degradazione del RNA. Il microRNA ad esempio può legarsi all’estremità 3’ del mRNA e bloccarne la traduzione. Il meccanismo dell’RNA-i è presente in tutte le cellule degli organismi multicellulari. Le molecole dsRNA sono processate in corti RNA a singolo filamento dal complesso enzimatico citoplasmatico DICER, che vengono indirizzati al RNA-induced silencing complex (RISC). RISC media il legame sequenza specifico del siRNA sulla sequenza complementare del mRNA bersaglio corrispondente, impedendone la traduzione attraverso 2 meccanismi: blocco della traduzione o degradazione dell’mRNA.
- dsRNA viene legato dal complesso DICER
- RNAsi di classe III (specifiche per i dsRNAs).
- DICER taglia dsRNA in frammenti più piccoli
- ssRNA viene legato dal complesso RISC e si appaia all’mRNA complementare
- mRNA viene degradato
Per capire se il gene è stato silenziato e quindi la proteina non è prodotta si usa il western blot o il legame con anticorpi fluorescenti specifici per quella proteina (se la cellula non si colora la proteina è assente). Col western blot faccio una elettroforesi su gel con l’estratto trattato e un controllo: se la proteina non è espressa sulle lane del trattato mancheranno le bande corrispondenti a quella proteina. Il silenziamento genico ha importanti applicazioni cliniche come ad esempio il silenziamento di ApoB per ridurre i livelli di colesterolo. Il silenziamento di geni oncogeni può ritardare l’insorgenza di tumori in pazienti predisposti. È stato fatto lo screening di tutti i geni di C. elegans. Dato che si nutre di batteri è stata costruita una libreria di RNA interferenti inserita nei batteri di cui si nutre che ha permesso di studiare la funzione genica di tutto il genoma del nematode.
Scoperta miRNA
Sono stati scoperti in C. elegans. Sono stati identificati due loci importanti per lo sviluppo larvale: LIN4 e LIN14. LIN 4 produce un miRNA di 22nt che si appaia a LIN14 nella regione 3’-UTR e ne blocca l’attività. La scomparsa della proteina LIN14 segna la transizione fra le fasi di sviluppo larvale L1 e L2. La perdita di funzione LIN 14 (o overespressione LIN4): provoca la ridotta fase L1 e dunque uno sviluppo precoce di una larva tardiva con poche cellule. L’acquisto di funzione (troppo) LIN14 (o assenza di lin4) provoca una L1 estesa e non c’è passaggio alla fase tardiva. Se due mRNA presentano sequenze omologhe saranno controllati simultaneamente dallo stesso miRNA. Ad esempio il miRNA di LIN4 regola sia LIN14 che LIN28. Una volta scoperti in C. elegans, i miRNA sono stati trovati in insetti, piante e mammiferi. La ricerca sui miRNA si concentra su: omologia, predizione dei target e studi funzionali.
Esperimento in topo: promotore che guida l’espressione di LacZ che contiene in 3’ sequenze bersaglio di un miRNA. Se il miRNA è presente, si lega e silenzia l’espressione (la cellula non si colora di blu). Con questo tipo di esperimento posso capire se e dove un particolare miRNA è espresso.
Regolazione data da miRNA
Ogni cellula ha un suo repertorio di miRNA che regola il pool di mRNA della stessa. Un miRNA può controllare contemporaneamente più geni e risulta quindi importante nei processi di sviluppo e differenziamento. Se muta la sequenza di RNA si produce un miRNA anomalo che può silenziare i geni sbagliati.
miRNA e fenotipo
Pecora Texel: una mutazione provoca l’interazione di un particolare gene con un miRNA. In questo caso la mutazione nella sequenza genica provoca un RNA bersaglio di un miRNA che ne abolisce l’attività. La pecora nasce con zampe posteriori molto muscolose. Per trovare quali varianti sono in omozigosi in queste pecore, si è mappato il loro genoma e poi lo si è confrontato col genoma di una pecora normale. Il tratto è stato selezionato positivamente perché gli animali muscolosi erano più forti. Il silenziamento del gene per la miostatina è associato alla ipertrofia muscolare. Per trovare questa mutazione si era prima sequenziato l’insieme degli esoni ma non si erano trovate anomalie. Anche il livello quantitativo di RNA era normale. Solo dopo aver sequenziato la regione attorno al gene si è trovata una SNP che era presente nel 99% delle pecore texel e solo nell’1% delle pecore normali. Questo è quindi la variante texel-specifica e si trova nella regione 3’UTR del gene della miostatina. In questa regione ci sono le sequenze target di miRNA1 che è espresso molto nei muscoli ed è conservato in specie diverse. Si è scoperto che miRNA1 silenzia il gene della miostatina nelle pecore texel.
Sordità umana: in questo caso è la sequenza del miRNA che lo porta a riconoscere dei target illegittimi. L’approccio sperimentale è di ricerca di varianti negli individui sordi che non si trovano negli individui sani (genome-wide research). Si escludono a priori le persone sorde la cui condizione è data da varianti già note. Si è trovato che miRNA96 ha una base mutata negli individui sordi rispetto agli individui sani.
Zinc-Finger Nucleasi
Primi tentativi per riconoscere e tagliare specifiche sequenze all’interno del DNA umano. Solo quando la parte destra e sinistra...
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.