Genoma
Esistono sia virus a DNA che a RNA; il DNA può essere sia a doppio filamento che a singolo filamento, e lo stesso vale per l’RNA. Esistono poi delle situazioni particolari in cui i virus hanno un DNA parzialmente a doppio filamento perché il primo filamento è completo mentre il secondo manca di un pezzo, oppure dei virus che nel virione hanno RNA ma durante il ciclo replicativo passano a DNA per poi tornare a RNA (Retrovirus), ed esiste anche la situazione opposta (Hepadnavirus); in entrambi questi casi, essendoci un intermedio replicativo diverso, occorre la trascrittasi inversa.
Nei virus a ssRNA bisogna tenere conto della polarità del genoma, ovvero il senso di lettura della stessa molecola: i virus dotati di una catena di RNA letta in senso 5’-3’ (come l’mRNA) prendono il nome di virus a polarità positiva, e questo significa che il genoma stesso funziona da mRNA dopo l’ingresso nella cellula legandosi ai ribosomi ed iniziando la sintesi proteica, mentre i virus il cui genoma è complementare all’mRNA e viene letto in senso opposto (3’-5’) vengono definiti a polarità negativa.
Anche l’organizzazione spaziale dei genomi può essere diversa: la maggior parte dei virus ha un genoma lineare, ma ne esistono anche dotati di genoma circolare chiuso o aperto; esistono poi i genomi frammentati, ovvero tanti pezzi di genoma all’interno della stessa particella. In relazione a questo, esistono due diverse possibilità:
- Genomi segmentati: sempre e solo ad RNA, sono costituiti da geni suddivisi in altrettanti segmenti, ciascuno dei quali è monocistronico, ovvero codifica per una sola proteina; questo offre diversi vantaggi, uno dei quali è che uno dei limiti dell’ingresso di materiale genetico nel capside sono le dimensioni, e quindi segmentando il genoma si ha la possibilità di farne entrare una quantità maggiore. Il motivo più importante della segmentazione è che i genomi ad RNA vanno incontro ad una frequenza di mutazioni molto elevata: se in un genoma si accumulano troppe mutazioni questo può portare all’incapacità del virus di replicarsi, mentre segmentando il genoma si ha un rischio minore di avere troppe mutazioni letali. Nei virus dotati di genomi segmentati ogni particella virale contiene tutti i segmenti necessari alla sua replicazione, ed il problema è proprio far entrare tutti questi segmenti nel momento dell’incapsidamento; per questo motivo si formano delle particelle con un numero di segmenti maggiore rispetto a quello richiesto, per aumentare la probabilità che ci siano tutti quanti i segmenti.
- Genomi multipartiti: sono virus con genomi divisi in varie porzioni (due o tre) ed ogni singola particella contiene una sola di queste porzioni, quindi nessuna particella da sola è in grado di portare a termine il ciclo replicativo e produrre una progenie virale, perciò occorre che una cellula venga simultaneamente infettata da due o tre particelle virali cosicché si venga a trovare nella stessa tutto l’insieme di informazioni necessarie alla replicazione. Per questo motivo i genomi multipartiti sono caratteristici solo dei virus delle piante, infatti le cellule animali infettate da un virus non vengono solitamente superinfettate da un altro virus.
Il genoma virale è molto piccolo (poco più di 3000 nucleotidi in alcuni virus umani, di cui i più grossi possiedono tra i 200 e le 400 paia di kb); le dimensioni del genoma sono strettamente correlate alla quantità di proteine codificate ed alle dimensioni della particella virale: più il genoma è piccolo, meno proteine sintetizza, e minori sono le dimensioni della particella virale.
I Parvovirus, che sono i virus più piccoli, possiedono un capside costituito da una sola proteina, codificata da un singolo gene funzionale, mentre i Picornavirus (30 nm di diametro) hanno un capside formato da 4 protomeri, ed il loro genoma codifica anche per una proteina funzionale e alcune proteine enzimatiche; i Poxvirus invece, che sono tra i virus più grandi (300-400 nm) hanno un genoma di quasi 400 paia di kb il cui capside contiene 100 proteine diverse, e tali virus sono fortemente indipendenti dalle funzioni enzimatiche della cellula.
I virus si sono evoluti in modo tale da sfruttare al massimo il loro genoma di ridotte dimensioni, attraverso un fenomeno detto compattazione genica: confrontati con i parametri trascrizionali delle cellule, i virus sono in grado di codificare molte più proteine, ed infatti questo fenomeno consente ai virus di codificare proteine diverse da una stessa porzione di genoma. Per i virus non si usa il termine “gene”, bensì di ORF (Open Reading Frame), in quanto il genoma può essere letto in vari modi dando origine a proteine diverse.
Compattazione genica
Come si può realizzare la compattazione genica? Esistono diverse modalità attraverso cui i virus possono attuare la compattazione genica: tutti i virus, ed in particolare HIV, sono in grado di trascrivere una singola porzione genomica che può andare incontro a splicing diversi: uno dei geni fondamentali di HIV, env, codifica per le proteine dell’envelope, ma dalla stessa porzione, a seconda degli splicing, possono essere sintetizzate altre 6 diverse proteine.
I virus hanno poi la capacità di forzare i codoni d’arresto: si forma un mRNA che può presentare un codone d’arresto e che permette l’interruzione della traduzione in alcuni ribosomi, mentre in altri la lettura viene forzata mandando avanti la traduzione e formando così una proteina diversa; si può verificare anche la situazione opposta, ovvero vengono forzati i siti d’inizio: ORF con siti d’inizio diversi (più a monte o più a valle) portano alla formazione di trascritti e proteine diverse, ma sempre sulla stessa porzione genomica (HBV ha un ORF con 3 siti d’inizio della trascrizione che generano 3 diverse proteine).
Altro fenomeno è la sovrapposizione (overlapping) di geni diversi: nella stessa porzione di genoma ci sono dei geni diversi, ma anche il clivaggio di poliproteine: diversi virus formano una poliproteina da un unico messaggero, che verrà poi tagliata da proteasi cellulari o virali a formare diverse proteine. In molti casi il taglio proteolitico avviene in posizioni diverse dando origine a proteine diverse appunto.
Il sistema usato prevalentemente dai Retrovirus prende invece il nome di shifting ribosomiale, slittamento della cornice di lettura: si viene a creare una struttura nell’mRNA tale per cui il ribosoma salta uno o due nucleotidi dando origine a codoni diversi; i Retrovirus fanno questo attraverso la formazione di strutture nell’mRNA che prendono il nome di pseudo-knot, regioni che hanno delle sequenze complementari ravvicinate e che si possono appaiare a formare dei loop che impediscono al ribosoma di leggere correttamente il messaggio, slittando facilmente di qualche nucleotide.
Talvolta nelle particelle virali vengono inglobati materiali di origine cellulare, ad esempio è frequente che nei virus con envelope rimangano delle glicoproteine cellulari nello stesso envelope.