Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
● CALCOLO DI POTERE E DIMENSIONE DEL CAMPIONE
● CONTROLLO QUALITA
● STUDIO DI COVARIATE (CONFONDENTI)
● TEST STATISTICI
● CORREZIONE PER TEST MULTIPLI
● REPLICAZIONE DI RISULTATI E COMPARAZIONE
●
GENOME WIDE ASSOCIATION STUDY (GWAS)
- Cercare gli SNP associati con un fenotipo
- scopo di capire i meccanismi e trovare terapia
- predire interventi e prevenzione
GENOTYPING -> processo che permette di identificare il genotipo di un
organismo mediante test biologici. Si può effettuare utilizzando diverse
tecniche come l’analisi dei microsatelliti, degli SNPs, dell’AFLP..
macroarray (dove si inserisce e distribuisce il DNA preparato appositamente)
scanner che scarita tutti i dati 148
per ogni polimorfismo ottengo questo che identifica omozigoti, eterozigoti e
Frequenza del B-allele e LogR Ratios
Format di file per questo tipo di studi (SOFTWARE PLINK)
149
Identificazione di profili genetici distinti per diagnosi cliniche
complesse
Nell'ambito delle diagnosi cliniche complesse, individuare profili genetici distinti può
essere cruciale per differenziare patologie con fenotipi sovrapposti. Ad esempio,
nella sindrome di Marfan e altre malattie cardiovascolari simili, dove i sintomi
possono sovrapporsi, l'analisi genomica può aiutare a distinguere tra diverse
condizioni e guidare la diagnosi e il trattamento.
Controllo di qualità e analisi delle covariate nel processo di
ricerca genetica
Nella ricerca genetica, il controllo di qualità è essenziale per mitigare i falsi positivi
derivanti da errori di genotipizzazione e per affrontare la complessità delle covariate.
Le covariate possono confondere la relazione tra le variabili genomiche e la malattia,
pertanto è cruciale studiarle attentamente per garantire la correttezza delle analisi.
Inoltre, il test statistico applicato deve essere adatto alla natura delle variabili in
esame, che possono essere categoriche o continue.
È fondamentale correggere per i test multipli per evitare falsi positivi e replicare i
risultati per verificare la consistenza. Il controllo di qualità riguarda sia i marcatori
genetici che i soggetti coinvolti nello studio, con l'obiettivo di garantire la coerenza e
l'affidabilità dei dati.
Controllo di qualità e confondenti nel processo di ricerca
genetica
Il controllo di qualità è fondamentale nella ricerca genetica per identificare e
correggere errori nella genotipizzazione dei soggetti e dei marcatori. Inoltre, è
cruciale considerare i fattori di confondimento, come il background genetico, per
garantire la correttezza delle analisi. Un background genetico simile tra casi e
controlli è essenziale per ridurre il rischio di falsi positivi. Le analisi possono
includere modelli di interazione tra geni, sebbene siano complesse e richiedano una
considerazione attenta. Il risultato degli studi (incorporando le interazioni non
p-value
standard GWAS) è espresso tramite il , con una soglia THRESHOLD
genomewide di solito intorno a 10^-8, considerando la capacità di correggere per il
numero di test effettuati (solitamente tra 500mila e 1M di test e pensando alla
correzione di test multipli di Bonferroni* quella è più o meno la soglia considerata
per un genom wide). (VEDI MAHNATTAN PLOT SOTTO) 150
Le promesse di GWAS erano quelle di completamente identificare la base genetica
per l’ereditarietà nelle malattie e nei tratti complessi. Il primo fu fatto nel 2005 e da
allora ci sono stati migliaia di studi, centinaia di migliaia di individui testati, centinaia
di miliardi di SNPs genotipizzati, molti miliardi di $$$ investiti.
Le promesse da una parte sono state soddisfatte infatti sono state trovate molto
associazioni. Sono state imparate molte lezioni:
- poche associazioni molto forti sono nelle regioni del coding
- la maggior parte delle associazioni sono negli elementi regolativi
(ENHANCERS che aumentano l’attività trasrizionale di un gene e
SILENCERS l’opposto inibendo l’espressione genica). Questi agiscono a
distanza dal gene che regolano. Nel 83% spesso è così. Queste zone del
DNA venivano chiamate JUNK DNA (termine coniato da un genetista
giapponese negli anni 70, Susumu Ohno) perché sembravano non avere una
funzione biologica diretta nella codifica Tuttavia negli anni successivi
queta idea è cambiata.
- alcune di queste associazioni sono nei deserti genetici
Quality - Control
SUBJECT QC
●
- sex check
- call rate
- identificare relazioni parentali
MARKER QC
● - tasso di genotipizzazione
- missing ratio 151
- MAF
Metodi per gli Association Test
- STANDARD GWAS —> METODI UNIVARIATI
- INCORPORANDO LE INTERAZIONI —> METODI MULTIVARIATI
(si usa in settori particolari e sono più difficile quando abbiamo nei set e
non su larga scala)
esempio di test p-value per incorporazione delle interazioni
(manhattan plot)
un "Manhattan plot" è un tipo di grafico utilizzato nell'analisi genomica per visualizzare i
risultati di uno studio di associazione genetica. Questo tipo di grafico mostra la
significatività statistica delle varianti genetiche testate rispetto alla loro posizione sul
genoma. Le varianti genetiche sono rappresentate sull'asse orizzontale in base alla loro
posizione fisica sul cromosoma, mentre sull'asse verticale è riportato il valore del test
di associazione (generalmente -log10 del p-value). Le varianti genetiche che mostrano
un'associazione significativa con la condizione studiata si evidenziano come picchi
distinti nel grafico, creando una forma simile ai grattacieli di Manhattan, da cui deriva il
nome "Manhattan plot".
I "p-value" sono valori utilizzati in statistica per valutare la significatività di un
risultato di un test statistico. Rappresentano la probabilità che i dati osservati siano
dovuti al caso, considerando l'ipotesi nulla come vera. Un p-value inferiore a 0,05 è
generalmente considerato statisticamente significativo, indicando che vi è una bassa
probabilità che i risultati osservati siano dovuti al caso ergo una maggiore evidenza
contro l’ipotesi nulla. Tuttavia, è importante notare che un p-value significativo non
implica necessariamente che l'effetto sia grande o clinicamente rilevante, ma solo che è
improbabile che sia dovuto al caso. Inoltre, il p-value dipende dal contesto dello studio e
dalla scelta del livello di significatività appropriato. 152
Limiti degli studi di associazione genomica ampia (GWAS)
Gli studi Genom Wide Association (GWAS) hanno contribuito significativamente alla
comprensione della genetica, ma gli studi GWAS spieganos solo una ridotta quantità
dell’ereditarietà. Sebbene abbiano rivelato l'importanza di elementi regolativi e
regioni non codificanti nel DNA, hanno affrontato sfide nel spiegare la maggior parte
della ereditabilità delle malattie complesse.
Gli studi hanno evidenziato la complessità delle interazioni genetiche e il ruolo delle
varianti rare, aprendo nuove direzioni di ricerca nell'ambito dell'epidemiologia
genetica. 153
Si parla quindi mancata erediterietà. Alcuni esempi sono:
- tratti antropometrici come ALTEZZA e BMI
1. negli studi sulle famiglie e sui gemelli, circa l’80% della variabilità dell’altezza è
ereditabile lo stesso per il BMI
2. MA nei grossi studi GWAS (n > 40K) hanno trovato una spiegazione di SNP di
circa il 10% della variabilità dell’altezza e < 20% del BMI
- malattie come la schizofrenia, problemi cardiaci, cancro, obesità etc…
1. l’ereditarietà varia dal 30-80%
2. MA per nessuno di questi, gli studi GWAS hanno dato più 5-10%
Per tutti i tratti complessi investigati rimangono grossi GAP…
COME SI SPIEGA LA MANCATA EREDITARIETA? TEORIE:
- complessi PATTERN di interazione tra SNPs
- varianti rare non coperte dai GWAS: ogni famiglia ha la sua mutazione
- effetti EPIGENETICI: ereditarietà non è affatto nel genoma
Il ruolo delle varianti genetiche nelle malattie complesse
Le varianti genetiche rare, anche se singolarmente poco frequenti, possono
contribuire in modo significativo alla suscettibilità alle malattie complesse quando
presenti in combinazione e sono molto frequenti nei soggetti perché la nostra unicità
è data anche dalla presenza di polimorfismi . Gli studi sugli aggregati di queste
varianti hanno aperto nuove prospettive nella ricerca genetica, consentendo di
identificare geni associati alla malattia attraverso l'analisi del carico mutazionale nei
malati rispetto ai sani.
Questo approccio permette di individuare nuove vie patogenetiche e comprendere
meglio il contributo delle varianti rare nella patogenesi delle malattie. 154
immaginando che il fenotipo sia il livello dell’acqua: posso farlo salire allo stesso
livello e quindi farlo manifestare mettendo nel bicchiere con un assortimento di
varie cose
Problemi principali con le varianti rare:
> hanno bisogno di campioni di grandi:con MAF 0.1 (il 10%) ho bisogno di 4.600
con OR = 1.5, se ho MAF 0.01 (1%) ho bisogno di 54.000, se ho MAF (0.1%) avrò
bisogno di 540.000
> non posso fare studi di associazioni
> le analisi tradizionali sulle varianti singole hanno basso potere statistici e/o non
sono validi 155
> perché il numero di varianti rare è molto più grande del numero delle varianti
comuni, posso essere necessari livelli di significatività stringenti, riducendo il
potere ulteriormente.
> la mggioranza delle SNVs ha un MAF < 1 x 10-6
Ruolo dei test aggregativi nelle valutazione delle varianti
genetiche rare
TEST BASATI sull’aggregazione di varianti (BURDEN TESTS) —>
● aggregano le informazioni in un unico punteggio di rischio consentendo di
valutare la suscettibilità a determinate malattie. Usano “Collapsing
Approaches” ovvero combinare considenrando GENE+Percorsi+annotazioni
funzionali etc… Usano la PESATURA (Weighing) ovvero pesare
considerando la tipologia di variante (FUNZIONE PREDITTIVA) o la
freuenza di variante. Se ci aspettiamo che il carico mutazionale non sia
altro che un FATTORE DI RISCHIO (esempio: tumori) allora possiamo
usare un BURDEN TEST —> perchè nei malati ci sono dei geni
frequentemente con un carico mutazionale di varianti rare più alto
significativamente rispetto ai sani.
Esempio: Nel Gene X il sign. pinco pallo quante varianti genetiche con una MAF
sotto l’1% ha?---> ne ha tot X (variabile personale) carico mutazionale posseduto.
Cercano i geni dove si accumulano più varianti rispetti ai sani.
Esempi di BURDEN TEST son