Anteprima
Vedrai una selezione di 14 pagine su 62
Appunti completi per esame di Analisi dei dati Pag. 1 Appunti completi per esame di Analisi dei dati Pag. 2
Anteprima di 14 pagg. su 62.
Scarica il documento per vederlo tutto.
Appunti completi per esame di Analisi dei dati Pag. 6
Anteprima di 14 pagg. su 62.
Scarica il documento per vederlo tutto.
Appunti completi per esame di Analisi dei dati Pag. 11
Anteprima di 14 pagg. su 62.
Scarica il documento per vederlo tutto.
Appunti completi per esame di Analisi dei dati Pag. 16
Anteprima di 14 pagg. su 62.
Scarica il documento per vederlo tutto.
Appunti completi per esame di Analisi dei dati Pag. 21
Anteprima di 14 pagg. su 62.
Scarica il documento per vederlo tutto.
Appunti completi per esame di Analisi dei dati Pag. 26
Anteprima di 14 pagg. su 62.
Scarica il documento per vederlo tutto.
Appunti completi per esame di Analisi dei dati Pag. 31
Anteprima di 14 pagg. su 62.
Scarica il documento per vederlo tutto.
Appunti completi per esame di Analisi dei dati Pag. 36
Anteprima di 14 pagg. su 62.
Scarica il documento per vederlo tutto.
Appunti completi per esame di Analisi dei dati Pag. 41
Anteprima di 14 pagg. su 62.
Scarica il documento per vederlo tutto.
Appunti completi per esame di Analisi dei dati Pag. 46
Anteprima di 14 pagg. su 62.
Scarica il documento per vederlo tutto.
Appunti completi per esame di Analisi dei dati Pag. 51
Anteprima di 14 pagg. su 62.
Scarica il documento per vederlo tutto.
Appunti completi per esame di Analisi dei dati Pag. 56
Anteprima di 14 pagg. su 62.
Scarica il documento per vederlo tutto.
Appunti completi per esame di Analisi dei dati Pag. 61
1 su 62
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

ANALISI DELLA VARIANZA FATTORIALE (ANOVA fattoriale)

A più vie: vi è la presenza di almeno due fattori di trattamento, ciascuno con almeno due livelli. Nella one way abbiamo un solo predittore, qui più di una causa ipotizzata. Andiamo a vedere cosa succede alla media di y facendo dei salti sulle categoriali indipendenti. Partiamo avendo tre gruppi che hanno un trattamento e aggiungiamo un secondo trattamento: possiamo simultaneamente controllare quale è l'effetto dei vaccini booster sulla conta anticorpale e quale è la reazione anticorpale quando viene anche somministrato il vaccino antinfluenzale. La prima variabile aveva 4 livelli (non trattato e trattato con 3 booster diversi) e il secondo trattamento ha 2 livelli (non trattato e trattato con antinfluenzale): quanti gruppi ci servono? 8 perché ci saranno le persone che non avranno ricevuto nessuno dei due, no booster e si antinfluenzale, un booster e antifluenzale e così via. Quando siamo di

fronte a questa famiglia di modelli di ricerca più sofisticati in cui il numero di gruppi è funzione del numero dei livelli (4 per 2). I gruppi saranno 8+4+2 perché questi modelli consentono di controllare sia gli effetti principali dei trattamenti (mi concentro solo sugli effetti del booster ignorando se è stato somministrato anche antinfluenzale - me ne frego degli incroci dei livelli). Poi mi concentro sul secondo effetto principale (somministrare o no l'antinfluenzale concentrandomi sull'altro orlo della tavola di contingenza). Stabiliti questi effetti principali che possono essere statisticamente significativi o no mi concentro sulle combinazioni dei livelli, denominati effetti di interazione: a questo punto guarderò le 8 medie confrontandole con la media generale. Quindi quanti test F dovrò fare per sapere se c'è effetto diretto booster, effetto diretto antinfluenzale e effetti di interazione? 4: i tre che sono

I due principali effetti di interazione, ma anche un altro generale su tutto il modello.

- Deviazione tra booster sulla totale

- Deviazione tra antinfluenzale su tot

- Deviazione tra l'interazione su tot

- Movimenti compulsivi generati sulla totale

Vale per questi modelli lo stesso teorema di decomposizione della devianza con qualche elemento in più perché le bet sono tre e la within è calcolata in modo usuale (oscillazione di y di ciascun soggetto rispetto alla media del gruppo a cui appartiene, che in questo caso dipende dalla combinazione dei trattamenti). Essendo la decomposizione della devianza più sofisticata possiamo individuare... la devianza within si assottiglia(?). Riescono a esplorare meglio la devianza sperimentale distinguendola in effetti principali e di interazione. Il difetto è che più trattamenti incrocio, più si moltiplica il numero di gruppi che devo avere a disposizione, quindi posso trovarmi ad avere pochi casi.

età e genere.

età e genere; metto anche eta quadro aprziale. Di default compila un modello saturo, cioè con tutti gli effetti (se non volessimo stimare l'interazione basterebbe toglierla). Test di omogeneità e normalità. Grafico Q-Q mette in ascissa i quantili teorici ossia come dovrebbe essere la distribuzione se ci fosse normalità e in ordinata - - -. In anova non è essenziale perché è già il test di normalità, in regressione sarà poi una delle cose da guardare. Analizzando la tabella "anova" capisco che sono significativi soltanto gli effetti singoli, mentre l'interazione ha una probabilità di errore di 0.129, cioè sbaglio il 13% delle volte. Test F: il genere spiega da solo il 31% della variabilità, le classi di età il 4% quindi la vera variabile esplicativa è il genere (lo vedo dall'eta quadro). Dai confronti posthoc vedo che i confronti tra

Classi di età 1-2 e 1-3 sono significativi, 2-3 no perché ha p=0.898. Non vado oltre a fare post-hoc se non c'è effetto principale. Per quanto riguarda il genere è significativo, quindi vuol dire che c'è una differenza nell'altezza tra maschi e femmine. Facciamo sia le marginali delle due variabili singole che dell'interazione.

Le medie crescono in funzione delle classi di età solo tra 1 e 2. Il balzo più grande è quello tra maschi e femmine, perché c'è un grande scalino tra i due segmenti.

Come calcoliamo i parametri, ossia il nucleo della soluzione di questo modello? Se vogliamo calcolare l'effetto diretto del genere i parametri che lo determinano.

La media totale dell'altezza (che trovo nelle descrittive) è 170.

Medie Marginali Stimate - genere (t, x1)
95% Intervallo di Fiducia
genere (t, Superiore Media SE Minore x1)
1 175 0.391 174 176
2 166 0.391 165 166

maschi → 175-170= 5

166

Medie Marginali Stimate - classi d'età (z, x2)

95% Intervallo di Fiducia

classi d'età Medi SuperioSE Minore(z, x2)
1 168 0.479 167 169
2 171 0.479 170 172
3 172 0.479 171 173

REGRESSIONE LINEARE

È un modello molto simile all'anova; modello di dipendenza. 2 set= tecnicamultivariata.

Relazione dipendenza tra cardinali e 1 o più var. indipendenti anch'esse cardinali.

Possono essre inserite anche le var. fantoccio, riscrittura di categoriali (in quel casocombinazione tra regressione lineare e anova).

L'obiettivo sarà capire quanto ogni variazione unitaria di x induce una moviemntazione in y: se la induce, se è positiva o negativa e quanto è ampia.

C'è un duplice uso:

  • Mero schema di interpolazione di una nube di punti senza alcun assutno teoricostatistico, si trova solo la funzione che descive la nube di punti che descrive lerelaizone tra due variabili o più; queste equazioni possono

Essere scritte senza assunzioni teoriche, si fa solo lo studio della funzione che meglio rappresenta la relazione; in questo caso, come sempre negli schemi si ha solo la prima scomposizione (bersaglio determinato dal bersaglio riprodotto + componente di distorsione che è lo scarto tra il bersaglio osservato e quello riprodotto); voglio studiare solo il legame funzionale, non la causalità; stimo un'equazione ma non faccio inferenze, cerco solo la migliore rappresentazione stilizzata della relazione; se la uso in questo modo uso uno schema, faccio un utilizzo descrittivo di questi modelli, ma avviene di solito in altre discipline diverse dalla psicologia. Interpolazione non è sinonimo di correlazione.

Modello teorico e poi statistico; è un'equazione che al termine ha una componente erratica; questo modello è la variante cardinali dell'anova; in questo caso, come sempre con i modelli, si hanno entrambe le scomposizioni (il bersaglio osservato del

modello è funzione del valore vero + una parte aleatoria che ha perturbato la realizzazione campionaria del bersaglio); in questo caso stiamo producendo una teoria e questo vuol dire che al pari di quello che facciamo in anova, facciamo assunzioni molto forti (y dipende dai valori che assume x); nel caso ideale abbiamo uno studio longitudinale in cui le x precedono le y (una causa si manifesta prima di un effetto); spesso in psi non abbiamo dati di questo tipo, quindi dobbiamo riuscire ad argomentare che le nostre x sono antecedenti ad y. Allora come possiamo fare? Un modello di questa natura funziona se la x non è ad esempio un comportamento, ma sono punteggi di costrutti intrapsichici che immaginiamo essere antecedenti alla y. Un altro caso più frequente è quello in cui rileviamo i dati nello stesso momento e non possiamo ipotizzare che le x arrivino prima e talora la dipendente non è neanche un comportamento. Se cerco di spiegare l’esaurimento emotivo

comeesito del rapporto con l'organizzazione è esaurimento è un costrutto intrapsichico e anche il rapporto con l'organizzazione, stanno tutti sullo stesso piano di costrutti latenti che rilevo pure nello stesso momento; quindi abbiamo bisogno di una teoria molto solida che dica che non c'è un corto circuito logico tra queste variabili che stiamo mettendo in relazione. I modelli anova nascono da fisher maggese dei campi. Questi invece nascono principalmente da Galton, imparentato con Darwin, e studiava la regressione verso la media, un principio sviluppato da lui per spiegare la trasmissione dei caratteri ereditari; si era accorto che i figli di genitori molto alti erano più bassi dei genitori e viceversa: cioè i figli di individui eccentrici sulla media tendevano a regredire verso la media; da qui esce fuori questo modello. Lineare: se cerco di interpolare una nube di punti che illustra una relazione, sto parlando di una funzione di una<p>retta.Regressione lineare semplice Yi=&alpha;+BxiAd esempio sto dicendo che l’altezza dei figli (yi) dipende linearmente dall’altezza deigenitori (xi). Dal punto di vista geometrico abbiamo a che fare con modelli lineari(rette).</p> <p>&Beta;Beta illustra il legame funzonale tra x e y, ci dice quanto si sposta y in funzione diuna variazione unitaria di x, tenuto conto del punto di partenza dovuto allapopolazione (alfa). Questo parametro beta può essere sia positivo che negativo. Se ilgenitore è molto alto beta sarà negativo ad esempio, perché sta regredendo (teoria diregressione della media). Questa variazione è sempre costante. Beta è il coefficienteangolare della retta, quindi più è grande, più le retta è inclinata e quando è pari a unola retta è inclinata di 45 gradi. Se beta vale zero non c’è alcuna relazione tra x e y.Alfa alfa non esiste e beta è</p>
Dettagli
Publisher
A.A. 2022-2023
62 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Alib1 di informazioni apprese con la frequenza delle lezioni di Analisi dei dati e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli studi di Torino o del prof Loera Barbara.