Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
DISTRIBUZIONI DOPPIE DI FREQUENZA
Una tabella a doppia entrata elenca la frequenza delle osservazioni per ogni combinazione di classi di misura di due variabili. Il numero di celle è determinato dalla combinazione di tutte le possibili classi per ognuna delle due variabili. Una tabella con r righe e c colonne viene indicata come una tabella rxc. Si presenta una tabella a doppia entrata dove si mettono per riga e colonna un carattere e nelle altre l'altro carattere e si contano le unità statistiche che hanno congiuntamente due unità (femmine E hanno gli occhi celesti).
Le distribuzioni doppie di frequenza prendono nomi diversi a seconda dei caratteri che vengono studiati:
- Tavole di contingenza con due caratteri qualitativi
- Tavole miste sono composte da caratteri qualitativi e quantitativi (ad esempio sesso e numero di fratelli)
- Tavole di correlazione quando sono fatte da caratteri quantitativi
Quante distribuzioni si possono estrarre da una distribuzione doppia?
n. righe + n.
colonne + 2 frequenze marginali 24
La frequenza condizionata, indica il numero di elementi che possiede una determinata modalità di un carattere dato il valore assunto dall'altro carattere. Per esempio, quanti individui sono alti cm 172 dato che il loro peso è compreso tra 80 e 85 kg. (sono i numeri che si trovano facendo le combinazioni righe-colonne e per quelle relative si fa ni/N)| significa "dato che", "condizione", è una restrizione della popolazione
MISURE DELLE RELAZIONI TRA VARIABILI
Coefficiente di correlazione
Presi due caratteri quantitativi i due caratteri sono legati da una relazione lineare? Se un carattere aumenta/diminuisce l'altro aumenta o diminuisce? Sono legati da una relazione lineare? C'è una relazione positiva o negativa?
Si ha una relazione di concordanza quando a variazioni positive di un carattere corrispondono dell'altro e anche a variazione negative di un carattere corrispondono
variazionivariazioni positive/negative (++ o --) Si dice che due caratteri sono discordi se sono discordi nel segno (+- o -+). Si disegna un'ellisse che racchiuda la maggior parte dei punti. 25 caratteri sono legati da una relazione diretta, l'ellisse va verso nord est. Quando i due caratteri sono concordi, si calcola la media della x (es. 1.78) e la media della y (es. 1.058) e traccio due rette, una orizzontale e una verticale. Quello che trovo è il punto medio. La nuova origine starà nel punto (Xmedio,Ymedio). Osservo se i due caratteri sono concordi, i punti stanno nel primo e terzo quadrante nel nuovo sistema di assi cartesiani. Gli scarti semplici di x e y stanno tutti nel primo (entrambi positivi) e terzo quadrante (entrambi negativi). Si prendono gli scarti e faccio il prodotto: - Se il prodotto è positivo, sto nel primo o terzo quadrante (concordi). - Se il prodotto è negativo, sto nel secondo o quarto (discordi). Se mettessimo un pallino in cima, c'è un dato difetto della.La covarianza è una misura della relazione lineare tra due variabili. Un valore positivo indica una relazione diretta o positiva e un valore negativo indica una relazione inversa o negativa. La covarianza dipende dall'unità di misura e quindi non si tratta di un indice adeguato per valutare l'intensità della relazione lineare tra due variabili.
Nella costruzione della covarianza si valutano gli scarti della x e della y. La concordanza ci dice se esiste una relazione tra i due caratteri e per verificare l'intensità della concordanza si può rispondere a queste domande attraverso un diagramma di dispersione (o scatter plot), ossia lo strumento grafico per descrivere la relazione tra due variabili, e attraverso la covarianza e il coefficiente di correlazione lineare.
La media è un indice non robusto e viene influenzata da un dato anomalo. Se c'è un dato anomalo, non va considerato.
Il coefficiente di correlazione lineare è il coefficiente numerico più opportuno per misurare la relazione lineare tra due variabili. In generale, è un indice più utile della covarianza perché fornisce sia la direzione che l'intensità della relazione (la covarianza e il coefficiente di correlazione hanno lo stesso segno).
Il coefficiente di correlazione lineare è calcolato dividendo la covarianza per il prodotto degli scarti numerici.
Il valore dei coefficienti di correlazione lineare varia tra -1 e +1. Quando r è più vicino a +1, tanto più i punti che rappresentano le osservazioni sono vicini a una retta crescente, che indica una relazione lineare positiva. Quando r è più vicino a -1, tanto più i punti che rappresentano le osservazioni sono vicini a una retta decrescente, che indica una relazione lineare negativa. Quando r=0, non c'è nessuna relazione lineare tra x
E y, ma non necessariamente ciò implica la mancanza di un qualsiasi tipo di relazione. Con la relazione è meno potente della correlazione. Consiste nel far passare una retta dall'ellisse (ultimo disegno). 28 Se il coefficiente angolare è positivo vi è una relazione diretta tra i caratteri. Deve essere una retta che passa fra tutti i punti (come la media), deve stare a cavallo della retta ed è quella più vicina possibile a tutti qui punti.
RELAZIONI LINEARI
I modelli economici usano specifiche relazioni funzionali per indicare l'effetto su una variabile dipendente, Y, risultante dai cambiamenti nella variabile indipendente, X. Questa relazione funzionale ha equazione:
1° CRITERIO PER TROVARE LA RETTA MIGLIORE
Scelta della retta che minimizza il seguente errore totale:
Sulla base di questo criterio le due rette rappresentano ugualmente bene i dati osservati anche se intuitivamente la retta rossa dà luogo ad un "migliore".
adattamento rispetto alla retta verde. Si tratta di un problema di segno. La somma degli errori positivi compensa esattamente la somma degli errori negativi. In entrambi i casi F = 0. Tale criterio non fa distinzione fra buoni e cattivi adattamenti. 292° CRITERIO Scelta della retta che minimizza la somma dei valori assoluti degli errori: Tale criterio ci porta a scegliere la retta verde. Con tale criterio si prende la retta che congiunge i due punti estremi. Tuttavia, questa non è una buona soluzione del problema poiché non presta nessuna attenzione a tutti i punti intermedi. 3° CRITERIO Scelta della retta che minimizza la somma dei quadrati degli errori: Da un punto di vista geometrico calcolo l'area di un quadrato. Fra tutte le rette che ho prendo la retta che rende minime le somme delle aree di Trovo quella retta tale che: Dobbiamo trovare e (coefficiente di regressione lineare) 30 La probabilità Da un punto di vista assiomatico, lo studio della probabilità
è accettato dai probabilisti e matematici. Si basa su:
- Concetti primitivi, sono delle nozioni originarie e intuitive che nessuno definisce e sono tre:
- Prova o esperimento aleatorio (casuale)
- Evento
- Probabilità
- Postulati (assiomi), sono tre per costruire il calcolo delle probabilità
- Teoremi
A PROVA O ESPERIMENTO ALEATORIO CASUALE
La prova è un processo (generica operazione) la cui esecuzione porta ad un risultato che non può essere previsto con certezza (risultato incerto). A priori:
- sono definibili tutti i possibili risultati dell’esperimento;
- non è possibile dire quale risultato si verificherà;
- è possibile assegnare un certo “grado di incertezza” (probabilità) a tutti I possibili risultati dell’esperimento.
Si osservi che l’operazione che definisce l’esperimento non necessariamente prevede la partecipazione attiva del ricercatore come accade per una prova di laboratorio o per il
Lancio di un dado. La semplice osservazione di un fenomeno fisico che si manifesta spontaneamente in natura oppure l'osservazione di un fenomeno economico e sociale può essere considerata un esperimento casuale. È sufficiente che:
- Siano definibili a priori i possibili risultati che possono scaturire da una sua osservazione.
- Che non sia prevedibile con certezza il risultato di una osservazione.
- Che sia possibile assegnare un certo "grado di incertezza" al verificarsi di un qualunque risultato in conseguenza dell'osservazione.
Questi fenomeni sono anche detti fenomeni casuali. Esempi:
- Temperatura minima di domani in una certa stazione meteorologica.
- L'intensità di una certa scossa di terremoto.
- Prodotti da un'impresa del settore.
- Il numero di computer.
- Il numero di imprese che falliranno in Italia l'anno prossimo.
- Il PIL italiano nel prossimo anno.
L'esito dell'osservazione del fenomeno è ignoto.
Cioè è soggetto a incertezza. Il ricercatore si trova a dover fare delle (affermazioni) previsioni in condizioni di incertezza.
Spazio campionario è l'insieme di tutti i possibili risultati di un esperimento aleatorio. Gli spazi campionari possono essere:
- Discreti se:
- sono costituiti da un numero finito di eventi elementari. Es.: Lancio di dadi, lancio di monete, estrazione di palline.
- sono costituiti da una infinità numerabile di eventi. Es.: Numero di palline estratte prima di avere il primo successo, numero di chiamate per ora in un centralino telefonico. Questi spazi si esprimono per "conteggio", "enumerazione".
- Continui se sono costituiti da una infinità non numerabile di eventi elementari. In genere questo tipo di spazi campionari è costituito dall'insieme dei numeri reali. Gli eventi elementari in genere sono intervalli dei numeri reali. Es.: Durata di accensione di una lampadina.
altezza delle onde, fatturato.
L'EVENTO
L'evento è un qualunque sottoinsieme dello spazio campionario, generato dalla prova. Possono essere:
- Eventi elementari, un possibile risultato di un esperimento aleatorio (lancio una moneta e viene fuori testa, testa, croce)
- Eventi composti, qualsiasi insieme di eventi elementari di uno spazio campionario, formati da più eventi elementari (lancio un dado e voglio che venga fuori un numero dispari)
S, è l'evento che si verifica sempre. Lo spazio campionario stesso
Evento certo, ∅
Evento impossibile, è un insieme che non contiene nessun risultato (non si verifica mai)
Tra gli eventi si possono introdurre 3 operazioni fondamentali, qualunque sia lo spazio campionario:
- Unione: Se A e B sono due eventi in uno spazio campionario S, allora l'unione, A U B, è l'insieme