Estratto del documento

Introduzione dati

Campionario, scelgo di sottoporre un parte di

questa parte

Il mio campione è rappresentativo della popolazione solo

quando questo è un campione casuale semplice!

  • può essere con reinserimento
  • può essere senza reinserimento

Viene campione seleziono il mio campione che numeri viene scelto

secondo un determinato criterio, un esso se non può

rappresentativo più rappresentativa per essere X - M e il mio

schema di comportamento.

Variabile

Variabile, caratteristica assunta da una unità statistica, può

essere qualitativa e quantitativa.

  • qualitativa
    • non misurabile
    • namo o attenente
    • nominali
    • ordinali
  • quantitativa
    • misurabile
      • discreta, quando derivata
      • da un controllo presideniale
      • solo valore ruteri
      • continua, può avere qualsiasi
      • valore all'interno di un
      • determinato intervallo.

introduzione dati

campionamento, scelgo un sottoinsieme che mi permette di fornire delle conclusioni generalizzando a tutta la popolazione.

Il mio campione è rappresentativo della popolazione solo quando questo è un campione casuale semplice!

  • può essere con reinserimento
  • può essere senza reinserimento

Un campione seleziono e mi compone delle nuvole viene scelto rispondendo un determinato criterio, se esso sarà così può rappresentare in maniera accurata la popolazione.

Ogni campione può rappresentare un errore X-M è il mio errore di campionamento.

Variabile, caratteristica assunta da una unità statistica, può essere qualitativa e quantitativa.

  • qualitativa
    • non misurabile
    • nome o etichetta
    • nominali
    • ordinali
  • quantitativa (misurabile)
    • discreta, può essere derivato da un conteggio possedendo solo val an ridotte
    • continua, può avere qualsiasi valore all'interno di un determinato intervallo.

scale di misura

  1. scale nominale, prevede un'organizzazione dei dati in categorie che prevedono l'etichetta e il permesso di fare comparazioni; non esistono ordini, sono solo semplici nomi.
  2. scale ordinale, prevede di ordinare e categorizzare secondo un ordine crescente o decrescente, come si passa dallo storico al studente incredibile che ha maggiori capacità!
  3. scale di intervalli, prevede un'operazione che detta un valore che possa essere calcolato tra le differenze tra due campioni della scala di misura.
  4. scale di rapporti, prevede che i dati possano esprimere rapporti tra di loro, una persona dice che, per esempio una "0" è doppio del 1, tutte scale misurano con le stesse unità, con rapporti più costante lo zero cosa che non è presente nelle altre scale da misurare!

importante!!

Statistica Descrittiva

Media μ (pop) ̅ (campione)

Mediana

Moda

Rettilinea

Devianza

Varianza

Dev. St. o Comparare

Forme distribuzione

  1. determinare max e min
  2. calcolare range (max-min) di emissione
  3. calcolare intervallo [3,322log10]
  4. calcolare ampiezza
  5. costruire le classi

Quartili

Intervallo I Q = Q3-Q1

BartBi Outlier

Frequenza

Statistica descrittiva dati in classi

Media nelle classi

Xi: valore centrale classe

first + last / 2 = Xi

X̄ = Σ Xi · mi / Σ mi

  • 2.4 - 4 - 9.6
  • 3.2 - 4 - 12.6
  • 3.9 - 1 - 3.9
  • 2.7 - 3 - 8.1

Mediana nelle classi

Posizione Mediana m/2 + (m/2 + 1)

mediana valore = Li + (m/2 - F/fm) · l dove

  • Li = limite inferiore classe Mediana
  • F = somma frequenze delle classi inferiori oltre classe Mediana
  • fm = frequenza classe Mediana
  • l = ampiezza classe Mediana

Moda nelle classi

Si ricerca la classe modale ovvero la classe con la f più alte.

Statistiche campionarie

X̄, s, s²

Parametri della popolazione

μ, σ, σ²

Coefficiente di variazione

CV = S/X̄

Per campione

σ/μ

per popolazione

statistica descrittiva definiz. 1.2

Devianza

  • ∑(xi - μ)2 per pop
  • ∑(xi - x̄ )2 per campione

Varianza

σ2 = ∑(xi - μ)2 fi per pop/N

s2 = ∑(xi - x̄ )2 fi per campione/N - 1

Dev. st

σ = √∑(xi - μ)2 fi per pop/N

σ = √∑(xi - x̄ )2 fi per campione/N - 1

grafici di dati

Istogramma

sull'asse delle frequenze posso avere quelle relative Fi/totale o le frequenze in percentuale

F/totale x 100; osservazione breve su distribuzione dei dati, ottimo analisi rappresentativa

Poligono di Frequenza

spostato dei prende le ascisse in corrispondenza dei punti medi delle classi

Curva ogiva

grafico delle frequenze cumulate o curve ogiva; spostato lineare crescente; ci consigliare sulle frequenze anclie delle classi, posso osservare tale quanti valori sono un unitario valore

Diagramma Ramo-Foglia

  • Ramo Cunità|Foglie [decimi]

3 | 2 9

4 | 4

5 | 9

6 | 3 3 4 7 8 8

7 | 0

Multiformato utile in campo probabilinte, utile suo verso poiché stabile ci su frequenze osservazione. In questo mandano le ante ;) metere alci dati, sono alcune cerozzioni per esempez

Diagramma a Torta

  • Incendi
  • Esui de Fuoco
  • Veleno
  • Incidenti

Diagrammi di Dispersione

diagramma in cui ogni punto dipende da 2 variabili, e se più trai posso una retta di correlazione. Perché si vedere qualcosa tra due due variabili si è pueda ni pi del corraleazione.

Redie, dev.st e varianza distribuzione probabilità

µ = ∑x · P(x)σ² = ∑(x - µ)² P(x)√ = √∑(x - µ)² · P(x)

µ, σ², √ binomiale

µ = m · pσ² = m · p · q√ = √m · p · q

p = probabilità di esito

q = probabilità evento contrario q = 1 - p

Probabilità binomiale

P(x) = mCx = m!/(m-x)! x! · px · qm-x

Distribuzione binomiale

Calcolare le probabilità con una distribuzione binomiale posso usar excel sulla variabile con calcolando le probabilità. Command su dei dati. X ≤ 3300 custodia!

Distribuzione Poisson

P(x) = µx · e / x!

µ = µ(m · p)σ² = µσ = √µ

X indossa il numero di volte in cui si è verificato un evento in un determinato intervallo di tempo, spazio, volume, o t.zo.

Le probabilità di Poisson viene usato per il calcolo delle probabilità di tale evento io su determino intervallo specifico.

Distribuzione Normale

Trasformo una distribuzione normale in una distribuzione standard normale con processo come parallelizzare (μ=0 σ=1).

μ -> X

σ2 -> S2

σ -> S

Intervallo confidenza per media con T Stode.

X Medio Campionario

  • E=Zα/2 · σ/√n

X - E

X + E

Estremo Intervallo Confidenziale

Excel Socio = INV.NORMS

Intervallo Confidenza per Media con σ (non nota)

Dato che non conosciamo sempre σ allora possiamo usare la s del campione per stimarlo, facendo ciò usiamo uno stimatore di un parametro "incertezza" per far ciò si crea un intervallo più ampio usando valore critico tα/2 invece che z di distribuzione normale t Student.

t = X̄ - N / s / √m

gradi libertà = m - 1

E = tα/2, s / m

X̄ - E      X̄ + E      estremi intervallo

t ha m-1 gradi di libertà

α =

  • 5,0% = 0,05
  • 1,0% = 0,01
  • 10,0% = 0,10

Scelta Distribuzione

σ nota?

    • proporzione nodale
      • Sì - usare z distribuzione normale
      • No - m>30?
    • No
  • No
    • proporzione nodale
      • Sì - m>30?
      • No - usare distribuzione t Student (rari fattori)

dev.st delle medie campionare / m n.del campione singolo

Federico T.

p̂= proporzione

m/ totale

E= zz/2 √p̂p̂/m

p̂: statistico p popolazione

q̂: statistico q popolazione= 1-q̂

zz/2 numerici solito

50%: = 1,96 1% valore assoluto

p̂-E p̂+E estremi intervallo confidenza.

Test statistico z per la media:

z calcolato= zz/2 = 1,96 (2=5%(0,05))

Test z = X̄-μ

σ/√m valori standard

Se

Test z > z calcolato

allora

rifiuto l'ipotesi nulla con una probabilità di errore inferiore al 5% (per esempio)

p value = area a destra o sinistra o entrambi ee

ht2 delle code dello statistic test

se p value ≤ 2 allora rifiuto Ho!!!

Test statistico t per le Medie/μ

σnon nota

α=0,05

test t: ⨯̄ - μ/S/√n errore standard

  • se test t > t critico allora rifiuto e ipotesi H0

Test z per la differenza tra Medie

  • z critico α=0,05 5% (z ≥ 1,96)
  • test z: (⨯̄1 - ⨯̄2) - (μ1 - μ2)/√σ̄1²/N1 + σ̄2²/N2

μ1 - μ2 = 0 spesso

  • se test z > z critico allora rifiuto e ipotesi H0

Test t per la differenza tra Medie

t critico α=0,05 5%

INVL.T(α,gl)

test t: (⨯̄1 - ⨯̄2) - (μ1 - μ2)/√S²p + S²p

gl = n1-1, n2-1 e il più piccolo tra i due gradi di

  • se m1 ≠ m2 allora
  • p = [m(1−d)s1² + (M2-1)s2²]

m1 + m2 - 2 = gl

  • stima congiunta varianza
  • se σ̄1 = σ̄2 se σ̄1 ≠ σ̄2

e non sono uguali?

test t: (⨯̄1 - ⨯̄2) - (μ1 - μ2)/√S²p + S²p

α=0,05 5%

  • se test t > t critico allora rifiuto e ipotesi H0

Test t dati appaiati con σ non nota

t = /Sd̄ calcolato con n = m - 1 gradi di libertà

d̄ = Σdi/m media delle differenze

Sd̄ = √(Σ(di - d̄)²/(m - 1))

t critico 2 o 0,05 5% = INV.T se Test t > t critico rifiuto H0!!!

Test z per una proporzione

Test z = p - π/√π(1-π)/m

Se Test z > Z critico rifiuto H0!!!

Test chi quadro χ² per l'indipendenza

Test per l'indipendenza di due variabili

d = 0,05 sono fisse ipotesi vale H0 e ipotesi alternativa H1

Statistica Test χ² = Σ(fo - fe)²/fe

χ² critico = 0,05 = INV.CHI

Se Test χ² > χ² critico allora rifiuto H0

Esempio

Tabella Frequenze Osservate

  • Ramo SX 14 6 20
  • Ramo DX 19 21 40
  • Totali 33 27 60

Esempio

Tabella Frequenze Attese

  • Totali 33 27 60

1) La distribuzione Chi-quadro è asimmetrica al contrario della distribuzione normale e t student.

2) I valori di una distribuzione chi-quadro possono essere o uguali o far apparire maggiore di 0.

3) La distribuzione chi-quadro è differente in base ai gradi di libertà, all'aumentare dei gradi di libertà essa si avvicina alla forma della normale.

Tutti i valori sono non negativi

Correlazione e regressione lineare semplice

Se due variabili sono quantitative continue, e non x ed y sono distribuite secondo una normale allora posso calcolare rs definito come correlazione lineare semplice di Pearson

rs = CoeV (x,y) / √(Dev(x) x Dev(y)) = ∑ (x - x̄) (y - ȳ) / √(∑ (x - x̄)2 x ∑ (y - ȳ)2)

r = 1   (perfect positive)r = -1   (perfect negative)

Correlazione (valore x; valore y)

  • Positiva se ≈ vicino 1
  • Negativa si ≈ vicino -1
  • Nessuna correlazione se r uguale a 0.

Posso calcolare un test di ipotesi sul coefficiente che mi trovi se per valore di esso non è solo frutto del caso.

test t = r √(m-2 / 1-r2)

=TEST.T

tcritico =⍺ = 0,05 oppure 0,01 e m-2 gradi di libertà.

Se test t > tcritico rifiuto ipotesi nulla ovvero con la correlazione tra le due variabili x e y.

=TEST.T (valori X colonna; valori Y colonna; numero di coda; 1) dati opposti2) dati non opposti e stesso variabile3) dati non opposti e no stesso variabile)

Anteprima
Vedrai una selezione di 4 pagine su 15
Appunti Statistica Pag. 1 Appunti Statistica Pag. 2
Anteprima di 4 pagg. su 15.
Scarica il documento per vederlo tutto.
Appunti Statistica Pag. 6
Anteprima di 4 pagg. su 15.
Scarica il documento per vederlo tutto.
Appunti Statistica Pag. 11
1 su 15
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher FedericoTedde99 di informazioni apprese con la frequenza delle lezioni di Statistica e biostatistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Sassari o del prof Solinas Maria Giuliana.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community