Anteprima
Vedrai una selezione di 3 pagine su 7
Statistica Aziendale Pratica Pag. 1 Statistica Aziendale Pratica Pag. 2
Anteprima di 3 pagg. su 7.
Scarica il documento per vederlo tutto.
Statistica Aziendale Pratica Pag. 6
1 su 7
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

C D

γ = N N

+

C D

Se il numero di coppie possibili è elevato (alto numero di unità statistiche) impiegare una

tabella che riassume le distribuzioni e applicare il sistema sugli appunti.

→ ρ

Variabili qualitative ordinali con un numero di modalità elevato indice : ordinare le

 varie unità statistiche secondo il valore di una singola colonna e assegnare un rango crescente

dall’alto (se vi è parità fare una media di quelle pari es 3,5); ripetere per la seconda colonna che

d

si vuole confrontare e applicare la formula ( è il rango):

n

∑ 2

6 d i

i=1

ρ=1− 2

n(n −1) →

Variabili quantitative covarianza e coefficiente di correlazione lineare:

 n

∑ x x x x

( −́ )( −́ )

ih n ih j s

i=1 hj

s r

= =

hj hj

n σ σ

h j

5 - ANALISI DEI PROFILI DI RIGA →

Variabili qualitative sconnesse politoniche Indice di Sneath: si verifica se le due unità

 d

scelte hanno lo stesso valore per ogni variabile ( assume valore 1 se uguali 0 viceversa),

ir

attraverso la formula:

p

∑ d ir , k

k=1

d p è il numero di variabili)

= (

ir p →

Variabili qualitative sconnesse dicotoniche matrice: se si hanno solo due modalità di

 a b

risposta, si crea una matrice con numero di caratteri presenti in entrambe le unità,

r i c d

numero di caratterisi presenti in e assenti in , viceversa e assenti; poi si

applica una delle due formule a piacimento, il simple matching o l’indice di distanza di Jaccard:

d c)/ p d b+ c c)

=( )

=(b+ /(a+b+

ir ir

Variabili qualitative ordinali: metodo precedente o anche distanza euclidea assegnando un

 punteggio crescente alle modalità ordinali delle variabili;

Variabili quantitative distanza euclidea; si calcola dunque per ogni variabile la differenza

 tra i due valori elevata al quadrato, e poi fatta la somma si fa la radice:

1

[ ]

p 2

2

d x

( )

= −x

ir ik rk

k=1 x x

−́

ik k

z

In questo caso è forse necessaria la standardizzazione di tutti i valori e

=

ik σ k

l’applicazione di un eventuale coefficiente di ponderazione.

Variabili di diversa natura indice di distanza di Gower: la sua formula è la seguente:

 p

∑ d ir , k

k=1

d =

ir p

∑ σ ir , k

k=1

σ assume valore 1 se le variabili sono confrontabili oppure 0 viceversa, e quindi elimina le

k

coppie che non sono confrontabili; la parte precedente invece dipende dalla variabile :

Se le variabili sono quantitative si fa valore assoluto della differenza fratto range

o

∣ ∣

d x

= −x /range (x )

ir ,k ik rk k

Se la variabili sono qualitative ordinali si applica la trasformazione a quantitative;

o Se la variabile è qualitativa sconnessa politomica vale 1 in caso di modalità diversa e 0

o altrimenti;

Se la variabile è qualitativa sconnessa dicotoniche vale lo stesso discorso.

o

6 - METODO AGGREGATIVO DEI GRUPPI IN AZIENDA

Viene presentata una matrice con le distanze tra le varie unità statistiche (possibilità di doverne

calcolarne una o due? Vedi sopra in caso). In seguito:

Se le variabili sono quantitative utilizziamo il metodo della distanza Euclidea: si seleziona dalla

 matrice la distanza minore e si uniscono le unità corrispondenti. In seguito si calcola la distanza

rispetto alle altre unità impiegando il legame singolo (si sceglie il minimo tra i due), il legame

completo (il max) il legame medio o il centroide (la distanza è calcolata rispetto alle medie dei

d x , x

́ ́

due gruppi che si vuole calcolare ) o ancora il metodo di Ward, che consente

=d ( )

JM J M

nel calcolare:

n p k p

2

∑ ∑ ∑ ∑

2 2

( )

devianza totale= x x devianza trai gruppi= x x

( )

−́ ́ −́

is s hs s

i=1 s=1 h=1 s =1

n

k p

h

∑ ∑ ∑ 2

devianza entroi gruppi= x x

( )

−́

ihs hs

h=1 i=1 s=1

Per scegliere bisogna tenere conto che:

• Per variabili qualitativi non si possono impiegare Ward e centroide;

• Se ci sono valori anomali meglio impiegare centroide e legame singolo

• Se vogliamo gruppi di simili dimensioni conviene usare Ward e legame completo;

• Se vogliamo gruppi con bassa varianza interna conviene usare il legame medio;

In seguito, effettuate tutte le possibili aggregazioni, si decide quando fermarsi consultando prima il

dendogramma (asse x unità statistiche asse y distanza), in caso lo scree plot (asse x distanza, asse y

numero gruppi) e ancora i rapporti di fusione (1° colonna numero gruppi 2° colonna distanza

' 2

attuale/distanza successiva). Infine si interpretano i risultati impiegando :

l R

dev.tra dev.entro

2

R al crescere i risultati migliorano

= =1−

dev.tot. dev.tot

7 - METODO NON AGGREGATIVO DEI GRUPPI IN AZIENDA

k

Il metodo è quello delle medie ed è basato su 6 passaggi:

k

- Si scelgono centri in modo casuale;

- Si raggruppano le unità in base al loro centro più vicino;

- Si calcolano i centroidi di ogni gruppo cosi formato; x

́

- Si calcola la distanza di ogni unità rispetto ad ogni centroide con il metodo euclideo:

( )

h

p

∑ 2

x x i=1, … ,n ; h=i , … , k

( )

−́ ∀ ∀

is hs

i=1 Si ricollocano le unità che presentano una distanza minore ad un centroide esterno

- Si ricalcolano i centroidi dei gruppi

- Si ripetono i due passi sopra fino a che le unità non si spostano più

2

Anche qui si interpretano i risultati con l’ .

R

8 - ANALISI DELLE COMPONENTI PRINCIPALI IN AZIENDA

1. Caso - Si parte con tre tabelle: quella dei valori standardizzati Z (senno standardizzare se

occorre - andando a misurare la varianza di tutti gli indici e osservando se si discostano di

molto) dei vari indici per le aziende, la matrice di correlazione tra le componenti principali e i

vari indici T, la matrice degli autovettori V. Se viene richiesto il calcolo di un autovettore,

questo è la varianza della prima componente principale

2. Si parte con tre tabella: quella dei valori standardizzati Z, la correlazione tra le variabili

λ

originarie e la matrice degli autovettori V; vengono inoltre dati i valori dei vari autovettori .

A questo punto bisogna trovare quali due tra quelli dati spiegano la maggioranza della varianza;

λ λ

una volta trovati questi due, poniamo e , si trovano per entrambi le correlazioni con

1 2

i vari autovettori, semplicemente moltiplicando questi per le varie colonne. Alla fine si deve

rappresentare sul grafico delle osservazini le posizioni delle aziende rispetto ai loro punteggi

nelle componenti principali

9 - STIMA CON I MINIMI QUADRATI β , β

Vengono assegnate le stime delle variazioni di utilità, dunque i vari ecc; è quindi subito

0 11

β

possibile calcolare i livelli di uno stimolo sommando all’attributo gli altri attributi elencati; si

0

β

ripete la procedura (se possibile poiché servono i vari per ogni consumatore) per tutti i

consumatori e per tutti gli stimoli per ottenere una tabella. Di questa tabella bisogna evidenziare, per

ogni consumatore il suo stimolo preferito e sommare dunque le preferenze per stimolo. A questo punto

si possono calcolare le preferenze per ogni stimolo date da:

preferenze

q =

1 num consumatori β

Si calcola poi l’importanza relativa degli attributi; dati i valori di si fa il valore massimo meno il

I

valore minimo, valore minimo assunto 0 se l’attributo ha un solo livello. Si avrà poi che è data da

quel valore ottenuto fratto i vari valori sommati tra loro. Confrontando si trova quale attributo è

considerato più importante.

10- CONTROLLO STATISTICO DELLA QUALITA PER VARIABILI - RICONTROLLA

2

μ

Vengono assegnate delle variabili di controllo ovvero e e una tabella con vari campioni e i

σ

0 0 LC =μ

loro risultati per i vari prodotti, con affianco la media di questi. Si calcola dunque il , il

0

√ √

2 2

e . Si rappresentano poi i vari

UCL=μ σ prodotti LCL=μ σ prodotti

+3 /num −3 /num

0 0 0 0

valori su un grafico (asse x etichette delle righe, asse y valori) e si verifica se rientrano sempre nei

UCL LCL

disegnati e , nonché se mantiene un andamento costante oppure si sta lentamente

spostando fuori dalla media di controllo.

11 - CONTROLLO STATISTICO DELLA QUALITA PER ATTRIBUTI - RICONTROLLA

μ LC

Data una tabella viene assegnato un valore che non è altro che il nostro e si calcola

0

2 2

UCL dato da e (se negativo si pone uguale a 0).

μ σ μ ×(1−μ n LCL=μ σ

+3 =μ + )/ −3

0 0 0 0 0

Si rappresentano poi i vari valori su un grafico (asse x etichette delle righe, asse y valori) e si verifica

UCL LCL

se rientrano sempre nei disegnati e , nonché se mantiene un andamento costante

oppure si sta lentamente spostando fuori dalla media di controllo.

12 - CONTROLLO DEL PROCESSO PRODUTTIVO CON IL TEST ANOVA

Viene mostrata una tabella in cui vi sono nelle colonne i livelli dell’attributo e nelle righe i risultati nei

n

campioni esaminati. Da questa si calcolano le medie per i vari livelli, e la media generale (se il dei

campioni è fisso basta fare la media delle altre medie). Si trovano poi i valori di SSB(unico) e dei vari

SSW (uno per livello) dati da: n

[ ] ∑

SSB=numerosità campioni× y y y y …

( ) ( )

́ − ́ + ́ − ́ SS W y y

= − ́

( )

1 2 j ij j

i=1

SS W

SSW

Inoltre si calcola il totale, dato dalla somma dei vari . Si costruisce poi la statistica

J

tesi: nk

SSW dove k del fattore

/(¿−k ) =livelli

SSB/(k −1)

f = ¿ α 1−α

Viene assegnato un valore di , altrimenti scegli 0,05, e si calcola ; si verifica la tavola di

F

α

Fisher con il corretto cercando il valore di (il primo valore indica la colonna, il

k−1, kn−k

H

secondo la riga). Si rifiuta se il valore ottenuto nella testi è maggiore del valore individuato.

0

13 - CONTROLLO DI QUALITA NELLA REVISIONE CONTABILE

Ci viene dato il numero delle fatture, il numero di fatture errate, quindi si può ottenere il numero di

fatture esatte nonché la numerosità del campione estratto. Si deve calcolare la prob

Dettagli
Publisher
A.A. 2016-2017
7 pagine
1 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Morbioli di informazioni apprese con la frequenza delle lezioni di Statistica aziendale e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Verona o del prof Mussini Mauro.