Modelli statistici per le decisioni aziendali
[ESAME: prova scritta (su tutto il programma del corso) (1 ora e mezza) che consta di due parti:
1. la prima parte: domande (vero/falso e a risposta multipla) su aspetti teorici
• risolvendo solo questa parte (cioè se non si svolge la seconda parte) si ottiene un
punteggio massimo pari a 21. (rispondere bene prendere punti; rispondere male perdere
punti; non rispondere non succede nulla)
2. la seconda parte: contiene di solito due esercizi, da risolvere illustrando il procedimento
adottato
• il punteggio ottenuto da questa parte si aggiunge al punteggio ottenuto sulla prima (se
superata)
Non sarà possibile consultare libri o appunti, ma si potrà consultare:
• forumulario
• tavole]
STATISTICA. L'arte di apprendere dai dati, capire cosa mi dicono e come utilizzarli per analizzare
il fenomeno di interesse o fare previsioni per il futuro. La statistica si divide in più categorie:
1. Descrittiva: descrive e sintetizza le caratteristiche principali di un insieme di dati e si parte
dall'assunto di base che i dati di cui disponiamo sono esaustivi riguardo a quello chde
vogliamo sapere. Quindi il compito della stat descrittiva, partendo da questo pressuposto, è
quello di descrivere come si comporta il fenomeno che stiamo studiando sull'insieme che
stiamo prendendo in considerazione. Vedremo che per descrivere i dati possiamo usare vari
strumenti come rappresentazioni grafiche, indici etc. Quindi parte dal presupposto che tutto
ciò che osserviamo è tutto ciò che vogliamo sapere.
[Contenuti:
• cosa sono i dati: cos'è una popolazione, carattere, coe si può suddividere etc.
• rappresentazione dei dati: una volta che si ha familiarità con i dati si vede come li si
possono rappresentare (distribuzione in forma tabellare per esempio)
• sintesi della distribuzione di una variabile
• analisi della relazione tra due individui
Obiettivi:
• saper interpretare delle informazioni di tipo statistico
• saper leggere e costruire/leggere una tabella o un grafico
• capire il significato (e sopratutto i limiti) delle informazioni di sintesi (medie,
varianze ecc.)]
2. Probabilità: Parte da un punto di vista totalmente diverso. Noi non possiamo osservare
tutta la popolazione, ma possiamo osservare (per limiti di tempo o di natura economica che
non ci permette di osservare tutto), quindi noi osserviamo una piccola parte di popolazione
di interesse, cioè prendiamo un campione. Quindi noi osserviamo come si comporta il
fenomeno oggetto di studio su questa piccola parte e vogliamo capire come poter
estendere/generalizzare i risultati che osserviamo sul campione all'intera popolazione. Ci
può essere un piccolo problema nel fare questo perchè nessuno mi dice che quello che
osservo sul campione possa essere esteso all'intera popolazione. Infatti ci sono dei vincoli
sia su come costruire il campione che su come estendere i risultati, perchè ciò che
osserviamo sul campione, con molta probabilità può essere esteso all'intera popolazione di
riferimento.
[Contenuti:
• probabilità elementari
• variabili aleatorie, definizione, distribuzione di probabilità, v.a. Discrete e continue,
esempi notevoli
Obiettivi
• ragionare in condizioni di incertezza, quantificandone il grado
• interpretare la quantificazione un guadagno (perdita) incerto.
• Prendere decisioni (mi conviene giocare al lotto? O al casino?; mi conviene giocare
in borsa o no?)]
3. Inferenziale: collegata al calcolo delle probabilità, qui entra il gioco il concetto di
probabilità, accompagna la statistica inferenziale la teoria della probabilità che studia i
fenomeni casuali/aleatori e ci consente di valutare la possibilità che un dato evento possa
accadere oppure no.
[Contenuti:
• il concetto di inferenza statistica
• popolazione e campione: variabilità campionaria
• stima intervallare per media e proporzione
• verifica d'ipotesi per media e proporzione
Obiettivi
• saper interpretare un'analisi statistica, valutandone la generalizzabilità,
l'affidabilità e le implicazioni pratiche.
Il corso parte dalla statistica descrittiva, poi si parla della teoria della probabilità (accenni), fino ad
arrivare a come poter estendere le conclusioni che prendiamo su un campione all'intera
popolazione(statistica inferenziale).
I) Concetti base
Le fasi di un'analisi statistica schematicamente sono:
1. definire gli obiettivi: tradurre un'esigenza conoscitiva in modo che sia suscettibile di una
risposta in termini statistici
2. individuare la popolazione
3. definire il piano di campionamento: ambito vasto che va sotto il nome di disegno
sperimentale e campionamento
4. raccogliere i dati
5. organizzare e guardare i dati: dalla massa di dati così com'è non è immediato estrarre le
informazioni che servono, si possono però sintetizzare opportunatamente e/orappresentarli
graficamente, infunzione delle informazioni cercate
6. elaborare i dati: formulare un modello per spiegare i dati osservati. Il modello potrà essere
usato per confermare o smentire delle ipotesi fatte sul fenomeno e/o per previsioni su future
istanze
II) Terminologia elementare
Popolazione: insieme degli elementi che costituiscono l'oggetto di studio. Si studia la
popolazione perchè l'obiettivo principale della statistica è proprio individuare l'oggetto di analisi. È
l'insieme degli elementi su cui focalizziamo l'attenzione. Può essere di due tipi, classificata in base
al numero di unità che la compongono:
• Finita: costituita da un numero finito di unità/elementi, possiamo sapere con esatteza di
quanti elementi è costituita la popolazione. (popolazione italiana; numero di aziende tessili a
reggio emilia; numero studenti immatricolati in Edipa, etc.
• Infinita: costituita da tutte le unità potenzialmente osservabili e non necessariamente già
esistenti fisicamente oggi e/o in futuro. (tutte le persone affette da una patologia, oggi e in
futuro; futuri acquirenti di un certo di un certo prodotto; pezzi difettosi che puòprofurre una
macchina, oggi e in futuro)
NOME ETA' SESSO TIT. DI STUD. ATTIVITA' PESO PUNTEGGIO ESERCIZIO
Rossi 32 M laurea occupato 72 65
Bianchi 39 F laurea occupato 55 55
Nicoletti 46 M diploma disoccupato 79 53
Marcelli 28 M diploma studente 63 78
Petrone 51 F diploma casalinga 64 21
Nome= Unità statistiche
Età, Sesso, Titolo di studio, Attività, Peso, Punteggio esercizio= Caratteri(o variabili) statistici
32, M, laurea, occupato, 72, 65= Modalità
Unità statistica: la popolazione è un insieme di unità statistiche. È l'unità elementare su cui
vengono osservati i caratteri oggetto di studio. E la popolazione di riferimento è l'Italia, l'unità
statistica sarà i singoli cittadini italiani; se la popolazione di riferimento è costituita da tutte le
imprese del settore tessile in un territorio, l'unità statistica è la singola azienda tessile e così via...
[uno studente di liceo scientifico può essere parte di diverse popolazioni, per esempio: è elemento
della popolazione di alunni della sua scuola; è anche elemento della popolazione dei cittadini
residenti ad una certa data in un certo comune; è anche elemento della popolazione dei giovani della
sua stessa fascia d'età]
NB! bisogna contestualizzare! Bisogna guardare il CONTESTO di riferimento. Se lo studente di
liceo scientifico viene osservato nel contesto delle scuole secondarie italiane, dove la sua presenza
concorre a determinare il numero di iscritti in un dato anno al liceo scientifico, non può essere
considerato più un'unità statistica. In questo caso le unità statistiche sono le singole scuole
(popolazione di scuole), dove si rileva una caratteristica comune, cioè il numero di alunni iscritti in
un certo anno.
Carattere (o Variabile): è la caratteristica che no osserviamo sulle unità statistichee che
reputiamo rilevanti per la nostra indagine. Se per esempi vogliamo studiare: libri letti da una classe
e per individuare e avere un quadro completo di quali siano le preferenze in “letterarie” della
classe , si può osservare su ciascuna persona alcuni caratteri (genere, età, numero libri letti, genere
letterario preferito etc.)<---ovvero tutte VARIABILI(o CARATTERI) statistiche che ci consentono
di individuare il fenomeno studiato. La classificazione principale dei caratteri è la seguente:
1. Quantitativi: esprimibili tramite numeri e con questi ha senso fare operazioni matematiche,
quindi operazioni come calcolare il totale, una media aritmetica etc.
• Discreti: se l'insieme delle modalità assumibili può essere messo in
corrispondenza biunivoca con un sottoinsieme sei numeri interi. Cioè l'insieme
dei valori assumibili consiste soltanto da numeri interi e in genere contemplano
un conteggio.
Esempio 1---> se si vuole studiare il numero di figli per un collettivo di famiglie,
l'unità statistica di riferimento è la singola famiglia, qui osserviamo il numero di
figli che può assumere modalità in base a quanti figli una famiglia può avere.
(0 figli=0; 1 figlio=1; 2 figli=2 etc.) [una famiglia non può avere ½ figli!].
Esempio 2---> Quante volte sei stato al cinema negli ultimi tre mesi?
Esempio 3---> In che anno sei nato?
• Continui: se l'insieme delle modalità assumibili può essere messo in
corrispondenza biunivoca con un sottoinsieme dei numeri reali. Cioè quando i
numeri non sono necessariamente interi. È continuo di solito se si ha uno
strumento di misurazione.
Esempio 1---> l'altezza si misura tramite i metri. Qual è la tua altezza?
Esempio 2---> Temperatura esterna
2. Qualitativi: esprimibili tramite sostantivi, avverbi, aggettivi etc. su queste modalità, non
essendo espresse in numeri, contrariamente alle quantitative, non ha senso svolgere
operazioni matematiche.
• Sconnessi: se date due modalità è possibile affermare soltanto se sono uguali
oppure diverse (cioè non possiamo ordinarle tra di loro!).
Esempio1--->colore degli occhi.
Esempio 2---> Ti è piaciuta l'ultima edizione del Festival di Sanremo?
L'ho visto e mi è piaciuto
L'ho visto e non mi è piaciuto
Non l'ho visto
Esempio 3---> Qual è il tuo genere letterario preferito?
Comico
Fantascienza
Giallo/noit/thriller
Romantico
Altro
• Ordinati: se possiamo stabilire un ordine tra le modalità si può affermare che
una precede o succede l'altra.
Esempio---> Quanto frequentemente bevi birra?
Mai
Una volta a settimana
Più volte a settimana
Ogni giorno
Più volte al giorno
Analizzando i caratteri statistici possiamo avere un quadro della nostra POPOLAZIONE di
riferimento cioè dell'insieme delle nostre unità. La popolazione dipende dal contesto e da cosa
vogliamo studiare. È l'insieme dei singoli oggetti su cui osserviamo i caratteri. Ciascuno di questi
caratteri può assumere determinati VALORI. L'età è numerica; il sesso può essere M o F; l'attività
può essere occupato, disoccupato, casalinga, etc. questi valori che un singolo carattere può
assumere si chiamano:
Modalità: sono le manifestazioni che un carattere presenta sulle diverse unità statitiche. I valori
che un carattere può assumere quando viene osservato sull'unità statistica. Le modalità devono
essere:
• Esaustive: le modalità elencate devono comprendere tutte le possibili modalità che il
carattere può assumere. Tutte le possibili manifestazioni del fenomeno. Tutto ciò che si
osserva deve corrispondere ad una modalità.
• Non sovrapposte: ad ogni unità deve essere possibile associare una sola modalità
Le modalià quindi possono essere espresse tramite numeri o tramite parole in base al carattere alle
quali si riferiscono e questo rappresenta una differenza fondamentale dei caratteri che portano alla
classificazione principale dei caratteri (che ho elencato sopra)
III) Censimento
si parla di censimento quando la raccolta dati si attua osservando tutti gli individui di una
popolazione. Mettiamo di voler studiare un dato fenomeno su una popolazione e, se osserviamo tutti
gli individui/oggetti che costituiscono quella popolazione, parliamo di censimento.
Vantaggi--> Ricchezza di informazioni: se guardiamo il fenomeno che ci interessa su tutte le unità
della popolazione avremo delle informazioni ricche.
Esaustività: le informazioni che abbiamo ci dicono tutto su quella popolazione, abbiamo una
fotografia chiara di quello che stiamo studiando.
Limiti---> Difficoltà di condurlo: ci sono individui magari difficili da raggiungere e se non li
osserviamo tutti, non è più un'indagine censuaria (questi individui potrebbero avere delle
caratteristiche che li distinguono dal resto della popolazione quindi andremmo a perdere delle
preziose informazioni.
Costi molto elevati: perchè bisogna andare da tutte le unità della popolazione.
Tempi di elaborazioni dei dati molto lunghi.
*l'ISTAT fa i censimenti in Italia (l'EUROSTAT in Europa) periodicamente e riguardano
-popolazione, industria, servizi, agricoltura. L'ultimo censimento è stato fatto nel 2011. dal 2008
vengono misurate le principali caratteristiche socio economiche della popolazione che vive in Italia
non coinvolge tutte le famiglie, ma solo un campione di queste più altre indagini. Prima veniva fatto
ogni 10 anni, ora ogni anno. Meno fastidio per chi deve compilare i questionari ISTAT.
IV)Campionamento
Quando non possiamo/vogliamo osservare l'intera popolazione facciamo ricorso al campionamento,
cioè osserviamo una parte della popolazione.
Campione statistico: insieme di unità selezionato secondo determinati criteri dalla popolazione.
Sono statistici solo quelli che vengono selezionati dalla popolazione seguendo determinate regole di
selezione.
1. Si estrae un campione
2. si osserva il fenomeno di interesse su questo campione quindi si descrive il campione
3. si cerca di concludere dall'osservazione del campione, cercando di trarre delle conclusioni
che possono essere valide per l'intera popolazione. Questo passaggio prende il nome di
inferenza statistica---> generalizzare/estendere i risultati all'intera popolazione è compito
dell'inferenza, così come sono dell'interferenza tutti i metodi che permettono di estendere.
Passando dal “piccolo” al “grande”, dal campione alla popolazione, si introduce naturalmente
incertezza. La statistica gestisce questa incertezza utilizzando un linguaggio appropriato il calcolo
delle probabilità . Ogni volta che estendiamo il campione c'è sempre una probabilità che la
popolazione si comporti come il campione.
Come deve essere il campione: quando diciamo che il campione sono “n” individui selezionati nella
popolazione, non vuol dire che qualunque hruppo di “n” individui vada bene. Si definisce campione
rappresentativo un sottoinsieme della popolazione che ne riflette le caratteristiche (una versione in
miniatura della popolazione).
Per essere rappresentativo deve essere selezionato seguendo delle regole. L'insieme dei metodi che
definiscono come estrarre un campione prende il nome di teoria di campioni. Deve rappresentare
esattamente le caratteristiche della popolazione. È la rappresentatività a permettere che i risultati
siano estesi alla popolazione! Anche se il campione che estendiamo è molto grande, se non è
rappresentativo non ci consente, non è in grado di fare delle generalizzazioni. Se non è
rappresentativo guardiamo solo una parte, abbiamo una visione parziale della popolazione.
Popolazione-------->teoria dei campioni-------> Campione
Campione-------> Inferenza statistica--------> Popolazione
1) STATISTICA DESCRITTIVA
LA RAPPRESENTAZIONE DEI DATI.............................................................................................
Matrice dei dati: una volta raccolti, i dati vengono organizzati in una matrice, ad esempio:
sesso Sanremo …. sonno studio
1 maschio non l'ho visto …. 8 2
2 femmina l'ho visto e non mi è piaciuto …. 6 30
3 maschio non l'ho visto …. 9 5
4 femmina non l'ho visto …. 8 25
…............................................etc etc...........................................................
Distribuzioni:
• unitarie: cioè un elenco delle osservazioni
• di frequenze: distribuzioni in cui per ciascuna delle modalità che si presentano per il
carattere nella popolazione di studio, abbiamo accanto il numero di volte in cui quella
modalità si presenta
• in classi: ne abbiamo una se abbiamo un carattere quantitativo continuo oppure discreto con
un numero elevato di caratteri
le distribuzioni servono a sintetizzare i dati. Sono un primo modo di cui ci serviamo per sintetizzare
i dati e bisogna saperle riconoscere, capire se abbiamo a che fare con una unitaria, di frequenza o in
classi. A seconda del tipo di distribuzione che si ha di fronte, si applicano diverse formule (la media
aritmetica sarà calcolata in modo diverso in base al tipo di distribuzione in cui ci troviamo.
Noi ipotizziamo di trovare nella fase in cui abbiamo già i dati raccolti e li dobbiamo analizzare. Una
volta raccolti, li dobbimo organizzare in una matrice(vedi sopra).
Su ciascuna riga abbiamo i valori che corrispondono ad una determinata unità statisti
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Appunti Metodi quantitativi per le decisioni aziendali
-
Appunti Modelli statistici per le imprese
-
Appunti completi di Modelli statistici per la genetica
-
Marketing - Appunti