Anteprima
Vedrai una selezione di 4 pagine su 14
Statistica - Appunti Pag. 1 Statistica - Appunti Pag. 2
Anteprima di 4 pagg. su 14.
Scarica il documento per vederlo tutto.
Statistica - Appunti Pag. 6
Anteprima di 4 pagg. su 14.
Scarica il documento per vederlo tutto.
Statistica - Appunti Pag. 11
1 su 14
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Informazioni personali

M3) Data di nascita………………………………………4) Comune di residenza………………………………5) Provincia di residenza……………………………6) Altezza (in cm) ………………………………7) Peso (in Kg) ……………………8) Scuola media superiore

  • Liceo classico
  • Liceo scientifico
  • Istituto tecnico commerciale
  • Istituto tecnico per geometri
  • Istituto tecnico industriale
  • Altro

…………………………………………9) Voto di maturità…………/100…………/60

10) Matricola

  • Si
  • No
  • A.A. di
  1. immatricolazione…………/…………
  2. N. di esami sostenuti……………………
  3. Ha sostenuto l’esame di MatematicaSi voto…………………No
  4. Difficoltà incontrate nei corsi di I semestreScarseMedieElevateMolto elevate
  5. E’ soddisfatto per la scelta del Corso di studi ?SiNo
  6. N. di componenti del nucleo familiare……………
  7. Titolo di studio del capofamigliaNessun titoloLicenza elementareLicenza mediaMaturitàLaurea 18

Raccolti tutti i questionari, è stato effettuato lo spoglio. I dati sono stati×organizzati sotto forma di matrice di dimensione n k, che per motivi di spazionon riportiamo, dove n=140 è il numero delle matricole frequentanti il corso e ksono le variabili rilevate. I dati riguardanti le variabili rilevate (sesso, provincia diresidenza, altezza, peso, scuola di provenienza,

Ecc... sono stati elaborati e sintetizzati. Di seguito riportiamo alcune di queste variabili, una per ogni tipologia.

Si consideri la variabile "scuola superiore di provenienza". Se si suppone che le diverse scuole abbiano pari importanza, tale variabile può essere considerata una variabile qualitativa sconnessa, poiché considerati due soggetti è possibile dire solo se questi provengono dallo stesso tipo di scuola o meno.

Per ragioni di spazio, le osservazioni riguardanti i 140 soggetti sono riportate sotto forma di tabella, ma nella matrice dei dati, rappresenterebbero una singola colonna. Ovviamente, è conveniente attribuire un'etichetta, o meglio un codice, a ciascuna modalità della variabile, per velocizzare l'immissione dei dati:

  • → Liceo classico LC
  • → Liceo scientifico LS
  • → Istituto tecnico commerciale ITC
  • → Istituto tecnico per geometri ITG
  • → Istituto tecnico industriale
Formattazione del testo

ITI→• Altro A 19LC LS LS ITC ITC LS LS LC LS LSITC LS ITC ITC ITC LC LC ITC ITC LSLC ITC ITG ITC A ITC ITC ITC ITC LCITC ITC A LS LC ITC ITC LS A ITCITC LC LS ITC LC ITC LS ITC ITC LSITC LS A LS LS ITC ITC LS LS ITCLS LS A LS ITC LS ITC LS A LSITC LS ITC LS LS ITC ITC LS LS ITCITC LS ITC ITI LS ITC ITC LS LS ITCITC ITC ITC LS LS ITC LS LS LS LCITC LS LS LS LS ITC LS LS ITC LCLS ITC LS ITC A LC LS LS LS LSLS LS LS A LS A ITC ITC ITC LCITC LS ITC A ITG ITC ITC LS ITC ITC

La tabella sopra contiene la serie dei dati che, come è evidente, non è per nulla informativa; costruiamo, dunque la distribuzione di frequenza, ovvero contiamo quante volte ciascuna modalità si ripete nella serie. Di seguito, oltre alle frequenze assolute n, si riportano anche le frequenze relative f e le frequenze relative in percentuali f * 100:

i n f f * 100
A 10 0.07 7
ITC 58 0.41 41
ITG 2 0.01 1
ITI 1 0.01 1
LC 13 0.09 9
LS 56 0.40 40
totale 140 1 100

Dalla tabella si evince immediatamente

quali sono le modalità più frequenti. In particolare, la maggior parte degli studenti, rispettivamente il 41% e il 40%, provengono dall'ITC e dal LS. La modalità cui è associata la frequenza più alta viene definita "moda". In questo caso la moda è "ITC". Le rappresentazioni grafiche tipiche di una variabile qualitativa sconnessa sono il grafico a colonne, il grafico a barre o a nastri e, se il numero delle modalità non è elevato, come in questo caso, gli areogrammi. In un areogramma le frequenze sono rappresentate da superfici di figure piane (quadrati, rettangoli, cerchi), poste l'una accanto all'altra, oppure da parti di una stessa figura. L'areogramma, rispetto al grafico a colonne e al grafico a barre, dà meno possibilità di apprezzare piccole differenze fra le frequenze, perché l'occhio umano è più abituato a confrontare lunghezze piuttosto che aree.

Un grafico a settori circolari o grafico a torta è un areogramma. Si costruisce un cerchio di area uguale o proporzionale al totale delle frequenze e si ripartisce in tanti settori quante sono le modalità. Ciascun settore ha area uguale o α diproporzionale alla frequenza della modalità cui è associato, per cui l'angolo di ciascun settore si può ricavare dalla proporzione: ·360 nα α→ = = ·i360 : = n: n .360 fi in Oggi, in realtà, esistono diversi software statistici che consentono di costruire tabelle e grafici tramite procedure molto semplici e automatiche. In genere, il grafico a torta è accompagnato da una legenda, che associa colori o tratteggi diversi a ciascun settore. In alternativa, si possono specificare le modalità su ciascun settore: Grafico a torta A7% AITCLS40% ITGITC ITI42% LCITG LSLC ITI 1%9% 1% Analizziamo adesso la variabile "titolo di studio del capofamiglia". Questa variabile

è una variabile qualitativa ordinabile poiché, considerati due soggetti, è possibile dire non solo se hanno un titolo di studio diverso, ma anche chi possiede un titolo più importante. Si riporta di seguito direttamente la distribuzione di frequenza. Nel costruirla è necessario ricordare di ordinare le modalità. Le modalità sono state codificate nel seguente modo:
  • Nessun titolo NT
  • Licenza elementare LE
  • Licenza media LM
  • Maturità M
  • Laurea L
Modalità Frequenza assoluta Frequenza relativa Frequenza percentuale Frequenza cumulata assoluta Frequenza cumulata relativa Frequenza cumulata percentuale
NT 3 0,02 2 3 0,02 2
LE 13 0,09 9 16 0,11 11
LM 37 0,26 26 53 0,38 38
M 60 0,43 43 113 0,81 81
L 27 0,19 19 140 1,00 100
Dalla tabella si evince che la maggioranza dei genitori ha conseguito la maturità (43%). Per questo tipo di variabile ha un senso calcolare anche le frequenze relative F o percentuali F * 100. La frequenza assoluta cumulate, assolute Ni i icumulata N sta ad indicare, ad esempio,che 53 genitori su 140 hanno un titolo di studio inferiore o uguale alla LM. La frequenza relativa cumulata F sta ad indicare che l'81% dei genitori ha un titolo di studio inferiore o uguale alla maturità, e così via. Le rappresentazioni grafiche tipiche di una variabile qualitativa ordinabile sono uguali a quelle di una variabile qualitativa sconnessa. Se il carattere è ordinabile, è preferibile disporre i nastri o le colonne secondo l'ordine con cui si susseguono le modalità. Scegliamo il grafico a nastri. I grafici a nastri sono rappresentati da rettangoli aventi tutti la stessa altezza e basi uguali o proporzionali alle frequenze relative alle singole modalità: Grafico a nastri LM modalità LM ENT 0 10 20 30 40 50 60 70 frequenze assolute Può accadere che le dimensioni del disegno non siano contenute nel foglio. In tal caso, si può assumere un'unità di misura diversa oppure si possono troncare i rettangoli.ovvero si può spostare l'origine di riferimento; così facendo, però, ci si può non rendere conto delle effettive variazioni nelle frequenze. D'altra parte, raddoppiando o dimezzando l'unità di misura si possono amplificare o attenuare le oscillazioni di un fenomeno. L'arbitrarietà nella scelta dell'unità di misura e lo spostamento dell'origine degli assi può fornire impressioni totalmente diverse del fenomeno rappresentato; si parla di manipolazione delle informazioni mediante lo strumento statistico. Si pensi, ad esempio, alle rappresentazioni grafiche riguardanti l'andamento dei mercati finanziari. Quando le dimensioni di un rettangolo (in questo caso di una base, ma potrebbero riguardare l'altezza nel caso di un grafico a colonne) si discostano di molto rispetto alle dimensioni degli altri, un buon metodo potrebbe essere quello di amputare il rettangolo e specificare nella parte amputata la frequenza.ad ogni valore della variabile corrisponde una colonna di altezza proporzionale alla frequenza assoluta del valore stesso. In questo caso, il grafico a colonne rappresenterebbe le frequenze assolute dei diversi valori del numero dei componenti del nucleo familiare. Ecco un esempio di come potrebbe essere formattato il testo utilizzando tag html:

Consideriamo adesso una variabile quantitativa discreta, qual è ad esempio il "numero dei componenti del nucleo familiare".

Di seguito si riporta la serie dei dati già ordinata e la distribuzione delle frequenze assolute, relative e relative cumulate:

1 3 3 4 4 4 4 4 4 4 5 5 5 5
2 3 3 4 4 4 4 4 4 4 5 5 5 5
2 3 3 4 4 4 4 4 4 4 5 5 5 5
3 3 3 4 4 4 4 4 4 4 5 5 5 5
3 3 3 4 4 4 4 4 4 4 5 5 5 5
3 3 4 4 4 4 4 4 4 4 5 5 5 5
3 3 4 4 4 4 4 4 4 4 5 5 5 6
3 3 4 4 4 4 4 4 4 4 5 5 5 6
3 3 4 4 4 4 4 4 4 4 5 5 5 6
3 3 4 4 4 4 4 4 4 4 5 5 5 6
n f F f *100 F *100
x i i i i i i
1 1 erati, vengono utilizzate colonne verticali di larghezza uguale. Inoltre, nel diagramma cartesiano, le colonne sono disposte in modo che i loro bordi siano allineati con gli intervalli sull'asse delle ascisse, mentre nel grafico a colonne i bordi delle colonne possono essere posizionati ovunque all'interno degli intervalli sull'asse delle ascisse.
        
Dettagli
Publisher
A.A. 2012-2013
14 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher miltrex di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Palermo o del prof Ruggieri Maria Antonietta.