Anteprima
Vedrai una selezione di 1 pagina su 5
Informatica Pag. 1
1 su 5
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Modulo 2.1082u21ottobre27col,,di111c1 DATIDEISTATISTICAANALISI dati:ipresentaeinterpretaanalizza,Raccoglie, datineicontenutal'informazionepresentaeriassumedescrittiva,Statistica• portarecuisuè interessedicaratteristicaunaindividuarenecessariodatounanalizzasiQuando offerto)servizioildopoclienteun_disoddisfazioneLa(es.VARIABILELAstatistica:l'osservazione alla:baseinidentificataViene

quantitativa• ..qualitativa• chevalorii(=modalitàlaguardarebisognaqualitativaoquantitativaè variabileunasecapirePosso assumere)puòvariabilequella ~~e fVO~ ~~e.r4,.):,c""ov~lo<; \/QI~,•u,a.QUALITATIVAVARIABILE ,'uVIVm,'61-;(,w,.,d.oJ,ì.~lt. maggiorlacuiintabellaunaavràsiperciòdistribuzione,suàdellaval~tazione.unaconsempreInizia exvolte.piùounaperripetonosivariabiledalleassuntemodalitàdelleparte AT1vAVAt.rtdinumeroilindicachefrequenzadi sintesidita.belladistribuzione unaèvariabiledataunadiLa -t<)(-\Q...assoluta, deifrequenza l'interpretazionerefavoriper=variabiledellamodalitàciascunaperosservazioni -bo..(T'(..di(proporzioniRELATIVEFREQUENZEdelledistribuzionelaancheesameinprendereconvienedati percentualelaindica(nePERCENT,UALIFREQUENZAemodalità)ciascunaaascrivibiliosservazioni ii barreagraficotorta,agrafico

~NT1,vvé/specialmenteusasitotale)ealrispetto (..f-fìt~10~GvANT(tATIV~numerounletteralmenteèassoluta~uenza ~c;(..ì:,pe,-s.,-unascrittac'èvoltequantevederepercerco)chenomeilnomi;deil'elencoCONTA.SE(tutto .bQ..,r-e..-cosadeterminata larendofunziona,nonl'angologiùtiroparol·eletuttecalcolarepersepassaggiquestofaccio(quando $)aggiungendociassoluti,nomiituttidicolonna ;d~.,.,.,.,_er~ ~-\<:i:"-..ç;l\'oto~e-=(DISCRETE}QUANTITATIVAVARIABILE ,.,,.,-.,...,, '-'",;.,,iio, ~"'u:,11+i:.-Q.~;.'.Idi"'~~ci.dQ...!'l'N.A.F"-.""-"" ,:d diper,ewrh')(tabellasecondatabella;FREQUENZA(prima 11.i,tueleselezionoezafrequenbarranellascrivofrequenze,lecolarecaldevodovevuotecellele(Seleziono aiusc+invio)CTRL+MmainviopremoNONtabelle, numero?certounvedovolteQuante numerounadttorispemaggioriominorisononumeriquantivederepercumulativa,Frequenza

  • dispersione
  • barre
  • grafici
  • usare
  • Posso
  • tiper
  • 01
  • ._,
  • )1p\X,
  • '
  • ((CONTINUE):-se.
  • ill¼\/ol.
  • LoVARIABILE
  • QUA~TITATIVA
  • ""'w.:.-.,~
  • ,.;.'1->t\'i/\~llc)q,JQ.\~;(2.1:,i/V\1:.l'O~v
  • ..J\·spazisenzaBarre
  • virgolalaconnumeriecolonneinsuddivisinonnumeri,piùabbiamocapirlo,immediatoè
  • Non
  • ···conta.se)alNUMERl(ugualeCONTA.
  • difetto.perarrotondare,per=INTUso eccessoperarrotondareper=ARROTONDA.ECCESSOUso
  • .'··IladefinirenecessarioèclassidiottimalenumeroiltrovatovoltaUna
  • am~
  • campoattraversomassi~;ovaloriaiminimivaloriisottrarreavachedati,deivariazionedi
  • _112:classidellel'ampiezzaedestroestremotradifferenzacentrali,Valori
  • GRAFICIDATIPLOTTARECHARTSPARETO
  • I
  • ~h~
  • totalesulpiùdipesanotreleclassicinquele_~raso~oqua!iindica
  • .chartsParetograficoinseriscoedatiiSeleziono
  • ·assocstatisticoli.m_grafico
  • ··.Iche
  • f, dJdi
osservata =MODA(intervallo_celle) I boxplots, detti anche diagrammi a scatola, sono grafici statistici utilizzati per visualizzare la distribuzione di un insieme di dati. Sono composti da un rettangolo che rappresenta il range interquartile dei dati, con una linea che indica la mediana. I "baffi" del boxplot rappresentano il range dei dati, escludendo gli outlier. I grafici statistici possono essere di diversi tipi, a seconda del tipo di dati e della distribuzione. Alcuni esempi sono: - Grafico a barre: utilizzato per rappresentare dati categorici o discreti. Le barre rappresentano le categorie e l'altezza delle barre rappresenta la frequenza o la percentuale di dati in ogni categoria. - Grafico a linee: utilizzato per rappresentare dati continui nel tempo. Le linee connettono i punti che rappresentano i valori dei dati in diversi momenti. - Grafico a dispersione: utilizzato per rappresentare la relazione tra due variabili continue. I punti sono posizionati su un piano cartesiano, con una variabile sull'asse x e l'altra sull'asse y. - Grafico a torta: utilizzato per rappresentare la distribuzione percentuale di dati categorici. Le "fette" del grafico rappresentano le categorie e l'area delle fette rappresenta la percentuale di dati in ogni categoria. Le misure di centralità sono indicazioni di sintesi di una distribuzione di frequenza. Le più utilizzate sono: - La media, che rappresenta il baricentro della distribuzione dei valori di una variabile quantitativa. Si calcola con la formula MEDIA(intervallo_celle). - La mediana, che rappresenta il valore della variabile che occupa la posizione centrale quando le osservazioni sono disposte in ordine crescente. Si calcola con la formula MEDIANA(intervallo_celle). Prima vanno messi in ordine crescente, perché la mediana indica la posizione del dato centrale. - La moda, che rappresenta il valore dell'osservazione che si presenta con la frequenza più alta nella distribuzione osservata. Si calcola con la formula MODA(intervallo_celle). Queste misure di centralità forniscono informazioni importanti sulla distribuzione dei dati e possono essere utilizzate per trarre conclusioni e prendere decisioni.

MODA.SNGL(intervallo_celle)

Ci sono inoltre i percentili e quartili (sono casimisure di posizionamento non centrale, suddivido una torta da 100 in 100 spicchi) particolari di percentili 100 che perdividono SO, centol'insiem!! dei dati in quattro parti uguali, la torta da 100 la divido in 4: 25, 75, INC.PERCENTILE(intervaUo_celle; percentile).

Misure di variabilità dei dati, riducono la complessità dimensionale e informativa dei dati - campo di variazioni o range lnterquartillco, INC.PERCENTILE(intervallo_celle;0.25) max-min = INC.PERCENTILÉ(intervallo_celle;0.75).

Varianza, (scarto) = VAR.P(intervallodifferenza·t celle) ora il valore di ciascuna osservaiioni e la media della distribuzione.

Varianza relativa, dati osservatila radice quadrata con segno positivo della varianza e con la stessa unità di misura dei = DEV.ST.P(intervallo_celle).

coefficiente di variazione, misure di variabilità assoluta =DEV.ST.P(intervallo_celle)3)misure di forma, rappresentazione del.l'andamento delle nostre osservazioni, usiamo 2 indici:

  • immetrica, una misura di forma di una distribuzione che può essere com plementare all'utilizzo dell'istogramma
  • curtosl, valuta il grado di appiattimento media)di" una determinata distribuzione di una variabile attorno al suo valore centrale (=alla1--,{>IO..-\-,wf~LQ... ' "'~QAi'-'0"""O..t.,. C°":>\\ C.-~O.....,(-\°)<..-Q.-

IVARIABILE CASUALE, una variabi èle qu;rntitativa la cui distribuzione dei valori non not a a priori, ma sononote le sue modalità, ci sono due variabili:

  • discreta, può assumere un numero finito di valori o una sequenza di numeri interi (quando lanci un dado)
  • continua, può assumere un qualsiasi valore numerico (infiniti) in un intervallo di valori
(i l va lore esatt o diun servizio, tù ipotizzi ma non sai quanto costa per davvero)distribuzione di probabilità di una variabileLa casuale è la legge che stabilisce come la probabilità didistribuiscono sui possibili valori che la variabile casuale può assumere (visto come un modello _matematico)➔Funzione casuale discreta funzione di probabilità . <➔ p..Funzione casuale continua funzione di densità (gli integrali) · · · proba.bi l,'t-a:'~ ,ove .~l)di~tribuzio~e k ,di probabilità d~scrive variabili casu_all ?iscrete rappresentative di molti fenomenireali, per ogni n prove supponiamo che esistano solo due poss1b1h esiti: successo o insuccesso . h {>2)distribuzione ~ sidi probabilità di usa per studiare il numero discreto di eventi ·rari che verificano inun dato intervallo di tempo (spazio), la distribuzione prende come parametro un valore~ indicato con ,1.3)distribuzione dire la distribuzione di una variabile casuale continua. La probabilità normale è spesso rappresentata da una curva a campana, chiamata anche curva di Gauss. Questa distribuzione è caratterizzata da una media (μ) e una deviazione standard (σ), che determinano la forma e la posizione della curva. La probabilità normale è ampiamente utilizzata in statistica e nelle scienze naturali per modellare fenomeni che seguono una distribuzione simmetrica intorno alla media.
Dettagli
A.A. 2021-2022
5 pagine
1 download
SSD Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher helvia.attanasi di informazioni apprese con la frequenza delle lezioni di Informatica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Ferrara o del prof Zambelli Cristian.