Sistemi di elaborazione delle informazioni
Un foglio elettronico è come se fosse una lavagna, con una quantità limitata di informazioni che possono essere archiviate. Il dataset è come se fosse una tabella, con una prima riga che contiene le variabili da analizzare. Insieme di dati immessi in una tabella molto grande, dove nelle colonne ci sono le variabili e nelle righe le persone (soggetti).
Il soggetto (subject) è l’oggetto dello studio. La variabile è ciò che si va a misurare.
Tipi di studio
- Studio di popolazione: vengono reclutati nello studio tutti i soggetti della popolazione; non riguarda la statistica inferenziale; da come risultato dello studio il valore vero o valore di popolazione.
- Studio campionario: vengono reclutati solo alcuni soggetti della popolazione; si serve della statistica inferenziale; da come risultato dello studio la stima campionaria della media.
La statistica inferenziale permette di valutare la ragionevolezza della generalizzazione dei dati rilevati sul campione all’intera popolazione.
Excel o LibreOffice
Formule = valori dinamici
Numeri = valori statici
Immettendo delle cifre nelle celle ed inserendo =c3+c4 e premendo invio, calcola la somma dei valori; sulla f in alto la cella dove ho inserito l’operazione, visualizza l’operazione e non il numero risultante dalla somma dei valori. Spostando i dati (si selezionano i dati e si sposta tenendo poggiato sul bordo della selezione), la f varia in base alla posizione dei valori di cui viene fatta la somma. Cliccando in basso a sinistra sul segno + è possibile aggiungere fogli.
Funzioni con una sola variabile
Se si inserisce come dato un orario con i due punti separatori, vengono inseriti automaticamente i minuti ed i secondi. Se si vuole fare una media, digitare =MEDIA(, quindi usciranno una serie di operazioni e si clicca su quella prescelta; quindi si digita la prima cella:l’ultima cella che si vogliono includere per l’operazione. Se si vogliono fare il massimo ed il minimo, digitare =MAX( e =MIN(. Digitare =DEV e cliccare su =DEV.ST( e si clicca con il mouse sulle caselle di cui si vuole fare la deviazione standard. Il numero di cifre utilizzato per la variabile è quello che dovrà essere preso per i risultati della deviazione standard. Cliccando sul pulsante destro sopra la cella della dev.st, si clicca su formatta celle e si apre una finestra per formattare il numero, il carattere, ecc.
Per poter applicare la funzione a tutte le celle, inserire il simbolo $ tra la lettera della colonna e il numero della riga di una cella (per esempio, C$13). Se si seleziona una casella dove si è effettuata una funzione e si clicca sull’angolo in basso a destra trascinando la casella in altre attigue, permette di fare la funzione della cella anche nelle celle attigue con i dati che si trovano sopra. Se non si facesse il $, la funzione non potrebbe essere trasportata in altre celle, perché avrebbe come riferimento sempre l’ordine delle caselle dato nella prima cella.
Per fare in modo che una variabile numerica venga trasformata automaticamente in variabile categorica dal software (interpretazione qualitativa), si inserisce la funzione =SE(test; cosa fare se il test è positivo; cosa fare se il test è negativo).
Es.: =SE( B2<100; “IPOTENSIONE”; “NORMALE” o “IPERTENSIONE”) >> Se nella casella B2 è minore di 100, scrivere ipotensione; se non è minore di 100, scrivere normale o ipotensione.
Es.: =SE( B2<100; “IPOTENSIONE”; SE( B2<140; “NORMALE”; “IPERTENSIONE”)) >> Se B2 è minore di 100, è ipotensione; se B2 è minore di 140, scrivere normale; se B2 non è nessuna delle altre soglie, scrivere ipertensione. Si parte sempre scrivendo la soglia più bassa e per ciascuna soglia si ha almeno una categoria. Se si trascina la funzione fatta nella prima cella alle altre attigue, darà i risultati delle funzioni applicate ai valori delle altre caselle.
Calcolo della frequenza
Il calcolo della frequenza assoluta si può fare per contare quante frequenze si hanno in una certa categoria di dati.
Frequenza assoluta >> SOLO V. CATEGORICA
Per la frequenza assoluta, si digita =CONTA.SE(, che richiede area e categoria di cui si deve fare la frequenza e, quindi, =CONTA.SE (caselle di cui si deve calcolare la f. a.; casella in cui è inserita la modalità di cui si cerca la f.a.). Copiare su altre caselle in questo caso non è possibile perché conta sull’area e sulla categoria sbagliate. Perciò si potrebbe aggiustare la funzione scrivendo al posto della categoria (“IPOTENSIONE”) la casella accanto a dove si vuole calcolare la Fr.assoluta (si prende la casella accanto e non sopra dai dati immessi, perché quando si andrebbe a copiare la funzione in altre celle verrebbero considerate le caselle sottostanti a quella dei dati, dove è scritto IPOTENSIONE, cioè C13) e inserendo il simbolo $ tra la lettera della colonna e il numero della riga di una cella (per esempio, C$13), così da poter applicare la funzione a tutte le celle.
Es.: Per ottenere il BMI, dati due valori noti del peso e dell’altezza, scrivere =P/(H*H). La deviazione standard si può fare solo su variabili numeriche.
Frequenza relativa
Frequenza relativa (percentuale, infatti espresse in percentuale) = frequenze assolute divise per il numero totale delle frequenze assolute; =D16/(D16+D17) oppure, se sono più variabili con la funzione somma, = frequenza assoluta (NON con $) / SOMMA (celle con $). Si potrebbe anche calcolare la somma (con l’apposita funzione) nella casella sotto le Fr. assolute ed inserire al numeratore della funzione delle Fr. relative direttamente la casella dove si è calcolata la somma.
Inserire un grafico
Per inserire un grafico, selezionare le variabili (compreso il nome della variabile; se le v. sono distanti si usano i tasti Ctrl e Blocco maiuscolo contemporaneamente) da inserire, tenendo premuto Alt (selezionare prima la variabile da inserire nell’asse delle x e poi quella dell’asse delle y), e cliccare sull’icona del grafico a torta in alto; immettere quindi i vari comandi per impostare il tipo di grafico ed i dati. Se la v. è categorica nominale si utilizza un grafico a torta; se la v. è ordinale si utilizza un istogramma. Selezionare, se necessario, nei comandi del grafico che la prima riga e la prima colonna siano didascalie del grafico; successivamente, è possibile inserire titolo, sottotitolo, assi (v. selezionata per prima >> asse delle x) e legenda del grafico.
Normalmente il file si salva nel formato CSV; però, salvando il file come CSV, si salverebbe solamente il foglio Excel e non il grafico, quindi per salvare il grafico mantenere il formato ODF.
R e RStudio (statistica descrittiva)
R = software sviluppato per l’analisi statistica inferenziale (che con Excel è molto più lungo e difficile da fare), permette di fare molti tipi di analisi. Con R abbiamo solo la parte della console, mentre RStudio da anche una parte aggiuntiva sulla destra.
R >> analisi statistica
R studio >> interfaccia più comprensibile
I comandi si scrivono nello spazio di console (sulla sinistra). Nella statistica inferenziale è molto importante l’uso delle variabili.
Esempio di comandi
- Inserire i comandi: 1+5 e premere invio. Il comando viene automaticamente elaborato (viene 6).
- Scrivendo x=1+5 non esce nulla, ma sull’environment sotto a values esce la x.
- Scrivendo poi x+1 e premendo invio, esce automaticamente 7.
- I dati vengono salvati sull’history, che memorizza le procedure adottate in precedenza. Premendo la freccia sulla tastiera in alto, compariranno i dati inseriti in precedenza sulla console.
Collezione di dati:
- Inserisco c(una serie di valori) (per esempio, c(34,58,87,43)) e premo invio e mi compaiono tutti i numeri inseriti nelle parentesi.
- Si inserisce variabile = c(una serie di valori) (per esempio, età=c(34,58,87,43)) e premendo invio, nell’environment comparirà il numero totale di numeri inseriti e sotto ad età la x (cioè la variabile). In questo modo si possono utilizzare quei valori, per esempio per calcolare la media facendo mean(variabile): mean e seleziono il comando e inserisco <<età>> tra le parentesi e premo invio. Oppure per calcolare la deviazione standard: sd(variabile) e premo invio.
-
Geografia - appunti
-
Esercitazioni con appunti di Topografia
-
Appunti Diritto commerciale
-
Appunti di Statistica