Anteprima
Vedrai una selezione di 1 pagina su 5
Analisi dei dati Pag. 1
1 su 5
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

1. Introduzione all'Analisi dei Dati

Definizione: L'analisi dei dati è il processo di raccolta, trasformazione,

pulizia e modellazione dei dati con l'obiettivo di scoprire informazioni utili,

formulare conclusioni e supportare il processo decisionale.

Importanza: Nel contesto aziendale, l'analisi dei dati permette di

comprendere meglio il mercato, migliorare le operazioni aziendali,

ottimizzare le risorse, identificare opportunità di crescita e mitigare i

rischi.

2. Tipi di Dati

Dati Quantitativi:

Continui: Variabili che possono assumere un numero infinito di

 valori tra due estremi. Esempi: altezza, peso, tempo.

Discreti: Variabili che possono assumere solo valori distinti e

 separati. Esempi: numero di clienti, numero di difetti in un lotto.

Dati Qualitativi:

Nominali: Categorie senza un ordine intrinseco. Esempi: colore

 degli occhi, genere.

Ordinali: Categorie con un ordine logico. Esempi: livello di

 istruzione, classificazione del servizio (ottimo, buono, sufficiente).

3. Processi dell'Analisi dei Dati

1. Raccolta dei Dati

Fonti Primarie: Dati raccolti direttamente da ricerche specifiche.

 Metodi includono sondaggi, interviste, osservazioni dirette. Esempio:

un sondaggio sui clienti per valutare la soddisfazione del servizio.

Fonti Secondarie: Dati già esistenti raccolti da altre ricerche o

 fonti. Esempio: report di settore, database pubblici, statistiche

governative.

2. Pulizia dei Dati

Rimozione di Dati Duplicati: Eliminare record duplicati che

 possono distorcere l'analisi.

Gestione dei Valori Mancanti: Strategie includono l'imputazione

 (sostituzione con mediana/media) o l'eliminazione dei record

incompleti.

Correzione degli Errori: Individuare e correggere errori di

 inserimento dati o incongruenze nei dati raccolti.

3. Esplorazione dei Dati

Statistica Descrittiva: Uso di misure statistiche per riassumere e

 descrivere le caratteristiche principali dei dati. Esempi: calcolo di

media, mediana, moda, deviazione standard.

Visualizzazione dei Dati: Creazione di grafici per esplorare

 visivamente i dati. Esempi: istogrammi per distribuzioni, scatter plot

per relazioni tra variabili, box plot per individuare outlier.

4. Analisi dei Dati

Analisi Descrittiva: Riepilogo dei dati raccolti per evidenziare

 tendenze e pattern. Esempi: tabelle pivot, grafici a torta.

Analisi Inferenziale: Utilizzo di campioni di dati per fare inferenze

 su una popolazione più ampia. Esempi: test di ipotesi, intervalli di

confidenza.

Analisi Predittiva: Modelli statistici utilizzati per prevedere risultati

 futuri. Esempi: regressione lineare per prevedere vendite future,

modelli di machine learning.

Analisi Prescrittiva: Raccomandazioni su azioni da intraprendere

 basate sui dati analizzati. Esempi: ottimizzazione dei prezzi,

gestione delle scorte.

4. Strumenti e Tecniche

Statistica Descrittiva:

Misure di Tendenza Centrale:

 Media: La somma di tutti i valori divisa per il numero di valori.

o Mediana: Il valore centrale quando i dati sono ordinati.

o Moda: Il valore che si verifica più frequentemente.

o

Misure di Dispersione:

 Varianza: La media dei quadrati degli scarti dei valori dalla

o media.

Deviazione Standard: La radice quadrata della varianza,

o misura della dispersione dei dati.

Range: La differenza tra il valore massimo e minimo.

o

Statistica Inferenziale:

Test di Ipotesi: Procedure per testare un'ipotesi statistica. Esempi:

 t-test per confrontare medie, ANOVA per analizzare varianze, chi-

quadro per testare indipendenza.

Intervalli di Confidenza: Intervallo che stima il range entro cui un

 parametro di popolazione si trova con una certa probabilità.

Regressione:

 Regressione Lineare: Modello che descrive la relazione tra

o due variabili attraverso una linea retta.

Regressione Logistica: Modello utilizzato per prevedere un

o esito binario.

Data Mining:

Cluster Analysis: Tecnica per raggruppare dati simili in cluster.

 Esempi: k-means clustering.

Association Rule Learning: Tecniche per identificare regole di

 associazione tra variabili. Esempio: analisi del carrello della spesa.

Decision Trees: Alberi decisionali utilizzati per classificazione e

 previsione.

Machine Learning:

Supervised Learning: Algoritmi che imparano da dati etichettati.

 Esempi: regressione, classificazione con Support Vector Machines

(SVM), reti neurali.

Unsupervised Learning: Algoritmi che trovano pattern nei dati

 senza etichette. Esempi: clustering con k-means, Principal

Component Analysis (PCA).

5. Software e Strumenti Utilizzati

Excel:

Strumento versatile per analisi dei dati, con funzioni integrate per

 calcoli statistici e creazione di grafici.

Utilizzato per analisi di dati su piccola scala.

R: Linguaggio di programmazione specializzato per l'analisi statistica.

 Librerie come ggplot2 per visualizzazione, dplyr per manipolazione

 dei dati, e caret per machine learning.

Dettagli
Publisher
A.A. 2023-2024
5 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher LuigiRizzo13 di informazioni apprese con la frequenza delle lezioni di Bilancio e analisi economico finanziaria e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Bianchi Laura.