Che materia stai cercando?

Anteprima

ESTRATTO DOCUMENTO

19

7. DIAGNOSTICA MEDICA.

5.2  RAPPRESENTAZIONE  DEI  DATI  IN  INGRESSO  

I dati in ingresso alle analisi di data mining assumono nella grande maggioranza dei casi la forma di

una tabella bidimensionale, indicata come DATASET. Le righe del dataset corrispondono alle

osservazioni registrate e vengono indicati come dati. Le colonne rappresentano invece le

informazioni disponibili per ciascuna osservazione e vengono indicate come attributi, variabili,

caratteristiche.

Gli attributi presenti in un dataset possono essere distinti principalmente in:

1. CATEGORICI. Gli attributi categorici assumono un numero finito e di solito non molto

elevato di valori distinti. A tali attributi non si possono applicare operazioni aritmetiche, in

nessun caso.

2. NUMERICI. Gli attributi numerici assumono un numero finito o infinito di valori e si

prestano a operazioni di sottrazione e divisione.

Una distinzione degli attributi più dettagliata li suddivide in:

1. CONTEGGI. I conteggi sono attributi categorici rispetto ai quali una specifica proprietà può

essere vera oppure falsa. Questi attributi possono quindi essere rappresentati mediante

variabili booleane oppure variabili binarie.

2. NOMINALI. Gli attributi nominali sono attributi categorici che non presentano un

ordinamento naturale.

3. ORDINALI. Gli attributi ordinali sono attributi categorici che si prestano a un ordinamento

naturale ma per i quali non ha senso calcolare differenze o rapporti tra valori.

4. DISCRETI. Gli attributi discreti sono attributi numerici che assumono un numero finito o

un’infinità numerabile di valori.

5. CONTINUI. Gli attributi continui sono attributi numerici che assumono un’infinità non

numerabile di valori.


ACQUISTATO

12 volte

PAGINE

114

PESO

63.19 MB

AUTORE

Gidan8

PUBBLICATO

+1 anno fa


DETTAGLI
Corso di laurea: Corso di laurea magistrale in ingegneria gestionale
SSD:
A.A.: 2014-2015

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Gidan8 di informazioni apprese con la frequenza delle lezioni di Business Intelligence e Data Mining e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Politecnico di Milano - Polimi o del prof Vercellis Carlo.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Business intelligence e data mining

Business Intelligence
Appunto
Sistemi di Produzione Automatizzati - Appunti
Appunto
Industrial Technologies
Appunto
Economia dei Servizi e delle Reti - Appunti
Appunto