Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Lezione 002
-
Che cosa è il Data Mining?
- Il processo che estrae nuova conoscenza o identifica pattern/modelli nei dati mediante l'applicazione di diversi algoritmi.
- Il processo che estrae dati dai fenomeni mediante l'applicazione di diversi algoritmi.
- Il processo che estrae fenomeni dai dati mediante l'applicazione di diversi algoritmi.
- Nessuna delle altre alternative
-
Che cosa è un pattern?
- Una espressione in un determinato linguaggio che descrive modelli descrittivi estratti da un sottoinsieme di registrazioni presenti in un data base
- Una espressione in un determinato linguaggio che descrive i fatti di un sottoinsieme di registrazioni presenti in un data base
- Una espressione in un determinato linguaggio che descrive modelli predittivi estratti da un sottoinsieme di registrazioni presenti in un data base
- Nessuna delle altre alternative
-
Quale fra le seguenti attività non fa parte del processo di KDD?
- Interpretazione
- Nessuna delle altre alternative
- Data Mining
- Selezione
-
Quale fra le seguenti attività non fa parte del processo di KDD?
- Selezione
- Intervista
- Nessuna delle altre alternative
- Data Mining
-
Quali sono le fasi caratteristiche del data mining?
-
Cosa è una transazione?
-
Quali sono le fasi del KDD?
Lezione 003
01. Cosa si intende per knowledge elicitation?
- Il confronto fra gli esperti di uno specifico dominio e l'ingegnere della conoscenza al fine di aggiungere in fase di modellazione elementi che potrebbero non essere estraibili dai dati.
- Il confronto fra gli esperti informatici e l'ingegnere della conoscenza al fine di aggiungere in fase di modellazione elementi che potrebbero non essere estraibili dai dati.
- Il confronto fra gli esperti informatici e matematici al fine di aggiungere in fase di modellazione elementi che potrebbero non essere estraibili dai dati.
02. A cosa servono i modelli predittivi?
- Vengono utilizzati per descrivere la struttura organizzativa e la distribuzione dei dati. L'obiettivo di questi modelli è quello di approfondire la conoscenza nascosta dietro ai dati.
- Utilizzano i loro parametri e meccanismi caratteristici per effettuare delle previsioni future che possono essere utili nei processi decisionali.
- Il loro obiettivo è quello di descrivere i dati per effettuare delle previsioni future.
- Nessuna delle altre alternative
03. A cosa servono i modelli descrittivi?
- Vengono utilizzati per descrivere la struttura organizzativa e la distribuzione dei dati. L'obiettivo di questi modelli è quello di approfondire la conoscenza nascosta dietro ai dati.
- Vengono utilizzati per descrivere i dati per effettuare delle previsioni future.
- Utilizzano i loro parametri e meccanismi caratteristici per effettuare delle previsioni future che possono essere utili nei processi decisionali.
- Nessuna delle altre alternative
04. Quali sono i pilastri operativi su cui si basa ogni algoritmo di data mining?
- Nessuna delle altre alternative
- Esplorazione, Valutazione, Visualizzazione
- Esplorazione, Modellazione, Valutazione
- Selezione, Modellazione, Valutazione
05. Discutere la differenza fra modelli predittivi e descrittivi.
06. Perché il processo di data mining è da considerarsi interattivo?
07. Quali sono i pilastri operativi su cui poggia il data mining?
Lezione 007
01. Quali fra le seguenti tecniche non si usano in fase di gestione dei missing value?
- Sostituzione dei valori mancanti con il valore più probabile
- Ignorare la tupla contenente valori mancanti
- Nessuna delle altre alternative
- Riempimento a mano dei valori mancanti
02. L’analisi degli outlier può essere usata per:
- Identificare e gestire i missing value
- Ridurre la dimensionalità
- Identificare e gestire i dati rumorosi
- Nessuna delle altre alternative
03. L’analisi in regressione può essere usata per:
- Identificare e gestire i dati rumorosi
- Fare selezione di attributi
- Gestire dati provenienti da sorgenti eterogenee
- Nessuna delle altre alternative
04. Con quali tecniche si gestiscono i missing value?
- Nessuna delle altre alternative
- Data Transformation
- Data cleaning
- Data Reduction
05. Le fasi del processo di data cleaning si effettuano solo una volta. Vero o falso? Discutere la scelta effettuata.
06. Cosa si intende per Data Scrubbing e Data Auditing?
07. Descrivere la seconda fase del processo di data cleaning, specificando che tipi di tool commerciali potrebbero essere utilizzati.
08. Quali sono i passaggi per effettuare l'eliminazione delle discrepanze fra i dati?
Lezione 012
- Quali sono le condizioni che deve soddisfare una misura di similarità fra due punti?
- Simmetria; Massimo valore in 1 quando i due punti coincidono
- Riflessività, non negatività, simmetria
- Nessuna delle altre alternative
- Riflessività, derivabilità, simmetria
- Quali sono le condizioni che deve soddisfare una misura di distanza fra due punti?
- Nessuna delle altre alternative
- Riflessività, non negatività, simmetria
- Riflessività, omogeneità, simmetria
- Riflessività, derivabilità, simmetria
- Quando una distanza si definisce metrica?
- Quando rispetta anche la condizione di derivabilità
- Quando rispetta anche la condizione di disuguaglianza triangolare
- Quando rispetta anche la condizione di simmetria
- Nessuna delle altre alternative
- Qual è la differenza fra distanza e similarità?
- Cosa sono la matrice dei dati e la matrice di dissimilarità?
- Cosa è la diseguaglianza triangolare? Fornire un semplice esempio grafico.
Lezione 017
- L'algoritmo di clustering SOM (self organizing map) a quale categoria di algoritmi appartiene?
- Nessuna delle altre alternative
- Gerarchici
- Density-based
- Partizionali
- Quale tipologia di algoritmi di clustering è più efficiente per l'identificazione di outlier?
- Partizionali
- Nessuna delle altre alternative
- Density-based
- Gerarchici
- L'algoritmo di clustering AGNES a quale categoria di algoritmi appartiene?
- Gerarchici
- Partizionali
- Nessuna delle altre alternative
- Density-based
- L'algoritmo di clustering k-means a quale categoria di algoritmi appartiene?
- Gerarchici
- Partizionali
- Nessuna delle altre alternative
- Density-based
- Discutere le principali caratteristiche degli algoritmi di clustering density-based.
- Come funzionano gli algoritmi di clustering gerarchici?
- Discutere la tassonomia degli algoritmi di clustering: come si raggruppare tali algoritmi?
- Quale è la principale differenza fra algoritmi di clustering partizionali e density-based?