Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
SMC
Lagrange-Tchebychev
02. Che tipo di distanza si può utilizzare fra due punti descritti da variabili binarie simmetriche?
Lagrange-Tchebychev
Minkowski
SMC
Jaccard
03. Quando una variabile binaria si dice simmetrica?
Se la probabilità che ciascuno dei suoi stati categorici si verifichi è uguale e tutti gli stati assumono lo stesso peso
Se la probabilità che ciascuno dei suoi stati continui si verifichi è uguale e tutti gli stati assumono lo stesso peso
Se la probabilità che ciascuno dei suoi stati si verifichi (che assuma valore zero o uno) è uguale ed entrambi gli stati assumono lo stesso peso
Nessuna delle altre alternative
04. Discutere i passaggi per calcolare la distanza fra due vettori che contengono variabili ordinali
05. Quale è la differenza fra la distanza e la similarità di Jaccard?
06. Cosa si intende per ranking di una variabile ordinale. © 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 15/41
Set Domande: DATA MINING
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Ducange Pietro
Lezione 015
01. La formula della similarità coseno fra due vettori utilizza al suo interno?
La norma dei due vettori e il prodotto vettoriale fra i due vettori
Solo il prodotto scalare dei due vettori
Solo il prodotto vettoriale fra due vettori
La norma dei due vettori e il prodotto scalare fra i due vettori
02. E' possibile calcolare la distanza fra istanze descritte da attributi nominali?
No
Si utilizzando una distanza basata sul matching
Nessuna delle altre alternative
Si utilizzando la distanza di Minkowski
03. Che tipo di distanza si può usare fra due istanze descritti con attributi di tipologia mista?
Euclidea
Lagrange-Tchebychev
Nessuna delle altre alternative
Minkowski
04. Discutere come si calcola la distanza fra oggetti descritti con attributi di tipologia mista.
05. Come si calcola la similarità coseno e in che contesto si utilizza?
06. La similarità coseno è anche una distanza. Vero o falso? Giustificare la risposta. © 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 16/41
Set Domande: DATA MINING
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Ducange Pietro
Lezione 016
01. Che tipo di apprendimento si utilizza quando si creano modelli per il clustering?
Semi-supervisionato
Parzialmente supervisionato
Non supervisionato
Supervisionato
02. Gli algoritmi di clustering si utilizzano per generare:
Modelli associativi
Modelli descrittivi
Metodi di ottimizzazione
Modelli predittivi
03. Con riferimento agli algoritmi di clustering, quali delle seguenti affermazione è falsa?
Gli algoritmi di clustering possono essere utilizzati per la compressione dei dati
Non ci sono classi predefinite, l'apprendimento del modello non avviene utilizzando esempi etichettati
Gli algoritmi di clustering aspirano a trovare gruppi nei dati in modo tale che la somiglianza dei dati all'interno dello stesso gruppo sia alta e sia bassa per punti appartenenti
a gruppi diversi.
E' sempre noto apriori il numero di cluster da cercare
04. Un algoritmo di clustering produce cluster di alta qualità se assicura:
Bassa similarità intra-cluster e alta similarità inter-cluster
Alta similarità intra-cluster e bassa similarità inter-cluster
Alta similarità intra-cluster e alta similarità inter-cluster
Bassa similarità intra-cluster e bassa similarità inter-cluster
05. Discutere la principale differenza fra clustering e classificazione.
06. Quali sono i principali requisiti che devono assicurare gli algoritmi di clustering?
07. Definire il concetto di cluster.
08. Discutere la principale differenza fra apprendimento supervisionato e non supervisionato.
© 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 17/41
Set Domande: DATA MINING
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Ducange Pietro
Lezione 017
01. L'algoritmo di clustering SOM (self organizing map) a quale categoria di algoritmi appartiene?
Nessuna delle altre alternative
Gerarchici
Density-based
Partizionali
02. Quale tipologia di algoritmi di clustering è più efficiente per l'identificazione di outlier?
Partizionali
Nessuna delle altre alternative
Density-based
Gerarchici
03. L'algoritmo di clustering AGNES a quale categoria di algoritmi appartiene?
Gerarchici
Partizionali
Nessuna delle altre alternative
Density-based
04. L'algoritmo di clustering k-means a quale categoria di algoritmi appartiene?
Gerarchici
Partizionali
Nessuna delle altre alternative
Density-based
05. Discutere le principali caratteristiche degli algoritmi di clustering density-based.
06. Come funzionano gli algoritmi di clustering gerarchici?
07. Discutere la tassonomia degli algoritmi di clustering: come si raggruppare tali algoritmi?
08. Quale è la principale differenza fra algoritmi di clustering partizionali e density-based? © 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 18/41
Set Domande: DATA MINING
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Ducange Pietro
Lezione 018
01. Quale fra i seguenti criteri non rappresenta un criterio di convergenza dell'algoritmo di clustering k-means?
Riduzione eccessiva delle partizioni iniziali
Nessuna delle altre alternative
Differenza non significativa fra i valori assunti della funzione obiettivo in due iterazioni successive
Nessun cambiamento della matrice binaria U
02. Quali sono i punti di forza dell'algoritmo di clustering K-means?
1) Efficienza, in quanto identifica automaticamente il numero di cluster, 2) Termina in un ottimo locale
1) Efficienza, in quanto è lineare rispetto al numero di oggetti, 2) Termina in un ottimo locale
1) Efficienza, in quanto identifica automaticamente il numero di cluster, 2) Termina in un ottimo globale
1) Efficienza, in quanto è lineare rispetto al numero di oggetti, 2) Termina in un ottimo globale
03. Quali sono i principali parametri che occorre fissare per effettuare il clustering tramite l'algoritmo K-means?
Il numero K di cluster e il criterio di stop
Il numero K di punti del dataset da scartare ed il criterio di stop
Il numero K di iterazioni ed il criterio di stop
Il numero K di punti del dataset da utilizzare ed il criterio di stop
04. Quale è la differenza fra cluster e centroide nell'algoritmo di clustering K-means?
05. Discutere l'idea di base nell'algoritmo di clustering K-means?
06. Scrivere in pseudo codice o in un linguaggio di programmazione conosciuto l'algoritmo di clustering K-means?
07. Quale è la misura che si ottimizza nell'algoritmo di clustering K-means? © 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 19/41
Set Domande: DATA MINING
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Ducange Pietro
Lezione 019
01. L'algoritmo gerarchico di clustering DIANA quale approccio segue?
Model-Based
Agglomerativo
Partizionale
Divisivo
02. L'algoritmo gerarchico di clustering AGNES quale approccio segue?
Divisivo
Model-Based
Partizionale
Agglomerativo
03. Che cosa è un dendogramma?
E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering gerarchico
Nessuna delle altre alternative
E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering density-based
E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering partizionale
04. Negli algoritmi di clustering gerarchici con approccio agglomerativo come avviene l'inizializzazione?
Si parte con tanti cluster quanti sono gli oggetti
Si parte con un numero di cluster assegnato a priori
Si parte con un unico cluster contenente tutti gli oggetti
Si parte con un numero di cluster che dipende da un raggio e da un numero minimo di punti
05. Discutere i passi principali dell'algoritmo DIANA.
06. Discutere lo schema base di un un algoritmo di clustering gerarchico agglomerativo.
07. Come si calcola la distanza fra due cluster nati dalla fusione di due o più cluster?
08. Che cosa è il dendogramma?
09. Quali sono i pro e contro degli algoritmi di clustering gerarchico?
10. Quale è la principale differenza fra gli algoritmi AGNES e DIANA? © 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 20/41
Set Domande: DATA MINING
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Ducange Pietro
Lezione 020
01. Quali sono i principali parametri che occorre fissare per effettuare il clustering tramite l'algoritmo DBSCAN?
Nessuna delle altre alternative
Il numero Epsilon di punti del dataset da utilizzare ed il criterio di stop
Il numero Epsilon di cluster e il criterio di stop
Il numero Epsilon di iterazioni ed il criterio di stop
02. Oltre al valore del massimo raggio del vicinato, quale altro parametro deve essere specificato per l'algoritmo di clustering DBSCAN?
Il minimo numero di punti che devono essere contenuti all'interno di un vicinato
Il massimo numero di punti che devono essere contenuti all'interno di un vicinato
Il valor medio del numero di punti che devono essere contenuti all'interno di un vicinato
Nessuna delle altre alternative
03. Quando si parla di algorimo di clustering DBSCAN, cosa sono i core point?
Sono i punti la cui densità (numero di punti) e? inferiore a MinPts
Sono i punti la cui densità (numero di punti) e? superiore a MinPts
Sono i punti che si trovano ad una distanza superiore di EPS dal centroide del cluster
Sono i punti che si trovano ad una distanza inferiore di EPS dal centroide del cluster
04. Cosa rappresenta il parametro Epsilon dell'algoritmo di clustering DBSCAN?
Il minimo raggio del vicinato
Il massimo raggio del vicinato
Il valor medio del raggio del vicinato
Nessuna delle altre alternative
05. Discutere i pro e i contro dell'algoritmo di clustering DBSCAN.
06. Mostrare una implementazione del DBSCAN usando uno pseudocodice o un linguaggio di programmazione.
07. Discutere l'idea di base dell'algoritmo di clustering DBSCAN
08. Definire e mostrare graficamente cosa sono i Core point, Border Point e Noise Point nel contesto dell'algoritmo DBSCAN.
© 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 21/41
Set Domande: DATA MINING
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Ducange Pietro
Lezione 021
01. Che cosa è il supporto di una regola associativa?
E' la frequenza delle transazioni nel