Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
SMC
Jaccard
Minkowski
Lagrange-Tchebychev
02. Che tipo di distanza si può utilizzare fra due punti descritti da variabili binarie simmetriche?
Jaccard
SMC
Lagrange-Tchebychev
Minkowski
03. Quando una variabile binaria si dice simmetrica?
Se la probabilità che ciascuno dei suoi stati categorici si verifichi è uguale e tutti gli stati assumono lo stesso peso
Se la probabilità che ciascuno dei suoi stati si verifichi (che assuma valore zero o uno) è uguale ed entrambi gli stati assumono lo stesso peso
Nessuna delle altre alternative
Se la probabilità che ciascuno dei suoi stati continui si verifichi è uguale e tutti gli stati assumono lo stesso peso
04. Discutere i passaggi per calcolare la distanza fra due vettori che contengono variabili ordinali
05. Quale è la differenza fra la distanza e la similarità di Jaccard?
06. Cosa si intende per ranking di una variabile ordinale.
Scaricato da Dominikview (domsmimmo@gmail.com)
© 2016 - 2023 Università Telematica eCampus - Data Stampa 05/12/2023 16:23:25 - 15/41
lOMoARcPSD|47650919
Set Domande: DATA MINING B
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Antonelli Michela
Lezione 015
01. La formula della similarità coseno fra due vettori utilizza al suo interno?
Solo il prodotto scalare dei due vettori
La norma dei due vettori e il prodotto vettoriale fra i due vettori
La norma dei due vettori e il prodotto scalare fra i due vettori
Solo il prodotto vettoriale fra due vettori
02. E' possibile calcolare la distanza fra istanze descritte da attributi nominali?
Nessuna delle altre alternative
No
Si utilizzando la distanza di Minkowski
Si utilizzando una distanza basata sul matching
03. Che tipo di distanza si può usare fra due istanze descritti con attributi di tipologia mista?
Lagrange-Tchebychev
Nessuna delle altre alternative
Minkowski
Euclidea
04. Discutere come si calcola la distanza fra oggetti descritti con attributi di tipologia mista.
05. Come si calcola la similarità coseno e in che contesto si utilizza?
06. La similarità coseno è anche una distanza. Vero o falso? Giustificare la risposta.
Scaricato da Dominikview (domsmimmo@gmail.com)
© 2016 - 2023 Università Telematica eCampus - Data Stampa 05/12/2023 16:23:25 - 16/41
lOMoARcPSD|47650919
Set Domande: DATA MINING B
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Antonelli Michela
Lezione 016
01. Che tipo di apprendimento si utilizza quando si creano modelli per il clustering?
Non supervisionato
Supervisionato
Parzialmente supervisionato
Semi-supervisionato
02. Gli algoritmi di clustering si utilizzano per generare:
Metodi di ottimizzazione
Modelli descrittivi
Modelli predittivi
Modelli associativi
03. Con riferimento agli algoritmi di clustering, quali delle seguenti affermazione è falsa?
Non ci sono classi predefinite, l'apprendimento del modello non avviene utilizzando esempi etichettati
E' sempre noto apriori il numero di cluster da cercare
Gli algoritmi di clustering aspirano a trovare gruppi nei dati in modo tale che la somiglianza dei dati all'interno dello stesso gruppo sia alta e sia bassa per punti appartenenti
a gruppi diversi.
Gli algoritmi di clustering possono essere utilizzati per la compressione dei dati
04. Un algoritmo di clustering produce cluster di alta qualità se assicura:
Alta similarità intra-cluster e alta similarità inter-cluster
Bassa similarità intra-cluster e alta similarità inter-cluster
Alta similarità intra-cluster e bassa similarità inter-cluster
Bassa similarità intra-cluster e bassa similarità inter-cluster
05. Discutere la principale differenza fra clustering e classificazione.
06. Quali sono i principali requisiti che devono assicurare gli algoritmi di clustering?
07. Definire il concetto di cluster.
08. Discutere la principale differenza fra apprendimento supervisionato e non supervisionato.
Scaricato da Dominikview (domsmimmo@gmail.com)
© 2016 - 2023 Università Telematica eCampus - Data Stampa 05/12/2023 16:23:25 - 17/41
lOMoARcPSD|47650919
Set Domande: DATA MINING B
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Antonelli Michela
Lezione 017
01. L'algoritmo di clustering SOM (self organizing map) a quale categoria di algoritmi appartiene?
Partizionali
Gerarchici
Density-based
Nessuna delle altre alternative
02. Quale tipologia di algoritmi di clustering è più efficiente per l'identificazione di outlier?
Partizionali
Nessuna delle altre alternative
Density-based
Gerarchici
03. L'algoritmo di clustering AGNES a quale categoria di algoritmi appartiene?
Gerarchici
Density-based
Partizionali
Nessuna delle altre alternative
04. L'algoritmo di clustering k-means a quale categoria di algoritmi appartiene?
Nessuna delle altre alternative
Density-based
Partizionali
Gerarchici
05. Discutere le principali caratteristiche degli algoritmi di clustering density-based.
06. Come funzionano gli algoritmi di clustering gerarchici?
07. Discutere la tassonomia degli algoritmi di clustering: come si raggruppare tali algoritmi?
08. Quale è la principale differenza fra algoritmi di clustering partizionali e density-based?
Scaricato da Dominikview (domsmimmo@gmail.com)
© 2016 - 2023 Università Telematica eCampus - Data Stampa 05/12/2023 16:23:25 - 18/41
lOMoARcPSD|47650919
Set Domande: DATA MINING B
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Antonelli Michela
Lezione 018
01. Quale fra i seguenti criteri non rappresenta un criterio di convergenza dell'algoritmo di clustering k-means?
Riduzione eccessiva delle partizioni iniziali
Nessun cambiamento della matrice binaria U
Differenza non significativa fra i valori assunti della funzione obiettivo in due iterazioni successive
Nessuna delle altre alternative
02. Quali sono i punti di forza dell'algoritmo di clustering K-means?
1) Efficienza, in quanto identifica automaticamente il numero di cluster, 2) Termina in un ottimo locale
1) Efficienza, in quanto identifica automaticamente il numero di cluster, 2) Termina in un ottimo globale
1) Efficienza, in quanto è lineare rispetto al numero di oggetti, 2) Termina in un ottimo locale
1) Efficienza, in quanto è lineare rispetto al numero di oggetti, 2) Termina in un ottimo globale
03. Quali sono i principali parametri che occorre fissare per effettuare il clustering tramite l'algoritmo K-means?
Il numero K di cluster e il criterio di stop
Il numero K di punti del dataset da scartare ed il criterio di stop
Il numero K di iterazioni ed il criterio di stop
Il numero K di punti del dataset da utilizzare ed il criterio di stop
04. Quale è la differenza fra cluster e centroide nell'algoritmo di clustering K-means?
05. Discutere l'idea di base nell'algoritmo di clustering K-means?
06. Scrivere in pseudo codice o in un linguaggio di programmazione conosciuto l'algoritmo di clustering K-means?
07. Quale è la misura che si ottimizza nell'algoritmo di clustering K-means?
Scaricato da Dominikview (domsmimmo@gmail.com)
© 2016 - 2023 Università Telematica eCampus - Data Stampa 05/12/2023 16:23:25 - 19/41
lOMoARcPSD|47650919
Set Domande: DATA MINING B
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Antonelli Michela
Lezione 019
01. L'algoritmo gerarchico di clustering DIANA quale approccio segue?
Agglomerativo
Model-Based
Partizionale
Divisivo
02. L'algoritmo gerarchico di clustering AGNES quale approccio segue?
Divisivo
Agglomerativo
Model-Based
Partizionale
03. Che cosa è un dendogramma?
E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering partizionale
E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering density-based
E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering gerarchico
Nessuna delle altre alternative
04. Negli algoritmi di clustering gerarchici con approccio agglomerativo come avviene l'inizializzazione?
Si parte con un numero di cluster che dipende da un raggio e da un numero minimo di punti
Si parte con tanti cluster quanti sono gli oggetti
Si parte con un numero di cluster assegnato a priori
Si parte con un unico cluster contenente tutti gli oggetti
05. Discutere i passi principali dell'algoritmo DIANA.
06. Discutere lo schema base di un un algoritmo di clustering gerarchico agglomerativo.
07. Come si calcola la distanza fra due cluster nati dalla fusione di due o più cluster?
08. Che cosa è il dendogramma?
09. Quali sono i pro e contro degli algoritmi di clustering gerarchico?
10. Quale è la principale differenza fra gli algoritmi AGNES e DIANA?
Scaricato da Dominikview (domsmimmo@gmail.com)
© 2016 - 2023 Università Telematica eCampus - Data Stampa 05/12/2023 16:23:25 - 20/41
lOMoARcPSD|47650919
Set Domande: DATA MINING B
INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
Docente: Antonelli Michela
Lezione 020
01. Quali sono i principali parametri che occorre fissare per effettuare il clustering tramite l'algoritmo DBSCAN?
Il numero Epsilon di cluster e il criterio di stop
Il numero Epsilon di punti del dataset da utilizzare ed il criterio di stop
Nessuna delle altre alternative
Il numero Epsilon di iterazioni ed il criterio di stop
02. Oltre al valore del massimo raggio del vicinato, quale altro parametro deve essere specificato per l'algoritmo di clustering DBSCAN?
Il valor medio del numero di punti che devono essere contenuti all'interno di un vicinato
Il massimo numero di punti che devono essere contenuti all'interno di un vicinato
Nessuna delle altre alternative
Il minimo numero di punti che devono essere contenuti all'interno di un vicinato
03. Quando si parla di algorimo di clustering DBSCAN, cosa sono i core point?
Sono i punti la cui densità (numero di punti) e? inferiore a MinPts
Sono i punti che si trovano ad una distanza superiore di EPS dal centroide del cluster
Sono i punti la cui densità (numero di punti) e? superiore a MinPts
Sono i punti che si trovano ad una distanza inferiore di EPS dal centroide del cluster
04. Cosa rappresenta il parametro Epsilon dell'algoritmo di clustering DBSCAN?
Il minimo raggio del vicinato
Nessuna delle altre alternative
Il massimo raggio del vicinato
Il valor medio del raggio del vicinato
05. Discutere i pro e i contro dell'algoritmo di clustering DBSCAN.
06. Mostrare una implementazione del DBSCAN usando uno pseudocodice o un linguaggio di programmazione.
- Risolvere un problema di matematica
- Riassumere un testo
- Tradurre una frase
- E molto altro ancora...
Per termini, condizioni e privacy, visita la relativa pagina.