Anteprima
Vedrai una selezione di 10 pagine su 41
Paniere completo di Data Mining (2025) - Risposte multiple Pag. 1 Paniere completo di Data Mining (2025) - Risposte multiple Pag. 2
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere completo di Data Mining (2025) - Risposte multiple Pag. 6
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere completo di Data Mining (2025) - Risposte multiple Pag. 11
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere completo di Data Mining (2025) - Risposte multiple Pag. 16
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere completo di Data Mining (2025) - Risposte multiple Pag. 21
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere completo di Data Mining (2025) - Risposte multiple Pag. 26
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere completo di Data Mining (2025) - Risposte multiple Pag. 31
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere completo di Data Mining (2025) - Risposte multiple Pag. 36
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere completo di Data Mining (2025) - Risposte multiple Pag. 41
1 su 41
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

SMC

Lagrange-Tchebychev

02. Che tipo di distanza si può utilizzare fra due punti descritti da variabili binarie simmetriche?

Lagrange-Tchebychev

Minkowski

SMC

Jaccard

03. Quando una variabile binaria si dice simmetrica?

Se la probabilità che ciascuno dei suoi stati categorici si verifichi è uguale e tutti gli stati assumono lo stesso peso

Se la probabilità che ciascuno dei suoi stati continui si verifichi è uguale e tutti gli stati assumono lo stesso peso

Se la probabilità che ciascuno dei suoi stati si verifichi (che assuma valore zero o uno) è uguale ed entrambi gli stati assumono lo stesso peso

Nessuna delle altre alternative

04. Discutere i passaggi per calcolare la distanza fra due vettori che contengono variabili ordinali

05. Quale è la differenza fra la distanza e la similarità di Jaccard?

06. Cosa si intende per ranking di una variabile ordinale. © 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 15/41

Set Domande: DATA MINING

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Ducange Pietro

Lezione 015

01. La formula della similarità coseno fra due vettori utilizza al suo interno?

La norma dei due vettori e il prodotto vettoriale fra i due vettori

Solo il prodotto scalare dei due vettori

Solo il prodotto vettoriale fra due vettori

La norma dei due vettori e il prodotto scalare fra i due vettori

02. E' possibile calcolare la distanza fra istanze descritte da attributi nominali?

No

Si utilizzando una distanza basata sul matching

Nessuna delle altre alternative

Si utilizzando la distanza di Minkowski

03. Che tipo di distanza si può usare fra due istanze descritti con attributi di tipologia mista?

Euclidea

Lagrange-Tchebychev

Nessuna delle altre alternative

Minkowski

04. Discutere come si calcola la distanza fra oggetti descritti con attributi di tipologia mista.

05. Come si calcola la similarità coseno e in che contesto si utilizza?

06. La similarità coseno è anche una distanza. Vero o falso? Giustificare la risposta. © 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 16/41

Set Domande: DATA MINING

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Ducange Pietro

Lezione 016

01. Che tipo di apprendimento si utilizza quando si creano modelli per il clustering?

Semi-supervisionato

Parzialmente supervisionato

Non supervisionato

Supervisionato

02. Gli algoritmi di clustering si utilizzano per generare:

Modelli associativi

Modelli descrittivi

Metodi di ottimizzazione

Modelli predittivi

03. Con riferimento agli algoritmi di clustering, quali delle seguenti affermazione è falsa?

Gli algoritmi di clustering possono essere utilizzati per la compressione dei dati

Non ci sono classi predefinite, l'apprendimento del modello non avviene utilizzando esempi etichettati

Gli algoritmi di clustering aspirano a trovare gruppi nei dati in modo tale che la somiglianza dei dati all'interno dello stesso gruppo sia alta e sia bassa per punti appartenenti

a gruppi diversi.

E' sempre noto apriori il numero di cluster da cercare

04. Un algoritmo di clustering produce cluster di alta qualità se assicura:

Bassa similarità intra-cluster e alta similarità inter-cluster

Alta similarità intra-cluster e bassa similarità inter-cluster

Alta similarità intra-cluster e alta similarità inter-cluster

Bassa similarità intra-cluster e bassa similarità inter-cluster

05. Discutere la principale differenza fra clustering e classificazione.

06. Quali sono i principali requisiti che devono assicurare gli algoritmi di clustering?

07. Definire il concetto di cluster.

08. Discutere la principale differenza fra apprendimento supervisionato e non supervisionato.

© 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 17/41

Set Domande: DATA MINING

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Ducange Pietro

Lezione 017

01. L'algoritmo di clustering SOM (self organizing map) a quale categoria di algoritmi appartiene?

Nessuna delle altre alternative

Gerarchici

Density-based

Partizionali

02. Quale tipologia di algoritmi di clustering è più efficiente per l'identificazione di outlier?

Partizionali

Nessuna delle altre alternative

Density-based

Gerarchici

03. L'algoritmo di clustering AGNES a quale categoria di algoritmi appartiene?

Gerarchici

Partizionali

Nessuna delle altre alternative

Density-based

04. L'algoritmo di clustering k-means a quale categoria di algoritmi appartiene?

Gerarchici

Partizionali

Nessuna delle altre alternative

Density-based

05. Discutere le principali caratteristiche degli algoritmi di clustering density-based.

06. Come funzionano gli algoritmi di clustering gerarchici?

07. Discutere la tassonomia degli algoritmi di clustering: come si raggruppare tali algoritmi?

08. Quale è la principale differenza fra algoritmi di clustering partizionali e density-based? © 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 18/41

Set Domande: DATA MINING

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Ducange Pietro

Lezione 018

01. Quale fra i seguenti criteri non rappresenta un criterio di convergenza dell'algoritmo di clustering k-means?

Riduzione eccessiva delle partizioni iniziali

Nessuna delle altre alternative

Differenza non significativa fra i valori assunti della funzione obiettivo in due iterazioni successive

Nessun cambiamento della matrice binaria U

02. Quali sono i punti di forza dell'algoritmo di clustering K-means?

1) Efficienza, in quanto identifica automaticamente il numero di cluster, 2) Termina in un ottimo locale

1) Efficienza, in quanto è lineare rispetto al numero di oggetti, 2) Termina in un ottimo locale

1) Efficienza, in quanto identifica automaticamente il numero di cluster, 2) Termina in un ottimo globale

1) Efficienza, in quanto è lineare rispetto al numero di oggetti, 2) Termina in un ottimo globale

03. Quali sono i principali parametri che occorre fissare per effettuare il clustering tramite l'algoritmo K-means?

Il numero K di cluster e il criterio di stop

Il numero K di punti del dataset da scartare ed il criterio di stop

Il numero K di iterazioni ed il criterio di stop

Il numero K di punti del dataset da utilizzare ed il criterio di stop

04. Quale è la differenza fra cluster e centroide nell'algoritmo di clustering K-means?

05. Discutere l'idea di base nell'algoritmo di clustering K-means?

06. Scrivere in pseudo codice o in un linguaggio di programmazione conosciuto l'algoritmo di clustering K-means?

07. Quale è la misura che si ottimizza nell'algoritmo di clustering K-means? © 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 19/41

Set Domande: DATA MINING

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Ducange Pietro

Lezione 019

01. L'algoritmo gerarchico di clustering DIANA quale approccio segue?

Model-Based

Agglomerativo

Partizionale

Divisivo

02. L'algoritmo gerarchico di clustering AGNES quale approccio segue?

Divisivo

Model-Based

Partizionale

Agglomerativo

03. Che cosa è un dendogramma?

E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering gerarchico

Nessuna delle altre alternative

E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering density-based

E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering partizionale

04. Negli algoritmi di clustering gerarchici con approccio agglomerativo come avviene l'inizializzazione?

Si parte con tanti cluster quanti sono gli oggetti

Si parte con un numero di cluster assegnato a priori

Si parte con un unico cluster contenente tutti gli oggetti

Si parte con un numero di cluster che dipende da un raggio e da un numero minimo di punti

05. Discutere i passi principali dell'algoritmo DIANA.

06. Discutere lo schema base di un un algoritmo di clustering gerarchico agglomerativo.

07. Come si calcola la distanza fra due cluster nati dalla fusione di due o più cluster?

08. Che cosa è il dendogramma?

09. Quali sono i pro e contro degli algoritmi di clustering gerarchico?

10. Quale è la principale differenza fra gli algoritmi AGNES e DIANA? © 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 20/41

Set Domande: DATA MINING

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Ducange Pietro

Lezione 020

01. Quali sono i principali parametri che occorre fissare per effettuare il clustering tramite l'algoritmo DBSCAN?

Nessuna delle altre alternative

Il numero Epsilon di punti del dataset da utilizzare ed il criterio di stop

Il numero Epsilon di cluster e il criterio di stop

Il numero Epsilon di iterazioni ed il criterio di stop

02. Oltre al valore del massimo raggio del vicinato, quale altro parametro deve essere specificato per l'algoritmo di clustering DBSCAN?

Il minimo numero di punti che devono essere contenuti all'interno di un vicinato

Il massimo numero di punti che devono essere contenuti all'interno di un vicinato

Il valor medio del numero di punti che devono essere contenuti all'interno di un vicinato

Nessuna delle altre alternative

03. Quando si parla di algorimo di clustering DBSCAN, cosa sono i core point?

Sono i punti la cui densità (numero di punti) e? inferiore a MinPts

Sono i punti la cui densità (numero di punti) e? superiore a MinPts

Sono i punti che si trovano ad una distanza superiore di EPS dal centroide del cluster

Sono i punti che si trovano ad una distanza inferiore di EPS dal centroide del cluster

04. Cosa rappresenta il parametro Epsilon dell'algoritmo di clustering DBSCAN?

Il minimo raggio del vicinato

Il massimo raggio del vicinato

Il valor medio del raggio del vicinato

Nessuna delle altre alternative

05. Discutere i pro e i contro dell'algoritmo di clustering DBSCAN.

06. Mostrare una implementazione del DBSCAN usando uno pseudocodice o un linguaggio di programmazione.

07. Discutere l'idea di base dell'algoritmo di clustering DBSCAN

08. Definire e mostrare graficamente cosa sono i Core point, Border Point e Noise Point nel contesto dell'algoritmo DBSCAN.

© 2016 - 2018 Università Telematica eCampus - Data Stampa 28/07/2018 14:53:26 - 21/41

Set Domande: DATA MINING

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Ducange Pietro

Lezione 021

01. Che cosa è il supporto di una regola associativa?

E' la frequenza delle transazioni nel

Dettagli
Publisher
A.A. 2025-2026
41 pagine
SSD Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher dominikks di informazioni apprese con la frequenza delle lezioni di Data mining e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università telematica "e-Campus" di Novedrate (CO) o del prof Ducange Pietro.