Anteprima
Vedrai una selezione di 10 pagine su 41
Paniere Completo di Data Mining B (2025) - Risposte multiple Pag. 1 Paniere Completo di Data Mining B (2025) - Risposte multiple Pag. 2
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere Completo di Data Mining B (2025) - Risposte multiple Pag. 6
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere Completo di Data Mining B (2025) - Risposte multiple Pag. 11
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere Completo di Data Mining B (2025) - Risposte multiple Pag. 16
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere Completo di Data Mining B (2025) - Risposte multiple Pag. 21
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere Completo di Data Mining B (2025) - Risposte multiple Pag. 26
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere Completo di Data Mining B (2025) - Risposte multiple Pag. 31
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere Completo di Data Mining B (2025) - Risposte multiple Pag. 36
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Paniere Completo di Data Mining B (2025) - Risposte multiple Pag. 41
1 su 41
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

SMC

Jaccard

Minkowski

Lagrange-Tchebychev

02. Che tipo di distanza si può utilizzare fra due punti descritti da variabili binarie simmetriche?

Jaccard

SMC

Lagrange-Tchebychev

Minkowski

03. Quando una variabile binaria si dice simmetrica?

Se la probabilità che ciascuno dei suoi stati categorici si verifichi è uguale e tutti gli stati assumono lo stesso peso

Se la probabilità che ciascuno dei suoi stati si verifichi (che assuma valore zero o uno) è uguale ed entrambi gli stati assumono lo stesso peso

Nessuna delle altre alternative

Se la probabilità che ciascuno dei suoi stati continui si verifichi è uguale e tutti gli stati assumono lo stesso peso

04. Discutere i passaggi per calcolare la distanza fra due vettori che contengono variabili ordinali

05. Quale è la differenza fra la distanza e la similarità di Jaccard?

06. Cosa si intende per ranking di una variabile ordinale.

Scaricato da Dominikview (domsmimmo@gmail.com)

© 2016 - 2023 Università Telematica eCampus - Data Stampa 05/12/2023 16:23:25 - 15/41

lOMoARcPSD|47650919

Set Domande: DATA MINING B

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Antonelli Michela

Lezione 015

01. La formula della similarità coseno fra due vettori utilizza al suo interno?

Solo il prodotto scalare dei due vettori

La norma dei due vettori e il prodotto vettoriale fra i due vettori

La norma dei due vettori e il prodotto scalare fra i due vettori

Solo il prodotto vettoriale fra due vettori

02. E' possibile calcolare la distanza fra istanze descritte da attributi nominali?

Nessuna delle altre alternative

No

Si utilizzando la distanza di Minkowski

Si utilizzando una distanza basata sul matching

03. Che tipo di distanza si può usare fra due istanze descritti con attributi di tipologia mista?

Lagrange-Tchebychev

Nessuna delle altre alternative

Minkowski

Euclidea

04. Discutere come si calcola la distanza fra oggetti descritti con attributi di tipologia mista.

05. Come si calcola la similarità coseno e in che contesto si utilizza?

06. La similarità coseno è anche una distanza. Vero o falso? Giustificare la risposta.

Scaricato da Dominikview (domsmimmo@gmail.com)

© 2016 - 2023 Università Telematica eCampus - Data Stampa 05/12/2023 16:23:25 - 16/41

lOMoARcPSD|47650919

Set Domande: DATA MINING B

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Antonelli Michela

Lezione 016

01. Che tipo di apprendimento si utilizza quando si creano modelli per il clustering?

Non supervisionato

Supervisionato

Parzialmente supervisionato

Semi-supervisionato

02. Gli algoritmi di clustering si utilizzano per generare:

Metodi di ottimizzazione

Modelli descrittivi

Modelli predittivi

Modelli associativi

03. Con riferimento agli algoritmi di clustering, quali delle seguenti affermazione è falsa?

Non ci sono classi predefinite, l'apprendimento del modello non avviene utilizzando esempi etichettati

E' sempre noto apriori il numero di cluster da cercare

Gli algoritmi di clustering aspirano a trovare gruppi nei dati in modo tale che la somiglianza dei dati all'interno dello stesso gruppo sia alta e sia bassa per punti appartenenti

a gruppi diversi.

Gli algoritmi di clustering possono essere utilizzati per la compressione dei dati

04. Un algoritmo di clustering produce cluster di alta qualità se assicura:

Alta similarità intra-cluster e alta similarità inter-cluster

Bassa similarità intra-cluster e alta similarità inter-cluster

Alta similarità intra-cluster e bassa similarità inter-cluster

Bassa similarità intra-cluster e bassa similarità inter-cluster

05. Discutere la principale differenza fra clustering e classificazione.

06. Quali sono i principali requisiti che devono assicurare gli algoritmi di clustering?

07. Definire il concetto di cluster.

08. Discutere la principale differenza fra apprendimento supervisionato e non supervisionato.

Scaricato da Dominikview (domsmimmo@gmail.com)

© 2016 - 2023 Università Telematica eCampus - Data Stampa 05/12/2023 16:23:25 - 17/41

lOMoARcPSD|47650919

Set Domande: DATA MINING B

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Antonelli Michela

Lezione 017

01. L'algoritmo di clustering SOM (self organizing map) a quale categoria di algoritmi appartiene?

Partizionali

Gerarchici

Density-based

Nessuna delle altre alternative

02. Quale tipologia di algoritmi di clustering è più efficiente per l'identificazione di outlier?

Partizionali

Nessuna delle altre alternative

Density-based

Gerarchici

03. L'algoritmo di clustering AGNES a quale categoria di algoritmi appartiene?

Gerarchici

Density-based

Partizionali

Nessuna delle altre alternative

04. L'algoritmo di clustering k-means a quale categoria di algoritmi appartiene?

Nessuna delle altre alternative

Density-based

Partizionali

Gerarchici

05. Discutere le principali caratteristiche degli algoritmi di clustering density-based.

06. Come funzionano gli algoritmi di clustering gerarchici?

07. Discutere la tassonomia degli algoritmi di clustering: come si raggruppare tali algoritmi?

08. Quale è la principale differenza fra algoritmi di clustering partizionali e density-based?

Scaricato da Dominikview (domsmimmo@gmail.com)

© 2016 - 2023 Università Telematica eCampus - Data Stampa 05/12/2023 16:23:25 - 18/41

lOMoARcPSD|47650919

Set Domande: DATA MINING B

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Antonelli Michela

Lezione 018

01. Quale fra i seguenti criteri non rappresenta un criterio di convergenza dell'algoritmo di clustering k-means?

Riduzione eccessiva delle partizioni iniziali

Nessun cambiamento della matrice binaria U

Differenza non significativa fra i valori assunti della funzione obiettivo in due iterazioni successive

Nessuna delle altre alternative

02. Quali sono i punti di forza dell'algoritmo di clustering K-means?

1) Efficienza, in quanto identifica automaticamente il numero di cluster, 2) Termina in un ottimo locale

1) Efficienza, in quanto identifica automaticamente il numero di cluster, 2) Termina in un ottimo globale

1) Efficienza, in quanto è lineare rispetto al numero di oggetti, 2) Termina in un ottimo locale

1) Efficienza, in quanto è lineare rispetto al numero di oggetti, 2) Termina in un ottimo globale

03. Quali sono i principali parametri che occorre fissare per effettuare il clustering tramite l'algoritmo K-means?

Il numero K di cluster e il criterio di stop

Il numero K di punti del dataset da scartare ed il criterio di stop

Il numero K di iterazioni ed il criterio di stop

Il numero K di punti del dataset da utilizzare ed il criterio di stop

04. Quale è la differenza fra cluster e centroide nell'algoritmo di clustering K-means?

05. Discutere l'idea di base nell'algoritmo di clustering K-means?

06. Scrivere in pseudo codice o in un linguaggio di programmazione conosciuto l'algoritmo di clustering K-means?

07. Quale è la misura che si ottimizza nell'algoritmo di clustering K-means?

Scaricato da Dominikview (domsmimmo@gmail.com)

© 2016 - 2023 Università Telematica eCampus - Data Stampa 05/12/2023 16:23:25 - 19/41

lOMoARcPSD|47650919

Set Domande: DATA MINING B

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Antonelli Michela

Lezione 019

01. L'algoritmo gerarchico di clustering DIANA quale approccio segue?

Agglomerativo

Model-Based

Partizionale

Divisivo

02. L'algoritmo gerarchico di clustering AGNES quale approccio segue?

Divisivo

Agglomerativo

Model-Based

Partizionale

03. Che cosa è un dendogramma?

E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering partizionale

E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering density-based

E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering gerarchico

Nessuna delle altre alternative

04. Negli algoritmi di clustering gerarchici con approccio agglomerativo come avviene l'inizializzazione?

Si parte con un numero di cluster che dipende da un raggio e da un numero minimo di punti

Si parte con tanti cluster quanti sono gli oggetti

Si parte con un numero di cluster assegnato a priori

Si parte con un unico cluster contenente tutti gli oggetti

05. Discutere i passi principali dell'algoritmo DIANA.

06. Discutere lo schema base di un un algoritmo di clustering gerarchico agglomerativo.

07. Come si calcola la distanza fra due cluster nati dalla fusione di due o più cluster?

08. Che cosa è il dendogramma?

09. Quali sono i pro e contro degli algoritmi di clustering gerarchico?

10. Quale è la principale differenza fra gli algoritmi AGNES e DIANA?

Scaricato da Dominikview (domsmimmo@gmail.com)

© 2016 - 2023 Università Telematica eCampus - Data Stampa 05/12/2023 16:23:25 - 20/41

lOMoARcPSD|47650919

Set Domande: DATA MINING B

INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE

Docente: Antonelli Michela

Lezione 020

01. Quali sono i principali parametri che occorre fissare per effettuare il clustering tramite l'algoritmo DBSCAN?

Il numero Epsilon di cluster e il criterio di stop

Il numero Epsilon di punti del dataset da utilizzare ed il criterio di stop

Nessuna delle altre alternative

Il numero Epsilon di iterazioni ed il criterio di stop

02. Oltre al valore del massimo raggio del vicinato, quale altro parametro deve essere specificato per l'algoritmo di clustering DBSCAN?

Il valor medio del numero di punti che devono essere contenuti all'interno di un vicinato

Il massimo numero di punti che devono essere contenuti all'interno di un vicinato

Nessuna delle altre alternative

Il minimo numero di punti che devono essere contenuti all'interno di un vicinato

03. Quando si parla di algorimo di clustering DBSCAN, cosa sono i core point?

Sono i punti la cui densità (numero di punti) e? inferiore a MinPts

Sono i punti che si trovano ad una distanza superiore di EPS dal centroide del cluster

Sono i punti la cui densità (numero di punti) e? superiore a MinPts

Sono i punti che si trovano ad una distanza inferiore di EPS dal centroide del cluster

04. Cosa rappresenta il parametro Epsilon dell'algoritmo di clustering DBSCAN?

Il minimo raggio del vicinato

Nessuna delle altre alternative

Il massimo raggio del vicinato

Il valor medio del raggio del vicinato

05. Discutere i pro e i contro dell'algoritmo di clustering DBSCAN.

06. Mostrare una implementazione del DBSCAN usando uno pseudocodice o un linguaggio di programmazione.

Dettagli
Publisher
A.A. 2025-2026
41 pagine
SSD Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher dominikks di informazioni apprese con la frequenza delle lezioni di Data mining e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università telematica "e-Campus" di Novedrate (CO) o del prof Antonelli Michela.