Anteprima
Vedrai una selezione di 14 pagine su 64
Paniere Data mining - risposte multiple Pag. 1 Paniere Data mining - risposte multiple Pag. 2
Anteprima di 14 pagg. su 64.
Scarica il documento per vederlo tutto.
Paniere Data mining - risposte multiple Pag. 6
Anteprima di 14 pagg. su 64.
Scarica il documento per vederlo tutto.
Paniere Data mining - risposte multiple Pag. 11
Anteprima di 14 pagg. su 64.
Scarica il documento per vederlo tutto.
Paniere Data mining - risposte multiple Pag. 16
Anteprima di 14 pagg. su 64.
Scarica il documento per vederlo tutto.
Paniere Data mining - risposte multiple Pag. 21
Anteprima di 14 pagg. su 64.
Scarica il documento per vederlo tutto.
Paniere Data mining - risposte multiple Pag. 26
Anteprima di 14 pagg. su 64.
Scarica il documento per vederlo tutto.
Paniere Data mining - risposte multiple Pag. 31
Anteprima di 14 pagg. su 64.
Scarica il documento per vederlo tutto.
Paniere Data mining - risposte multiple Pag. 36
Anteprima di 14 pagg. su 64.
Scarica il documento per vederlo tutto.
Paniere Data mining - risposte multiple Pag. 41
Anteprima di 14 pagg. su 64.
Scarica il documento per vederlo tutto.
Paniere Data mining - risposte multiple Pag. 46
Anteprima di 14 pagg. su 64.
Scarica il documento per vederlo tutto.
Paniere Data mining - risposte multiple Pag. 51
Anteprima di 14 pagg. su 64.
Scarica il documento per vederlo tutto.
Paniere Data mining - risposte multiple Pag. 56
Anteprima di 14 pagg. su 64.
Scarica il documento per vederlo tutto.
Paniere Data mining - risposte multiple Pag. 61
1 su 64
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

SMCLagrange-Tchebychev

Che tipo di distanza si può utilizzare fra due punti descritti da variabili binarie simmetriche?

  1. Lagrange-Tchebychev
  2. Minkowski
  3. SMC
  4. Jaccard

Quando una variabile binaria si dice simmetrica?

  1. Se la probabilità che ciascuno dei suoi stati categorici si verifichi è uguale e tutti gli stati assumono lo stesso peso
  2. Se la probabilità che ciascuno dei suoi stati continui si verifichi è uguale e tutti gli stati assumono lo stesso peso
  3. Se la probabilità che ciascuno dei suoi stati si verifichi (che assuma valore zero o uno) è uguale ed entrambi gli stati assumono lo stesso peso
  4. Nessuna delle altre alternative

La formula della similarità coseno fra due vettori utilizza al suo interno?

  1. La norma dei due vettori e il prodotto vettoriale fra i due vettori
  2. Solo il prodotto scalare dei due vettori
  3. Solo il prodotto vettoriale fra due vettori
  4. La norma dei due vettori e il prodotto scalare fra i due vettori

E'

possibile calcolare la distanza fra istanze descritte da attributi nominali? No Si utilizzando una distanza basata sul matching Nessuna delle altre alternative Si utilizzando la distanza di Minkowski Che tipo di distanza si può usare fra due istanze descritte con attributi di tipologia mista? Euclidea Lagrange-Tchebychev Nessuna delle altre alternative Minkowski Lezione016 Che tipo di apprendimento si utilizza quando si creano modelli per il clustering? Semi-supervisionato Parzialmente supervisionato Non supervisionato Supervisionato Gli algoritmi di clustering si utilizzano per generare: Modelli associativi Modelli descrittivi Metodi di ottimizzazione Modelli predittivi Con riferimento agli algoritmi di clustering, quali delle seguenti affermazioni è falsa? Gli algoritmi di clustering possono essere utilizzati per la compressione dei dati Non ci sono classi predefinite, l'apprendimento del modello non avviene utilizzando esempi etichettati Gli algoritmi di clustering possono essere utilizzati per la classificazione dei dati

Aspirano a trovare gruppi nei dati in modo tale che la somiglianza dei dati all'interno dello stesso gruppo sia alta e sia bassa per punti appartenenti a gruppi diversi. E' sempre noto a priori il numero di cluster da cercare.

Un algoritmo di clustering produce cluster di alta qualità se assicura:

  1. Bassa similarità intra-cluster e alta similarità inter-cluster
  2. Alta similarità intra-cluster e bassa similarità inter-cluster
  3. Alta similarità intra-cluster e alta similarità inter-cluster
  4. Bassa similarità intra-cluster e bassa similarità inter-cluster

1. L'algoritmo di clustering SOM (self organizing map) a quale categoria di algoritmi appartiene?

Nessuna delle altre alternative

Gerarchici

Density-based

Partizionali

2. Quale tipologia di algoritmi di clustering è più efficiente per l'identificazione di outlier?

Partizionali

Nessuna delle altre alternative

Density-based

Gerarchici

3.

L'algoritmo di clustering AGNES appartiene alla categoria degli algoritmi gerarchici.

L'algoritmo di clustering k-means appartiene alla categoria degli algoritmi partizionali.

Il criterio "Riduzione eccessiva delle partizioni iniziali" non rappresenta un criterio di convergenza dell'algoritmo di clustering k-means.

I punti di forza dell'algoritmo di clustering K-means sono:

  1. Efficienza, in quanto identifica automaticamente il numero di cluster.
  2. Termina in un ottimo locale.
fusioni fra cluster generati man mano da un algoritmo di clustering gerarchico.fusioni fra cluster generati man mano da un algoritmo di clustering density-based

E' un diagramma ad albero che mostra le sequenza di fusioni fra cluster generati man mano da un algoritmo di clustering partizionale.

Negli algoritmi di clustering gerarchici con approccio agglomerativo come avviene l'inizializzazione?

  1. Si parte con tanti cluster quanti sono gli oggetti
  2. Si parte con un numero di cluster assegnato a priori
  3. Si parte con un unico cluster contenente tutti gli oggetti
  4. Si parte con un numero di cluster che dipende da un raggio e da un numero minimo di punti

Lezione019

Quali sono i principali parametri che occorre fissare per effettuare il clustering tramite l'algoritmo DBSCAN?

  1. Nessuna delle alternative
  2. Il numero Epsilon di punti del dataset da utilizzare ed il criterio di stop
  3. Il numero Epsilon di cluster e il criterio di stop
  4. Il numero Epsilon di iterazioni ed il criterio di stop

Oltre al valore del massimo raggio del vicinato, quale altro parametro

deve essere specificato per l'algoritmo di DBSCAN? Il minimo numero di punti che devono essere contenuti all'interno di un vicinato clustering DBSCAN? Il massimo numero di punti che devono essere contenuti all'interno di un vicinato Il valor medio del numero di punti che devono essere contenuti all'interno di un vicinato Nessuna delle altre alternative 3. Quando si parla di algorimo di clustering DBSCAN, cosa sono i core point? Sono i punti la cui densità (numero di punti) è inferiore a MinPts Sono i punti la cui densità (numero di punti) è superiore a MinPts Sono i punti che si trovano ad una distanza superiore di EPS dal centroide del cluster Sono i punti che si trovano ad una distanza inferiore di EPS dal centroide del cluster 4. Cosa rappresenta il parametro Epsilon dell'algoritmo di clustering DBSCAN? Il minimo raggio del vicinato Il massimo raggio del vicinato Il valor medio del raggio del vicinato Nessuna delle altre alternative Lezione02 11. Che cosa

è il supporto di una regola associativa? E' la frequenza delle transazioni nel database che verificano la regola rispetto a quelle che ne verificano l'antecedente. E' la frequenza relativa delle transazioni nel database che verificano la regola. Nessuna delle altre alternative. E' la frequenza delle transazioni nel database che verificano l'antecedente della regola.

2. Che cosa è la confidenza di una regola associativa? E' la frequenza delle transazioni nel database che verificano l'antecedente della regola. Nessuna delle altre alternative. E' la frequenza relativa delle transazioni nel database che verificano la regola. E' la frequenza delle transazioni nel database che verificano la regola rispetto a quelle che ne verificano l'antecedente.

3. Quando una regola associativa si definisce forte? Si definisce forte, una regola associativa che soddisfa un supporto massimo prefissato ed una confidenza minima prefissata.

regola associativa che soddisfa un supporto minimo prefissato ed una confidenza minima prefissata

Nessuna delle altre alternative

Si definisce forte, una regola associativa che soddisfa un supporto minimo prefissato ed una confidenza massima prefissata

4. La generazione di regole associative avviene utilizzando che tipologia di apprendimento?

Semi supervisionato

Semi specializzato

Supervisionato

Non supervisionato

5. Che cosa è una regola associativa?

È un'implicazione della forma X->Y, dove X e Y sono degli itemset

È un'implicazione della forma X->Y, dove X e Y sono degli item

È un'implicazione della forma X->Y, dove X è un item ed Y è un itemset

È un'implicazione della forma X->Y, dove X è un itemset ed Y è un item

6. Cosa è la Market Basket Analysis?

Una analisi ha l'obiettivo di studiare la regolarità, all'interno delle transazioni registrate, nelle

vendite dei supermercati

Nessuna delle altre alternative

Una analisi ha l'obiettivo di studiare come assumere i dipendenti nelle pubbliche amministrazioni americane

Una analisi ha l'obiettivo di studiare la regolarità, all'interno delle transazioni registrate, nel contesto del mercato giocatori di pallacanestro

Che cosa è un itemset? Un insieme di transazioni

Un insieme di regole

Un insieme di articoli

Nessuna delle altre alternative

A cosa serve l'algoritmo Apriori? Nessuna delle altre alternative

Per generare regole di classificazione

Per generare regole associative

Per generare regole di clustering

Quale è l'idea di base dell'algoritmo Apriori? L'algoritmo Apriori affronta la fase di generazione degli itemset frequenti per approssimazioni ricorsive, a partire dagli itemset con il numero massimo di elementi

L'algoritmo Apriori affronta la fase di generazione degli itemset frequenti per approssimazioni successive

Partire dagli itemset con un solo elemento

L'algoritmo Apriori affronta la fase di generazione degli itemset frequenti per approssimazioni ricorsive, a partire dagli itemset con un solo elemento

L'algoritmo Apriori affronta la fase di generazione degli itemset frequenti per approssimazioni successive, a partire dagli itemset con il numero massimo di elementi 3.

Che cosa è

Dettagli
Publisher
A.A. 2023-2024
64 pagine
3 download
SSD Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher fra5675 di informazioni apprese con la frequenza delle lezioni di Data mining e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università telematica "e-Campus" di Novedrate (CO) o del prof Ducange Pietro.