Anteprima
Vedrai una selezione di 9 pagine su 37
Paniere risposte chiuse Data Mining Pag. 1 Paniere risposte chiuse Data Mining Pag. 2
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Paniere risposte chiuse Data Mining Pag. 6
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Paniere risposte chiuse Data Mining Pag. 11
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Paniere risposte chiuse Data Mining Pag. 16
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Paniere risposte chiuse Data Mining Pag. 21
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Paniere risposte chiuse Data Mining Pag. 26
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Paniere risposte chiuse Data Mining Pag. 31
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Paniere risposte chiuse Data Mining Pag. 36
1 su 37
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

‭KNN‬

‭Alberi di decisione‬

‭02.‬ ‭La selezione degli attributi è in sostanza in problema di:‬

‭Classificazione‬

‭Ottimizzazione‬

‭Nessuna delle altre alternative‬

‭03.‬ ‭Nella strategia di selezione in avanti, il processo di selezione di attributi in genere comincia con:‬

‭Nessuna delle altre alternative‬

‭Un insieme iniziale contenente tutti gli attributi‬

‭Un insieme iniziale contenente un certo numero di‬‭attributi a caso‬

‭04.‬ ‭Nella strategia di selezione all'indietro, il processo di selezione di attributi in genere comincia con:‬

‭Nessuna delle altre alternative‬

‭Un insieme iniziale contenente un certo numero di‬‭attributi a caso‬

‭05.‬ ‭Quale fra le seguenti non è una tecnica non parametrica per la riduzione della numerosità?‬

‭Istogrammi‬

‭Clustering‬

‭Campionamento‬

‭06.‬ ‭Quali delle seguenti tecniche di classficazione possono essere usate anche per la selezione degli attributi?‬

‭Reti neuronali feed forward‬

‭KNN‬

‭Classificatori bayesiani‬

‭07.‬ ‭Discutere la mutua informazione fra due attributi/variabili e spiegare come può essere utilizzata nel processo di selezione di attributi.‬

‭08.‬ ‭Cosa si intende per attributi ridondanti e irrilevanti?‬

‭09.‬ ‭Discutere le differenze fra metodi wrapper e metodi filter per la selezione di attributi.‬

‭10.‬ ‭Cosa si intende per metodo greedy?‬

‭01.‬ ‭A cosa serve la normalizzazione dei dati?‬

‭Si tratta di una sorta di filtraggio per rimuovere l'eventuale rumore che affligge i dati‬

‭02.‬ ‭Se una tecnica di discretizzazione dei dati utilizza le etichette delle classi e le informazioni da esse derivanti di che tipologia è?‬

‭Semi-supervisionata‬

‭03.‬ ‭Cosa si intende per splitting?‬

‭E' una tecnica di discretizzazione basata sul binning‬

‭E' una tecnica di discretizzazione basata sul‬

‭clustering‬

‭E' la fase di un processo di discretizzazione in‬‭cui gli attributi vengono trasformati in modo che abbiano tutti lo stesso peso o influenza‬

‭04.‬ ‭Discutere una tecnica per la generazione di gerarchie di concetti per dati nominali.‬

‭05.‬ ‭Cosa sono le gerarchie di concetti? Per cosa possono essere utili?‬

‭06.‬ ‭Discutere la discretizzazione dei dati e la tassonomia delle tecniche esistenti.‬

‭07.‬ ‭Cosa si intende per data transformation e quali sono le principali tecniche ad essa collegate?‬

‭01.‬ ‭Quali sono le condizioni che deve soddisfare una misura di similarità fra due punti?‬

‭Riflessività, non negatività,‬

‭simmetria‬ ‭Nessuna delle altre‬

‭alternative‬ ‭Riflessività, derivabilità,‬

‭simmetria‬

‭02.‬ ‭Quali sono le condizioni che deve soddisfare una misura di distanza fra due punti?‬

‭Riflessività, omogeneità, simmetria‬

‭Riflessività, derivabilità, simmetria‬

‭03.‬ ‭Quando una disanza si definisce metrica?‬

‭Quando rispetta anche la condizione di simmetria‬

‭Nessuna delle altre alternative‬

‭04.‬ ‭Quale è la differenza fra distanza e similarità?‬

‭05.‬ ‭Cosa sono la matrice dei dati e la matrice di dissimilarità?‬

‭06.‬ ‭Cosa è la diseguaglianza triangolare? Fornire un semplice esempio grafico.‬

‭01.‬ ‭Nella formula della distanza di Mahalanobis che tipo di matrice è presente?‬

‭Matrice triangolare superiore‬

‭Matrice identità‬

‭Nessuna delle altre alternative‬

‭02.‬ ‭La distanza Manhattan è un caso particolare di quale distanza?‬

‭Nessuna delle altre‬

‭alternative‬

‭Lagrange-Tchebychev‬

‭Euclidea‬

‭03.‬ ‭Quali sono le proprietà della distanza Minkowski?‬

‭Nessuna delle altre alternative‬

‭Definita negativa, simmetrica e gode di diseguaglianza‬‭triangolare‬

‭04.‬ ‭Definire la distanza di Minkowski e discutere le sue proprietà.‬

‭05.‬ ‭Cosa si intende per ordine della distanza Minkowski?‬

‭06.‬ ‭Quali sono le altre distanze che si ottengono al variare dell'ordine della distanza Minkowski?‬

‭01.‬ ‭Che tipo di distanza si può utilizzare fra due punti descritti da variabili binarie asimmetriche?‬

‭Minkowski‬

‭SMC‬

‭Lagrange-Tchebychev‬

‭02.‬ ‭Che tipo di distanza si può utilizzare fra due punti descritti da variabili binarie simmetriche?‬

‭Lagrange-Tchebychev‬

‭Minkowski‬

‭Jaccard‬

‭03.‬ ‭Quando una variabile binaria si dice simmetrica?‬

‭Nessuna delle altre alternative‬

‭04.‬ ‭Discutere i passaggi per calcolare la distanza fra due vettori che contengono variabili ordinali‬

‭05.‬ ‭Quale è la differenza fra la distanza e la similarità di Jaccard?‬

‭06.‬ ‭Cosa si intende per ranking di una variabile ordinale.‬

‭01.‬ ‭La formula della similarità coseno fra due vettori utilizza al suo interno?‬

‭La norma dei due vettori e il prodotto vettoriale fra i due vettori‬

‭02.‬ ‭E' possibile calcolare la distanza fra istanze descritte da attributi nominali?‬

‭Nessuna delle altre alternative‬

‭Si utilizzando la distanza di Minkowski‬

‭03.‬ ‭Che tipo di distanza si può usare fra due istanze descritti con attributi di tipologia mista?‬

‭Minkowski‬

‭04.‬ ‭Discutere come si calcola la distanza fra oggetti descritti con attributi di tipologia mista.‬

‭05.‬ ‭Come si calcola la similarità coseno e in che contesto si utilizza?‬

‭06.‬ ‭La similarità coseno è anche una distanza. Vero o falso? Giustificare la risposta.‬

‭01.‬ ‭Che tipo di apprendimento si utilizza quando si creano modelli per il clustering?‬

‭Semi-supervisionato‬

‭Parzialmente supervisionato‬

‭Supervisionato‬

‭02.‬ ‭Gli algoritmi di clustering si utilizzano per generare:‬

‭Metodi di‬

‭ottimizzazione‬ ‭Modelli‬

‭predittivi‬

‭03.‬ ‭Con riferimento agli algoritmi di clustering, quali delle seguenti affermazione è falsa?‬

‭Gli algoritmi di clustering possono essere utilizzati‬‭per la compressione dei dati‬

‭Non ci sono classi predefinite, l'apprendimento‬‭del modello non avviene utilizzando esempi etichettati‬

‭Gli algoritmi di clustering aspirano a trovare gruppi‬‭nei dati in modo tale che la somiglianza dei dati all'interno dello stesso gruppo sia alta e sia bassa per punti appartenenti‬

‭a gruppi diversi.‬

‭E' sempre noto apriori il numero di cluster da cercare‬

‭04.‬ ‭Un algoritmo di clustering produce cluster di alta qualità se assicura:‬

‭Alta similarità intra-cluster e alta similarità‬‭inter-cluster‬

‭Bassa similarità intra-cluster e bassa similarità‬‭inter-cluster‬

‭05.‬ ‭Discutere la principale differenza fra clustering e classificazione.‬

‭06.‬ ‭Quali sono i principali requisiti che devono assicurare gli algoritmi di clustering?‬

‭07.‬ ‭Definire il concetto di cluster.‬

‭08.‬ ‭Discutere la principale differenza fra apprendimento supervisionato e non supervisionato.‬

‭01.‬ ‭L'algoritmo di clustering SOM (self organizing map) a quale categoria di algoritmi appartiene?‬

‭Gerarchici‬

‭Density-based‬

‭Partizionali‬

‭02.‬ ‭Quale tipologia di algoritmi di clustering è più efficiente per l'identificazione di outlier?‬

‭Partizionali‬

‭Nessuna delle altre alternative‬

‭Gerarchici‬

‭03.‬ ‭L'algoritmo di clustering AGNES a quale categoria di algoritmi appartiene?‬

‭Partizionali‬

‭Nessuna delle altre‬

‭alternative‬ ‭Density-based‬

‭04.‬ ‭L'algoritmo di clustering k-means a quale categoria di algoritmi appartiene?‬

‭Nessuna delle altre‬

‭alternative‬ ‭Density-based‬

‭05.‬ ‭Discutere le principali caratteristiche degli algoritmi di clustering density-based.‬

‭06.‬ ‭Come funzionano gli algoritmi di clustering gerarchici?‬

‭07.‬ ‭Discutere la tassonomia degli algoritmi di clustering: come si raggruppare tali algoritmi?‬

‭08.‬ ‭Quale è la principale differenza fra algoritmi di clustering partizionali e density-based?‬

‭01.‬ ‭Quale fra i seguenti criteri non rappresenta un criterio di convergenza dell'algoritmo di clustering k-means?‬

‭Riduzione eccessiva delle partizioni iniziali‬

‭Differenza non significativa fra i valori assunti‬‭della funzione obiettivo in due iterazioni successive‬

‭Nessun cambiamento della matrice binaria U‬

‭02.‬ ‭Quali sono i punti di forza dell'algoritmo di clustering K-means?‬

‭1) Efficienza, in quanto identifica automaticamente il numero di cluster, 2) Termina in un ottimo locale‬

‭1) Efficienza, in quanto identifica automaticamente il numero di cluster, 2) Termina in un ottimo globale‬

‭1) Efficienza, in quanto è lineare rispetto al numero di oggetti, 2) Termina in un ottimo globale‬

‭03.‬ ‭Quali sono i principali parametri che occorre fissare per effettuare il clustering tramite l'algoritmo K-means?‬

‭Il numero K di punti del dataset da scartare ed‬‭il criterio di stop‬

‭Il numero K di iterazioni ed il criterio di stop‬

‭Il numero K di punti del dataset da utilizzare ed‬‭il criterio di stop‬

‭04.‬ ‭Quale è la differenza fra cluster e centroide nell'algoritmo di clustering K-means?‬

‭05.‬ ‭Discutere l'idea di base nell'algoritmo di clustering K-means?‬

‭06.‬ ‭Scrivere in pseudo codice o in un linguaggio di programmazione conosciuto l'algoritmo di clustering K-means?‬

‭07.‬ ‭Quale è la misura che si ottimizza nell'algoritmo di clustering K-means?‬

‭01.‬ ‭L'algoritmo gerarchico di clustering DIANA quale approccio segue?‬

‭Nessuna delle altre alternative‬

‭E' un diagramma ad albero che mostra le sequenza‬‭di fusioni fra cluster generati man mano da un algoritmo di clustering density-based‬

‭E' un diagramma ad albero che mostra le sequenza‬‭di fusioni fra cluster generati man mano da un algoritmo di clustering partizionale‬

‭04.‬ ‭Negli algoritmi di clustering gerarchici con approccio agglomerativo come avviene l'inizializzazione?‬

‭Si parte con un numero di cluster assegnato a priori‬

‭Si parte con un unico cluster contenente tutti gli oggetti‬

‭Si parte con un numero di cluster che dipende da‬‭un raggio e da un numero minimo di punti‬

‭05.‬ ‭Discutere i passi principali dell'algoritmo DIANA.‬

‭06.‬ ‭Discutere lo schema base di un un algoritmo di clustering gerarchico agglomerativo.‬

‭07.‬ ‭Come si calcola la distanza fra due cluster na

Dettagli
Publisher
A.A. 2022-2023
37 pagine
SSD Ingegneria industriale e dell'informazione ING-INF/05 Sistemi di elaborazione delle informazioni

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher carmdevol di informazioni apprese con la frequenza delle lezioni di Data mining e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università telematica "e-Campus" di Novedrate (CO) o del prof Antonelli Michela.