Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
KNN
Alberi di decisione
02. La selezione degli attributi è in sostanza in problema di:
Classificazione
Ottimizzazione
Nessuna delle altre alternative
03. Nella strategia di selezione in avanti, il processo di selezione di attributi in genere comincia con:
Nessuna delle altre alternative
Un insieme iniziale contenente tutti gli attributi
Un insieme iniziale contenente un certo numero diattributi a caso
04. Nella strategia di selezione all'indietro, il processo di selezione di attributi in genere comincia con:
Nessuna delle altre alternative
Un insieme iniziale contenente un certo numero diattributi a caso
05. Quale fra le seguenti non è una tecnica non parametrica per la riduzione della numerosità?
Istogrammi
Clustering
Campionamento
06. Quali delle seguenti tecniche di classficazione possono essere usate anche per la selezione degli attributi?
Reti neuronali feed forward
KNN
Classificatori bayesiani
07. Discutere la mutua informazione fra due attributi/variabili e spiegare come può essere utilizzata nel processo di selezione di attributi.
08. Cosa si intende per attributi ridondanti e irrilevanti?
09. Discutere le differenze fra metodi wrapper e metodi filter per la selezione di attributi.
10. Cosa si intende per metodo greedy?
01. A cosa serve la normalizzazione dei dati?
Si tratta di una sorta di filtraggio per rimuovere l'eventuale rumore che affligge i dati
02. Se una tecnica di discretizzazione dei dati utilizza le etichette delle classi e le informazioni da esse derivanti di che tipologia è?
Semi-supervisionata
03. Cosa si intende per splitting?
E' una tecnica di discretizzazione basata sul binning
E' una tecnica di discretizzazione basata sul
clustering
E' la fase di un processo di discretizzazione incui gli attributi vengono trasformati in modo che abbiano tutti lo stesso peso o influenza
04. Discutere una tecnica per la generazione di gerarchie di concetti per dati nominali.
05. Cosa sono le gerarchie di concetti? Per cosa possono essere utili?
06. Discutere la discretizzazione dei dati e la tassonomia delle tecniche esistenti.
07. Cosa si intende per data transformation e quali sono le principali tecniche ad essa collegate?
01. Quali sono le condizioni che deve soddisfare una misura di similarità fra due punti?
Riflessività, non negatività,
simmetria Nessuna delle altre
alternative Riflessività, derivabilità,
simmetria
02. Quali sono le condizioni che deve soddisfare una misura di distanza fra due punti?
Riflessività, omogeneità, simmetria
Riflessività, derivabilità, simmetria
03. Quando una disanza si definisce metrica?
Quando rispetta anche la condizione di simmetria
Nessuna delle altre alternative
04. Quale è la differenza fra distanza e similarità?
05. Cosa sono la matrice dei dati e la matrice di dissimilarità?
06. Cosa è la diseguaglianza triangolare? Fornire un semplice esempio grafico.
01. Nella formula della distanza di Mahalanobis che tipo di matrice è presente?
Matrice triangolare superiore
Matrice identità
Nessuna delle altre alternative
02. La distanza Manhattan è un caso particolare di quale distanza?
Nessuna delle altre
alternative
Lagrange-Tchebychev
Euclidea
03. Quali sono le proprietà della distanza Minkowski?
Nessuna delle altre alternative
Definita negativa, simmetrica e gode di diseguaglianzatriangolare
04. Definire la distanza di Minkowski e discutere le sue proprietà.
05. Cosa si intende per ordine della distanza Minkowski?
06. Quali sono le altre distanze che si ottengono al variare dell'ordine della distanza Minkowski?
01. Che tipo di distanza si può utilizzare fra due punti descritti da variabili binarie asimmetriche?
Minkowski
SMC
Lagrange-Tchebychev
02. Che tipo di distanza si può utilizzare fra due punti descritti da variabili binarie simmetriche?
Lagrange-Tchebychev
Minkowski
Jaccard
03. Quando una variabile binaria si dice simmetrica?
Nessuna delle altre alternative
04. Discutere i passaggi per calcolare la distanza fra due vettori che contengono variabili ordinali
05. Quale è la differenza fra la distanza e la similarità di Jaccard?
06. Cosa si intende per ranking di una variabile ordinale.
01. La formula della similarità coseno fra due vettori utilizza al suo interno?
La norma dei due vettori e il prodotto vettoriale fra i due vettori
02. E' possibile calcolare la distanza fra istanze descritte da attributi nominali?
Nessuna delle altre alternative
Si utilizzando la distanza di Minkowski
03. Che tipo di distanza si può usare fra due istanze descritti con attributi di tipologia mista?
Minkowski
04. Discutere come si calcola la distanza fra oggetti descritti con attributi di tipologia mista.
05. Come si calcola la similarità coseno e in che contesto si utilizza?
06. La similarità coseno è anche una distanza. Vero o falso? Giustificare la risposta.
01. Che tipo di apprendimento si utilizza quando si creano modelli per il clustering?
Semi-supervisionato
Parzialmente supervisionato
Supervisionato
02. Gli algoritmi di clustering si utilizzano per generare:
Metodi di
ottimizzazione Modelli
predittivi
03. Con riferimento agli algoritmi di clustering, quali delle seguenti affermazione è falsa?
Gli algoritmi di clustering possono essere utilizzatiper la compressione dei dati
Non ci sono classi predefinite, l'apprendimentodel modello non avviene utilizzando esempi etichettati
Gli algoritmi di clustering aspirano a trovare gruppinei dati in modo tale che la somiglianza dei dati all'interno dello stesso gruppo sia alta e sia bassa per punti appartenenti
a gruppi diversi.
E' sempre noto apriori il numero di cluster da cercare
04. Un algoritmo di clustering produce cluster di alta qualità se assicura:
Alta similarità intra-cluster e alta similaritàinter-cluster
Bassa similarità intra-cluster e bassa similaritàinter-cluster
05. Discutere la principale differenza fra clustering e classificazione.
06. Quali sono i principali requisiti che devono assicurare gli algoritmi di clustering?
07. Definire il concetto di cluster.
08. Discutere la principale differenza fra apprendimento supervisionato e non supervisionato.
01. L'algoritmo di clustering SOM (self organizing map) a quale categoria di algoritmi appartiene?
Gerarchici
Density-based
Partizionali
02. Quale tipologia di algoritmi di clustering è più efficiente per l'identificazione di outlier?
Partizionali
Nessuna delle altre alternative
Gerarchici
03. L'algoritmo di clustering AGNES a quale categoria di algoritmi appartiene?
Partizionali
Nessuna delle altre
alternative Density-based
04. L'algoritmo di clustering k-means a quale categoria di algoritmi appartiene?
Nessuna delle altre
alternative Density-based
05. Discutere le principali caratteristiche degli algoritmi di clustering density-based.
06. Come funzionano gli algoritmi di clustering gerarchici?
07. Discutere la tassonomia degli algoritmi di clustering: come si raggruppare tali algoritmi?
08. Quale è la principale differenza fra algoritmi di clustering partizionali e density-based?
01. Quale fra i seguenti criteri non rappresenta un criterio di convergenza dell'algoritmo di clustering k-means?
Riduzione eccessiva delle partizioni iniziali
Differenza non significativa fra i valori assuntidella funzione obiettivo in due iterazioni successive
Nessun cambiamento della matrice binaria U
02. Quali sono i punti di forza dell'algoritmo di clustering K-means?
1) Efficienza, in quanto identifica automaticamente il numero di cluster, 2) Termina in un ottimo locale
1) Efficienza, in quanto identifica automaticamente il numero di cluster, 2) Termina in un ottimo globale
1) Efficienza, in quanto è lineare rispetto al numero di oggetti, 2) Termina in un ottimo globale
03. Quali sono i principali parametri che occorre fissare per effettuare il clustering tramite l'algoritmo K-means?
Il numero K di punti del dataset da scartare edil criterio di stop
Il numero K di iterazioni ed il criterio di stop
Il numero K di punti del dataset da utilizzare edil criterio di stop
04. Quale è la differenza fra cluster e centroide nell'algoritmo di clustering K-means?
05. Discutere l'idea di base nell'algoritmo di clustering K-means?
06. Scrivere in pseudo codice o in un linguaggio di programmazione conosciuto l'algoritmo di clustering K-means?
07. Quale è la misura che si ottimizza nell'algoritmo di clustering K-means?
01. L'algoritmo gerarchico di clustering DIANA quale approccio segue?
Nessuna delle altre alternative
E' un diagramma ad albero che mostra le sequenzadi fusioni fra cluster generati man mano da un algoritmo di clustering density-based
E' un diagramma ad albero che mostra le sequenzadi fusioni fra cluster generati man mano da un algoritmo di clustering partizionale
04. Negli algoritmi di clustering gerarchici con approccio agglomerativo come avviene l'inizializzazione?
Si parte con un numero di cluster assegnato a priori
Si parte con un unico cluster contenente tutti gli oggetti
Si parte con un numero di cluster che dipende daun raggio e da un numero minimo di punti
05. Discutere i passi principali dell'algoritmo DIANA.
06. Discutere lo schema base di un un algoritmo di clustering gerarchico agglomerativo.
07. Come si calcola la distanza fra due cluster na