vuoi
o PayPal
tutte le volte che vuoi
Domande e risposte sull'apprendimento automatico
Come avviene la generazione dei pesi iniziali nell'algoritmo backpropagation? Con la propagazione all'indietro dell'errore Come si chiama l'algoritmo di apprendimento dei parametri di un percettrone? Deltra rule Come si chiama l'algoritmo di apprendimento delle reti feedforward? Backpropagation Come sono i dataset che in genere si utilizzano nel contesto della classificazione? Non etichettati Con che tipo di attributi lavora il classificatore ID3? Nominali Con quali tecniche si gestiscono i missing value? Data cleaning Con riferimento agli alberi di decisione, che filosofia si utilizza per la generazione della classe stimata? Si segue un approccio top-down: si parte a esplorare l'albero dalla radice verso le foglie Con riferimento agli algoritmi di clustering, quali delle seguenti affermazione è falsa? E' sempre noto a priori il numero di cluster da cercare Con riferimento ai classificatori basati su regole, cosa è l'accuratezza di una regola?Frazione delle istanze nel database che soddisfano antecedente e conseguente rispetto alla copertura
Con riferimento ai classificatori basati su regole, cosa è la copertura di una regola? Frazione delle istanze nel database che soddisfano l'antecedente
Con riferimento ai classificatori basati su regole, cosa sono le regole esaustive? Un insieme di regole R ha una copertura esaustiva se esiste una regola per ogni combinazione di valori degli attributi
Con riferimento ai classificatori basati su regole, cosa sono le regole mutuamente esclusive? Un insieme di regole R è detto mutuamente esclusivo se nessuna coppia di regole può essere attivata dalla stessa istanza
Con riferimento all'algoritmo FP-growth, che filosofia si utilizza per la generazione degli itemset frequenti? Si segue un approccio bottom-up: si parte ad esplorare l'albero dei pattern frequenti a partire dalle foglie verso la radice
Con riferimento all'algoritmo FP-growth, cosa viene fatto durante la...
La seconda scansione nella fase di generazione dell'FP-tree serve per creare effettivamente l'albero.
Nel primo passo della generazione dell'FP-tree, si identificano tutti gli 1-itemset frequenti dal database. Nel secondo passo, si crea una lista L degli 1-itemset frequenti ordinati secondo il loro supporto o frequenza.
Per la generazione dell'FP-tree vengono effettuate due scansioni del database.
Un percettrone deve simulare il funzionamento di un neurone.
Il rote classifier è il più semplice classificatore lazy.
La Market Basket Analysis è un'analisi che ha l'obiettivo di studiare la regolarità, all'interno delle transazioni registrate, nelle vendite dei supermercati.
Il parametro Epsilon dell'algoritmo di clustering DBSCAN rappresenta il massimo raggio del vicinato.
Ogni nodo interno in un albero di decisione rappresenta una condizione di test su un attributo.
Un possibile valore di un attributo è un valore specifico che può essere assegnato a quell'attributo. Cosa rappresenta una foglia in un albero di decisione? Una foglia rappresenta una classe o una decisione finale che viene presa in base alle condizioni degli attributi. Un possibile valore di un attributo è un valore specifico che può essere assegnato a quell'attributo. Cosa si intende per classificazione binaria? Si intende la classificazione di un insieme di dati in due sole classi. Si considerano solo due classi. Cosa si intende per knowledge elicitation? Intervista Cosa si intende per riduzione dei dati lossless? La tecnica utilizzata consente di ricostruire i dati originali da quelli ridotti senza alcuna perdita di informazione. Cosa si intende per riduzione dei dati lossy? La tecnica utilizzata per la riduzione consente di ricostruire i dati originali solo tramite una approssimazione degli stessi. Cosa si intende per riduzione della dimensionalità? Si parla di riduzione dimensionale quando vengono applicate delle tecniche per codificare i dati secondo degli schemi precisi al fine di ottenere una rappresentazione compressa o ridotta dei dati originali (esempio uso di Trasformate o tecniche di selezione di attributi). Cosa si intende per splitting? È la fase di un processo di discretizzazione in cui si divide un attributo continuo in intervalli o categorie.siidentificano ricorisivamente uno o più punti in cui suddividere gli intervalli didefinizione degli attributiCosa significa addestarre un percettrone? Identificare il numero di pesi
Cosa sono gli istogrammi? Nessuna delle altre alternative
Cosa sono gli scatter plot? Sono dei diagrammi che consentono divisualizzare la frequenza con cui si distribuiscono i dati divisi in classi(banalmente in intervalli)
Cosa sono i box plot? Sono dei grafici che consentono di verificarerapidamente se due variabili sono correlate (dipendenti linearmente) fra di loro
Cosa succede durante un addestramento non supervisionato? E' il fenomenoper cui in fase di addestramento un modello si adatta al campione osservato eperde la capacita di generalizzazione
Cosa succede durante un addestramento supervisionato? Esporazione,Modellazione, Valutazione
Cosa utilizza l'algoritmo CART per misurare l'impurità di un database o di ungenerico insieme di transazioni? L'indice di Gini
Cosa viene
riportato sugli assi di una curva ROC? TPR, FPR Di che tipo è l'uscita del percettrone? Binaria Dopo la generazione di un albero con l'algoritmo C45, che ulteriore passo può essere effettuato per ridurre la possibilità di overtraining? Potatura È possibile aumentare l'efficienza dell'algoritmo APRIORI? Si, ma solo riducendo il numero di candidati da considerare, usando tecniche di indirizzamento e partizionamento È possibile calcolare la distanza fra istanze descritte da attributi nominali? Si, utilizzando una distanza basata sul matching Esistono differenze fra problemi di clustering e di classificazione? Si Gli algoritmi di clustering si utilizzano per generare: Modelli descrittivi I modelli bayesiani si usano per risolvere quali tipi di problemi? Classificazione In quale fase dell'algoritmo FP-growth si genera il conditional pattern tree? Nella fase di generazione dell'FP-tree In quali classificatori si può usare il majoring? voting pesato? KNN In quali tipi di classificatori si può utilizzare il FOIL_gain? Classificatori a regole L'algoritmo di clustering AGNES a quale categoria di algoritmi appartiene? Gerarchici L'algoritmo di clustering k-means a quale categoria di algoritmi appartiene? Partizionali L'algoritmo di clustering SOM (self organizing map) a quale categoria di algoritmi appartiene? Nessuna delle altre alternative L'algoritmo FP-growth consente di evitare cosa? La generazione degli itemset frequenti candidati L'algoritmo gerarchico di clustering AGNES quale approccio segue? Agglomerativo L'algoritmo gerarchico di clustering DIANA quale approccio segue? Divisivo L'analisi degli outlier può essere usata per: Identificare e gestire i dati rumorosi L'analisi in regressione può essere usata per: Identificare e gestire i dati rumorosi La distanza Manhattan è un caso particolare di quale distanza? Minkowski La formula della similarità coseno fradue vettori utilizza al suo interno? <strong>Lanorma dei due vettori e il prodotto scalare fra i due vettori</strong> La generazione di regole associative avviene utilizzando che tipologia di apprendimento? <strong>Non supervisionato</strong> La selezione degli attributi è in sostanza in problema di: <strong>Ottimizzazione</strong> Negli algoritmi di clustering gerarchici con approccio agglomerativo come avviene l'inizializzazione? <strong>Si parte con tanti cluster quanti sono gli oggetti</strong> Nella formula della distanza di Mahalanobis che tipo di matrice è presente? <strong>Di covarianze fra i due punti</strong> Nella generazione degli alberi di decisione, l'information gain in genere viene usato come misura di cosa? <strong>Misura di rilevanza</strong> Nella strategia di selezione all'indietro, il processo di selezione di attributi in genere comincia con: <strong>Un insieme iniziale contenente tutti gli attributi</strong> Nella strategia di selezione in avanti, il processo di selezione di attributi in genere comincia con: <strong>Un insieme iniziale di attributi vuoto</strong> Oltre al valoreL'area associata alla curva ROC di un classificatore random è 0.5.Nessuna delle altre alternative Quale è l'assunzione su cui si basano i classificatori Naive Bayes? L'indipendenza fra gli attributi che descrivono un oggetto quando la classe è nota Quale è l'idea di base dell'algoritmo APRIORI? L'algoritmo Apriori affronta la fase di generazione degli itemset frequenti per approssimazioni successive, a partire dagli itemset con un solo elemento Quale è l'obiettivo principale della fase di data integration? Ottenere una memorizzazione coerente per i dati derivanti da sorgenti multiple di memorizzazione Quale è la formula per la Precisione, utilizzata come metrica per valutare la bontà di un classificatore binario? P = TP/(TP+FP) Quale è la formula per la Recall, utilizzata come metrica per valutare la bontà di un classificatore binario? R = TP/(TP+FN) Quale fra i seguenti criteri non rappresenta un criterio di convergenza dell'algoritmo di clustering k-means? RiduzioneEccessiva delle partizioni iniziali
Quale fra le seguenti attività non fa parte del processo di KDD? Una espressione in un determinato linguaggio che descrive i fatti di un sottoinsieme di registrazioni presenti in un database
Quale fra le seguenti attività non fa parte del processo di KDD? Nessuna delle altre alternative
Quale fra le seguenti caratteristiche non è tipica di una rete neurale feedforward? Presenza di feedback
Quale fra le seguenti caratteristiche non è tipica di una rete neurale feedforward? Presenza di stato interno
Quale fra le seguenti condizioni di terminazione della ricorsione dell'algoritmo ID3 non è corretta? Nessuna delle altre alternative
Quale fra le seguenti non è una tecnica non parametrica per la riduzione della numerosità? Regressione lineare