Anteprima
Vedrai una selezione di 9 pagine su 39
Paniere svolto Data mining - solo risposte multiple Pag. 1 Paniere svolto Data mining - solo risposte multiple Pag. 2
Anteprima di 9 pagg. su 39.
Scarica il documento per vederlo tutto.
Paniere svolto Data mining - solo risposte multiple Pag. 6
Anteprima di 9 pagg. su 39.
Scarica il documento per vederlo tutto.
Paniere svolto Data mining - solo risposte multiple Pag. 11
Anteprima di 9 pagg. su 39.
Scarica il documento per vederlo tutto.
Paniere svolto Data mining - solo risposte multiple Pag. 16
Anteprima di 9 pagg. su 39.
Scarica il documento per vederlo tutto.
Paniere svolto Data mining - solo risposte multiple Pag. 21
Anteprima di 9 pagg. su 39.
Scarica il documento per vederlo tutto.
Paniere svolto Data mining - solo risposte multiple Pag. 26
Anteprima di 9 pagg. su 39.
Scarica il documento per vederlo tutto.
Paniere svolto Data mining - solo risposte multiple Pag. 31
Anteprima di 9 pagg. su 39.
Scarica il documento per vederlo tutto.
Paniere svolto Data mining - solo risposte multiple Pag. 36
1 su 39
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Lezione 002

  1. Che cosa è il Data Mining?

    • Il processo che estrae nuova conoscenza o identifica pattern/modelli nei dati mediante l'applicazione di diversi algoritmi.
    • Il processo che estrae dati dai fenomeni mediante l'applicazione di diversi algoritmi.
    • Il processo che estrae fenomeni dai dati mediante l'applicazione di diversi algoritmi.
    • Nessuna delle altre alternative
  2. Che cosa è un pattern?

    • Una espressione in un determinato linguaggio che descrive modelli descrittivi estratti da un sottoinsieme di registrazioni presenti in un data base
    • Una espressione in un determinato linguaggio che descrive i fatti di un sottoinsieme di registrazioni presenti in un data base
    • Una espressione in un determinato linguaggio che descrive modelli predittivi estratti da un sottoinsieme di registrazioni presenti in un data base
    • Nessuna delle altre alternative
  3. Quale fra le seguenti attività non fa parte del processo di KDD?

    • Interpretazione
    • Nessuna delle altre alternative
    • Data Mining
    • Selezione
  4. Quale fra le seguenti attività non fa parte del processo di KDD?

    • Selezione
    • Intervista
    • Nessuna delle altre alternative
    • Data Mining
  5. Quali sono le fasi caratteristiche del data mining?

  6. Cosa è una transazione?

  7. Quali sono le fasi del KDD?

Lezione 003

01. Cosa si intende per knowledge elicitation?

  • Il confronto fra gli esperti di uno specifico dominio e l'ingegnere della conoscenza al fine di aggiungere in fase di modellazione elementi che potrebbero non essere estraibili dai dati.
  • Il confronto fra gli esperti informatici e l'ingegnere della conoscenza al fine di aggiungere in fase di modellazione elementi che potrebbero non essere estraibili dai dati.
  • Il confronto fra gli esperti informatici e matematici al fine di aggiungere in fase di modellazione elementi che potrebbero non essere estraibili dai dati.

02. A cosa servono i modelli predittivi?

  • Vengono utilizzati per descrivere la struttura organizzativa e la distribuzione dei dati. L'obiettivo di questi modelli è quello di approfondire la conoscenza nascosta dietro ai dati.
  • Utilizzano i loro parametri e meccanismi caratteristici per effettuare delle previsioni future che possono essere utili nei processi decisionali.
  • Il loro obiettivo è quello di descrivere i dati per effettuare delle previsioni future.
  • Nessuna delle altre alternative

03. A cosa servono i modelli descrittivi?

  • Vengono utilizzati per descrivere la struttura organizzativa e la distribuzione dei dati. L'obiettivo di questi modelli è quello di approfondire la conoscenza nascosta dietro ai dati.
  • Vengono utilizzati per descrivere i dati per effettuare delle previsioni future.
  • Utilizzano i loro parametri e meccanismi caratteristici per effettuare delle previsioni future che possono essere utili nei processi decisionali.
  • Nessuna delle altre alternative

04. Quali sono i pilastri operativi su cui si basa ogni algoritmo di data mining?

  • Nessuna delle altre alternative
  • Esplorazione, Valutazione, Visualizzazione
  • Esplorazione, Modellazione, Valutazione
  • Selezione, Modellazione, Valutazione

05. Discutere la differenza fra modelli predittivi e descrittivi.

06. Perché il processo di data mining è da considerarsi interattivo?

07. Quali sono i pilastri operativi su cui poggia il data mining?

Lezione 007

01. Quali fra le seguenti tecniche non si usano in fase di gestione dei missing value?

  • Sostituzione dei valori mancanti con il valore più probabile
  • Ignorare la tupla contenente valori mancanti
  • Nessuna delle altre alternative
  • Riempimento a mano dei valori mancanti

02. L’analisi degli outlier può essere usata per:

  • Identificare e gestire i missing value
  • Ridurre la dimensionalità
  • Identificare e gestire i dati rumorosi
  • Nessuna delle altre alternative

03. L’analisi in regressione può essere usata per:

  • Identificare e gestire i dati rumorosi
  • Fare selezione di attributi
  • Gestire dati provenienti da sorgenti eterogenee
  • Nessuna delle altre alternative

04. Con quali tecniche si gestiscono i missing value?

  • Nessuna delle altre alternative
  • Data Transformation
  • Data cleaning
  • Data Reduction

05. Le fasi del processo di data cleaning si effettuano solo una volta. Vero o falso? Discutere la scelta effettuata.

06. Cosa si intende per Data Scrubbing e Data Auditing?

07. Descrivere la seconda fase del processo di data cleaning, specificando che tipi di tool commerciali potrebbero essere utilizzati.

08. Quali sono i passaggi per effettuare l'eliminazione delle discrepanze fra i dati?

Lezione 012

  1. Quali sono le condizioni che deve soddisfare una misura di similarità fra due punti?
    • Simmetria; Massimo valore in 1 quando i due punti coincidono
    • Riflessività, non negatività, simmetria
    • Nessuna delle altre alternative
    • Riflessività, derivabilità, simmetria
  2. Quali sono le condizioni che deve soddisfare una misura di distanza fra due punti?
    • Nessuna delle altre alternative
    • Riflessività, non negatività, simmetria
    • Riflessività, omogeneità, simmetria
    • Riflessività, derivabilità, simmetria
  3. Quando una distanza si definisce metrica?
    • Quando rispetta anche la condizione di derivabilità
    • Quando rispetta anche la condizione di disuguaglianza triangolare
    • Quando rispetta anche la condizione di simmetria
    • Nessuna delle altre alternative
  4. Qual è la differenza fra distanza e similarità?
  5. Cosa sono la matrice dei dati e la matrice di dissimilarità?
  6. Cosa è la diseguaglianza triangolare? Fornire un semplice esempio grafico.

Lezione 017

  1. L'algoritmo di clustering SOM (self organizing map) a quale categoria di algoritmi appartiene?
    • Nessuna delle altre alternative
    • Gerarchici
    • Density-based
    • Partizionali
  2. Quale tipologia di algoritmi di clustering è più efficiente per l'identificazione di outlier?
    • Partizionali
    • Nessuna delle altre alternative
    • Density-based
    • Gerarchici
  3. L'algoritmo di clustering AGNES a quale categoria di algoritmi appartiene?
    • Gerarchici
    • Partizionali
    • Nessuna delle altre alternative
    • Density-based
  4. L'algoritmo di clustering k-means a quale categoria di algoritmi appartiene?
    • Gerarchici
    • Partizionali
    • Nessuna delle altre alternative
    • Density-based
  5. Discutere le principali caratteristiche degli algoritmi di clustering density-based.
  6. Come funzionano gli algoritmi di clustering gerarchici?
  7. Discutere la tassonomia degli algoritmi di clustering: come si raggruppare tali algoritmi?
  8. Quale è la principale differenza fra algoritmi di clustering partizionali e density-based?
Dettagli
Publisher
A.A. 2020-2021
39 pagine
6 download
SSD Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher gdlsumsn di informazioni apprese con la frequenza delle lezioni di Data mining e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università telematica "e-Campus" di Novedrate (CO) o del prof Ducange Pietro.