Anteprima
Vedrai una selezione di 3 pagine su 6
Domande Data Analisys Pag. 1 Domande Data Analisys Pag. 2
Anteprima di 3 pagg. su 6.
Scarica il documento per vederlo tutto.
Domande Data Analisys Pag. 6
1 su 6
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

DOMANDE DATA:

1. Analisi fattoriale, coefficiente di correlazione: un coefficiente

sicuramente errato: 1,197

2. Scatterplot: concordanza

3. Cluster analysis dendrogramma; gerarchici

4. Stima del parametro di una popolazione condizione necessaria per

intervallo di confidenza: conoscere la distribuzione di probabilità

5. Ipotesi dell’indipendenza tra A e B non chi quadrato: l’ipotesi di

indipendenza è respinta (95%)significativa

6. Valore di correlazione -0,45: discordanza

7. Il coefficiente di regressione è ottenuto: svolgendo l’equazione di una

retta passante per due punti.

8. Il ranking internazionale delle università di management è su scala:

ordinale

9. Coefficienti di matrice di struttura: coefficiente di correlazione tra

variabile e fattore.

10. Il livello delle vendite creme antiage: 8

11. Cluster analysis quando è preferibile approccio non gerarchico:

quando ci sono tante unità.

12. Analisi della varianza anova: test NON significativo al 95% medie non

sono significativamente diverse

Se p=0,08 molto significativo

Se p=0,23 non è significativo

Se p=0,023significativo al 95% e non al 99%

13. Coefficiente di asimmetria -0,5-0,5: relativamente simmetrica (pe il

libro è moderatamente simettrica e relativamente asimmetrica)

14. Chi quadrato = 0: perfetta indipendenza

15. Cluster anlysis distanza tra unità: tutti si basano sulle distanze tra le

unità

16. Indice di GMAT (Graduate Management Admissione Test): scala a

intervalli

17. Analisi delle componenti principali si può estrarre una

componente principale? si

18. Obiettivo della cluster analysis: nessuna delle precedenti (fattoriale

genere gruppi di variabili)

19. L’analisi della varianza rispetto ai gruppi A e B ha dato i seguenti

risultati (tabella) che conclusioni? Per Zavarrone Nel caso non è

consigliabile usare test t, ma in realtà le medie sono uguali nei gruppi deve

essere respinta

20. Tabelle pivot: costruire le distribuzioni di frequenza e grafici associati

21. Medie mobili con k=3: media degli ultimi 3

22. ANOVA serve: testare ipotesi che le medie in più gruppi siano diverse

23. Indice per misurare la relazione tra due variabili numeriche:

Pearson

24. La nube dei valori che si posizionano attorno all’origine e lungo

l’asse delle ascisse indicano: linearità

25. Caratteristiche delle componenti principali: nessuna delle

precedenti (sono ortogonali tra loro, sono non correlate)

26. Come si misura la variabilità relativa: coefficiente di variazione

27. I valori teorici o previsti corrispondo: al calcolo dell’equazione della

retta dei minimi quadrati calcolata per ogni valore della variabile x / valore

della retta per ogni punto (?)

28. Cluster: cosa rappresentano i valori dei centri dei cluster: medie delle

variabili all’interno dei cluster

29. 4 tipi di dendrogramma: - con linea blu- 3; -un altro da 3; - 2 o 5;

nessuno

30. Funzione KURT excel: curtosi

31. Numero componenti da estrarre: tutte le risposte precedenti

32. Questa proprietà consente di misurare ciò che si è proposti di

misurare. Indicare quale è la proprietà: validità

33. Numero con cluster massimi estraibili con N: n

34. Statistica test anova uguaglianza: F

35. Misure della bontà di previsione influenzata dai valori anomali:

MAD

36. Valori estremi CV: 0 1

37. K-means come si può influenzare il risultato dell’analisi:

cambiando i centri iniziali

38. Spoglio: serve per la creazione di distribuzione di frequenza

39. Covarianza -1: discordanza

40. Quali sono gli autovalori con una varianza maggiore di 1: 56,628

41. Che valori possono assumere i coefficienti della matrice di

struttura per l’estrazione di fattori: -1+1

42. Analisi delle componenti principali, quali caratteristiche hanno le

componenti: nessuna delle precedenti

43. Obiettivi analisi delle componenti principali: tutte le precedenti

44. Da che matrice si parte per misurare le componenti principali:

covarianza e correlazione

45. Valori della covarianza: meno infinito e più infinito

46. Cosa è un dataset: un insieme riferito a poche variabili

47. Verifica delle ipotesi, cosa è tecnicamente il p-value: una

probabilità

48. Cluster analysis quante funzioni fornisce l’analisi gerarchica: tutte

le soluzioni con 1,2 fino a n cluster (n numero tot dei casi)

49. L’analisi della varianza: 99% o 95%

50. Un campione può essere numeroso ma non rappresentativo

51. Analisi delle componenti principali; scopo della rotazione: nessuna

delle precedenti (la rotazione serve per facilitare l’interpretazione)

52. Affermazione vera date le tre distribuzioni normali: l’area totale

sottostante è 1

53. Obiettivi della cluster nalysis: nessuna delle precedenti

54. Condizioni per anova: distribuzione normale e le varianze devono

essere uguali (omoschedasticità)

55. Scatterplot: concordanza

56. Misura della bontà di adattamento: scomposizione della varianza

totale, r2

57. Scopo rotazione dei fattori: nessuna delle precedenti

58. Come si misura la variabilità relativa: coefficienti di variazione

59. Analisi fattoriale sui dati binari: non si può fare

60. Se il coefficiente di correlazione è 1 dove si trovano nello

scatterplot: primo e terzo quadrante

61. Formattazione condizionale excel: consente di individuare quali sono

le modalità diverse rispetto alle altre

62. Analisi fattoriale: qual è il numero minimo di componenti

principali/fattori da estrarre?: Non c’è una regola generale

63. Caratteristiche della distribuzione campionaria: ha la stessa media

della popolazione

64. Qual è la condizione perché due variabili categoriche siano

indipendenti: le condizioni precedenti sono tutte equivalenti

65. Diagramma a barre: dati ordinali o nominali

66. Valori teorici o previsti: calcolo dell’equazione della retta dei minimi

quadrati calcolata per ogni valore della variabile x

67. Sparkline: grafici che sintetizzano l’andamento di una serie in una sola

cella

68. Multicollinearità: correlazione predittori

69. Variabilità relativa: coefficiente di variabilità

70. Nel caso di due soli gruppi: non è consigliabile fare il test

71. Fattoriale su binari: no solo numerici

72. Cosa fare per minimizzare gli errori nella cluster anlysis: tutte le

precedenti

73. Numero di componenti da estrarre: tutte le precedenti

74. A e B: due soli gruppi no test-t

75. Che valori descrivono i centri dei cluster: no due delle variabili...

all’interno dei cluster

76. Distribuzione campionaria di una popolazione: ha la stessa media

della popolazione

77. Istogramma: per variabili numeriche

78. Analisi componenti principali è possibile estrarre 1 componente:

si

79. Quando è necessario confrontare più dataset in termini di

variabilità, quale metrica si usa? Coefficiente di variazione

80. I coefficienti di regressione standardizzati servono a? indicare in

media la correlazione della variabile indipendente sulla variabile dipendente

fermo restando le altre variabili

81. Il tasso di variazione medio serve a? rilevare la variazione con

riferimento ad ogni singolo periodo

82. La somma degli scarti della media in valore assoluto diviso n è

pari a? un qualsiasi valore positivo

83. Un coefficiente di asimmetria pari a 0,4 e un coefficiente di

curtosi pari a -1,20, la distribuzione si ritiene? Riconducibile ad una

normale

84. Indicare quale tra le seguenti variabili è misurata in scala

nominale: variabile dummy

85. Identificare la triade di discipline da cui si sviluppa la business

analytics: statistics, business intelligence, modeling and optimization

86. Un valore anomalo si definisce quando: se gli z scores sono esterni

all’intervallo -3, 3

87. La covarianza è una tecnica utilizzata per calcolare: il coefficiente

di regressione

88. Per determinare il miglior orezzo di vendita o per affrontare

decisioni i cui effetti saranno di tipo normativo quale approccio

analitico devo privilegiare? Prescrittivo

89. L’ispezione grafica dei residui serve per verificare:

omoschedasticità

90. La seguente affermazione “il modello spiega circa il 70% della

variabilità” è il commento della misura: indice di determinazione

91. Indicare quale tra le seguenti variabili è misurata su scala

ordinale: livelli di carriera

92. I residui coincidono con: diversità/differenza tra valori osservati e

valori teorici

93. Analisi fattoriale: che valori possono assumere i coefficienti nella

matrice di struttura che serve per interpretare i fattori? Tra -1 e 1

94. Il corpus delle seguenti analisi: descrittiva, previsiva e normativa

quale disciplina compone? Business analytics

95. Residui standard: rapporto tra residui e deviazione standard

96. Cosa sono tecnicamente i coefficienti di struttura che serve per

interpretare i fattori…? I … di correlazione

97. Dati nuemrici si può fare: fattoriale, regressione e cluster

98. Dati binari si può fare: regressione e cluster

99. La cluster analysis può essere svolta su dati categorici? Si se li

faccio divenatre binari

100. Numero minimo di casi per una fattoriale: dipende dal numero di

variabili

101. Numero minimo di casi per una cluster: non ci sono limiti

102. Se a parità delle altre condizioni si aumenta il livello di

confidenza da 95 a 99 cosa succede all’intervallo? Aumenta

103. Se i residui sono tutti vicino all’asse.. ? devono essere tutti messi a

caso intorno alla retta : LINEARE

104. Skewness funzione excel: asimmetria

105. Curtosi: è un indicatore che serve a distinguere: il caso di curve

appiattite o a punta

106. Qual è la condizione per cui due variabili categoriche siano

indipendenti: tutte le precedenti

107. Quali sono i parametri da impostare per eseguire un’analisi k-

means: numero di cluster

108. Analisi delle componenti principali, quali caratteristiche hanno:

sono non correlate tra loro e hanno media 0

109. La misura della bontà di adattamento si può ottenere da:

scomposizione della devianza totale

110. La media campionaria di n variabili indipendenti: il teorema del

limite centrale

111. La codevianza può assumere valori: qualunque valore /meno inifniot

più infinito

112. Che relazione c’è tra numerosità e rappresentatività: non c’è

relazione

113. Proprietà fondamentali come volume, velocità, veracità, v : big

data

114. Qual è il minimo di fattori da estrarre: bisogna fare un’analisi quinid

n

Dettagli
A.A. 2018-2019
6 pagine
SSD Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher riccardo.tirabasso di informazioni apprese con la frequenza delle lezioni di Data analysis e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Libera Università di Lingue e Comunicazione (IULM) o del prof Zavarrone Emanuela.