APPRENDIMENTO PER ESPERIENZA DIRETTA:
Processo grazie al quale acquisiamo conoscenze sul mondo, le codifichiamo in MLT, che
contribuiscono a pianificare e guidare il comportamento, sostenere nuovi sforzi di apprendimento e
dete i a e l’esito.
Approccio Algoritmico.
Come apprendiamo le informazioni su base statistica.
o Si impone di individuare quali processi di elaborazione sono effettivamente utilizzati dagli
o organismi per computare le funzioni.
Approccio Computazionale.
Cosa apprendiamo dalle informazioni di base statistica.
o Si impone di individuare quali funzioni un processo cognitivo approssima/computa a
o prescindere dalle informazioni algoritmiche.
Apprendimento basato su contingenze:
Apprendimento Top-Down.
o Inferenziale.
Regole e Ipotesi.
des itti e “E…ALLORA.
Associazioni
Fo za di u ’asso iazio e.
Apprendimento Bottom-Up.
o Contingenze AB.
Non è necessaria la ripetizione.
Difficile estinzione.
Utili per:
Previsione catena ambientale-mentale-comportamentale.
Intervento comportamento attivo che agisce sul segnale.
Due aspetti di un unico fenomeno.
o Tutti i tipi di covariazione consentono ti creare aspettative (previsione
o o a iazio e se pli e …
-
… a solo uelli he so o il p odotto di u esso ausale o se to o
o –
di progettare azioni finalizzate a un obiettivo (intervento
covariazione basata su un soggiacente nesso causale).
TAVOLE DI CONTINGENZA:
= frequenza dei casi in cui
Celle A, B
o CONSEGUENZA (C)
si è presentata o non presentata la Presente (+) Assente (-)
conseguenza in presenza del Presente (+) A B
SEGNALE (S)
segnale. Assente (-) C D
SEGNALE (S)
= frequenza, nella stessa
Celle C, D
o unità di tempo, della conseguenza in assenza del segnale.
Le osservazioni in una tabella di contingenza possono essere sintetizzate in due valori con
o
proprietà condizionale probabilità di un evento a condizione che se ne verifichi un altro.
1. Probabilità della Conseguenza dato il Segnale:
P(C|S) = a/(a+b)
della Co segue za o osta te l’asse za del “eg ale:
2. Probabilità
P(C|-S) = c/(c+d)
DELTA P: �|�
∆� = � − � �| − �
Differenza tra due probabilità condizionali
o
Misura di covariazione capacità di un segnale di prevedere una conseguenza oltre quanto
o questa fosse già prevedibile in quel contesto in assenza del segnale.
I di a l’esiste za di u a o elazio e:
o P ese za di “ p odu e u i e e to dell’aspettati a he
VALORE POSITIVO:
produce C (S potrebbe causare C).
P ese za di “ p odu e u de e e to dell’aspettati a di C “
VALORE NEGATIVO:
potrebbe impedire/inibire la presenza di C).
S e C non hanno alcuna covariazione specifica.
VALORE NULLO:
Stimare il grado di causalità di un evento S verso un evento C è importante per:
1. Stabilire se un organismo di prepara a reagire a una conseguenza dato un segnale.
2. Se si comporterà in modo attivo per evitare/ottenere la conseguenza dato il segnale.
La stima dipende da:
Dati di covariazione disponibili DeltaP.
o
Altre conoscenze assunti relativi alle strutture causali del contesto.
o
POWER PC:
Indica la forza di correlazione del Delta P.
o
Si basa sulle Teorie di Weber e Fechner sulla percezione aumenti di intensità a uno
o stimolo già forte non verranno percepiti, contrariamente aumenti di intensità di uno stimolo
debole sono percepiti in modo maggiore.
a iazio e di pe ezio e, o e l’i e e to/de e e to ella p o a ilità
DeltaP
condizionale di un evento.
La corretta stima di effetti causali di S deve riferirsi a quanto S rende probabile C, non in
o qualche contesto specifico dove possono agire altri fattori causali, ma in una situazione
ideale dove sia solo S il fattore causale presente.
Funzione di potenza del Delta P:
o �|−�
� = ∆�/[� − � ]
tale formula vale per il applicabile a
POW cause
cause dove aumenta la probabilità della conseguenza (∆� > 0).
generative,
La formula che vale per applicabile a ovvero dove la
POW cause preventive,
presenza si S riduce la probabilità di C (∆� < 0) la formula per la stima della potenza
�|−�
� = ∆�/�
causale è .
∆�
La funzione di potenza del è corretta e sensata se, e solo se, la potenziale causa S
i dipe de te dall’i sie e di tutte le o ause he posso o p o o a e il edesi o
effetto C.
La funzione di potenza del DeltaP è corretta e sensata se e solo se la potenziale causa S è
i dipe de te dall’i sie e di tutte le o ause he posso o p o o a e il edesi o effetto C.
Le diverse concause di uno stesso effetto possono combinarsi in una quantità di modi infinita
ogni possibile struttura è un MODELLO CAUSALE.
Caso standard delle cause indipendenti NOISY OR.
o Disgiunzione probabilistica.
A v B è falsa se, e solo se, sono entrambe false.
A v B in tutti gli altri casi è vera.
–
P(C) = P(C|S1) + P(C|S2) [P(C|S1) * P(C|S2)].
Descrizione matematica del caso in cui due concause siano indipendenti.
GRAFO BAYESIANO:
NODI (S) cause, non connessi tra loro. S1 S2
ARCHI associazione della probabilità
condizionale che quella causa, in assenza C
dell’alt a, possa p o o a e l’effetto C.
EFFETTO (C) Conseguenza.
La p o a ilità o plessi a dell’effetto otte uta o i a do le due
probabilità con la funzione noisy or.
Due cause NON SONO INDIPENDENTI, interagiscono, quando la loro combinazione non
o segue una qualsiasi funzione di combinazione della probabilità che NON SEGUA LA NOISY
OR.
Caso Speciale SOMMAZIONE LINEARE:
o Sommazione lineare delle probabilità associate alle due cause:
P(C) = P(C|S1) + P(C|S2)
Le probabilità si sommano linearmente se, e solo se, gli eventi considerati sono
mutuamente disgiunti e non indipendenti.
Può indurre a errori psicologicamente rilevanti.
Se non si conoscono assunti (noti o ipotizzati) sulla struttura causale, è impossibile passare da
giudizi di semplice covariazione a fondati giudizi di causalità.
È necessario conoscere la struttura causale (forma delle possibili interazioni tra cause e la loro
assenza) per stimare il potere causale di un S su uno specifico C.
EFFETTO “ULLA “TIMA DELLA CAU“ALITA’:
dell’assu to di
In quali circostanze possiamo essere maggiormente fiduciosi della fondatezza
o i dipe de za? Qua do sia o oi stessi, att a e so u ’azio e olo ta ia, a p o o a e il
manifestarsi o meno di S a parità di contesto interruttore della luce.
TEORIA DEL SUPPORTO CAUSALE:
Approccio bayesiano e Power Pc.
o Lo sviluppo di tale teoria adotta la funzione di potenza del DeltaP per stimare delle diverse
o st uttu e ausali alte ati e o pati ili o il patte di dati statisti i su ui o o e
esprimere un giudizio causale.
METODI DI STUDIO:
QUATTRO DIMENSIONI METODOLOGICHE:
1. Umani o Animali.
Tipo di Partecipanti
2. Presentazione Simultanea o Seriale degli Stimoli:
PRESENTAZIONE SERIALE:
o Te po dell’espe i e to o ga izzato i pe iodo.
In ogni periodo si presentano alcuni, o uno,
stimoli eventi.
Lo sperimentatore controlla le variabili
indipendenti che lo interessano nella serie.
Sia partecipanti umani sia partecipanti animali.
PRESENTAZIONE SIMULTANEA:
o Tutti gli stimoli vengono forniti
contemporaneamente e in forma sintetica.
Solo partecipanti umani.
CODICE CONVENZIONALE:
o Condizione Sperimentale:
Fase di Training, Addestramento: Due eventi cue (A e B) sono compresenti ed
asso iati alla o pa sa dell’out o e +
comparsa, - non comparsa). In
BLOCCO
ALL’INDIETRO: una seconda fase A non è più presente mentre B continua ad essere associato
Fase 1: AB+. alla conseguenza (indicato con B+).
Fase 2: B+. “i isu a o le isposte del pa te ipa te all’e e to A t o a dole
Fase di Test:
Test: A r o 0.
nulle/assenti (0) o lievi (r); si indica con A r o 0.
Controllo: AB+. Condizione di Controllo:
Test: A R È costituita da una sola fase analoga alla fase di training della fase
sperimentale (AB+).
Nella seconda fase si analizza la risposta dei partecipanti ad A.
Nella fase di test si realizza una condizione di A R, indice che i partecipanti
ha o a uisito A o e p editto e dell’Out o e.
3. Tipo di Misura di Apprendimento:
IMPLICITA:
o
Sia animali sia altre specie. Risposta Comportamentale.
Variabile Dipendente reazione comportamentale o fisiologica attivare una
all’out o e.
funzione riflessa
Esempio: premere una leva.
ESPLICITA:
o
Solo esseri umani risposta verbale.
“ti a dell’asso iazio e/fo za ausale t a ue e out o e.
Valo e I e tivo dell’Out o e:
4. Particolarmente importante per la presentazione seriale e le misurazioni implicite.
o È la ale za edo i a positi a o egati a dell’out o e.
o L’U“ u i e ti o se i t i se a e te dotato di u ual he tipo di alo e edo i o.
o Il alo e i e ti o o dipe de dal fatto he l’U“ sia il isultato delle isposte dell’o ga is o,
o o sia indipendente da esse.
Storicamente gli incentivi si dividono in Appetitivo, di rinforzo, e Avversivo, che indebolisce
o l’asso iazio e.
IVAN PAVLOV:
Ivan Sechenov, Riflessi del Cervello eventi mentali sono il risultato di circuiti associativi riflessi
fisiologicamente stabiliti dal cervello.
Studi sulla digestione dei cani.
MODELLO DEGLI ESPERIMENTI:
Partecipanti animali: Cani.
o Presentazione Seriale.
o Misure implicite.
o Quasi tutti con US incentivanti.
o
Pavlov osserva diversi fenomeni:
FENOMENO SPIEGAZIONE
Dato Us R stimolo incondizionato che suscita R.
CONDIZIONAMENTO
Date ripetute associazioni CS US in contiguità temporale.
OPERANTE
A+ P(R|cs ^ -us) tende verso 1 = CS R
TEST: A R
Data CS R.
ESTINZIONE
A- Date ripetute presentazioni di CS -US.
TEST: A r o 0. P(R|cs ^ -us) tende verso 0 = CS R tende e scomparire
INTEN“ITA’
CS R
All’au e ta e di C“ au e ta a he R.
Dato CS1 R.
GENERALIZZAZIONE Un CS2 produce R con probabilità proporzionale alla sua
somiglianza con CS1.
Ripetute associazioni CS2 -US e CS1 US.
DISCRIMINAZIONE APPRESA Esti zio e dell’asso iazio e C“ US.
Se CS R è stato appreso in un determinato contesto,
INIBIZIONE ESTERNA 1. tenderà a verificarsi in modo più lieve/o essere assente in un
IE1 contesto diverso
La presentazione contemporanea/poco precedente a CS1 di un
IE2, OVERSHADOWING. CS2 molto saliente, riduce la forza associativa CS1R
Ax +, Test: x r o 0. R precedentemente appresa.
Controllo: X+, Test: X Se si presentano, in modo casuale, molte prove:
IE3, INIBIZIONE CONDIZIONALE:
Fase 1: A+/AB- (CS1^CS2) -US e (CS1^-CS2) US.
0,
Test F1: AR, AB B0. Il soggetto risponderà a CS1 presentato singolarmente ma non
a CS1 ^ CS2 CS2 inibisce la risposta di CS1.
Fase 2: B+.
Test F2: B r o 0. Dato CS1R.
CONDIZIONAMENTO DI l’asso iazio e
Presentazioni CS2 CS1 tenderanno a stabilire
SECONDO ORDINE, SOC:
Fase 1: A+. CS2 R.
Fase 2: Non è in contraddizione con la IE3, perché si presenta solo se
si fanno poche presentazioni AB-
Al crescere delle presentazioni AB-, B perde la sua forza
associativa e diventa inibitore.
EDWARD THORNDIKE:
Comportamenti complessi.
Puzzle Box e Gatti.
Apprendimento Per Prove ed Errori, Condizionamento Strumentale.
Curva di Apprendimento curva che genera dalla misura degli RT in base al numero di prove
effettuate, all’au e ta e del u e o di olte i ui il gatto e a i t odotto ella puzzle ox,
diminuivano gli RT per la risposta.
LEGGE DELL’EFFETTO:
in un determinato contesto S, è prodotta una risposta R con esito positivo, allora la
o
connessione tra Contesto-Risposta cresce aumenta la probabilità di riprodurre lo stesso
comportamento nel contesto.
Contrariamente, se il comportamento ha avuto esito negativo, il comportamento non sarà
o riprodotto nel contesto.
BURRHUS SKINNER:
App ofo dis e gli “tudi sulla legge dell’Effetto
il condizionamento strumentale non riesce a
spiegare tutti i tipi di apprendimento Contesto-Risposta.
Gli organismi agiscono per ottenere conseguenze.
o defi is e se l’asso iazio e Co testo-Risposta-Conseguenza
Incentivo sarà ripresa o abbondata.
MODELLO DEGLI ESPERIMENTI:
Partecipanti Animali.
o Presentazione Seriale.
o Misura Implicita.
o Outcome incentivanti.
o
Classificazione Degli Outcome:
PO“ITIVITA’ NEGATIVITA’
(Presenza Conseguenza) (Assenza Conseguenza)
forza la Rinforzo Positivo, Rinforzo Negativo.
APPETITIVO
dopo
di piacevole Cresce la Probabilità di R Cresce la Probabilità di R.
Incremento/riduzione S-R R dell’a i ale ha
Animale affamato riceve cibo (C) permesso di evitare
connessione in base alla sua Risposta (R). una scossa elettrica, C.
Punizione Positiva, Punizione Negativa,
conseguenza AVERSIVO
spiacevole Diminuisce la Probabilità di R. Diminuisce la probabilità di R.
Animale riceve una scossa in Animale affamato non riceve cibo in
della Conseguenza della risposta. seguito alla sua risposta.
Rinforzi sono più efficaci delle punizioni.
Definizione Operativa di Rinforzo se una conseguenza era un rinforzo/punizione era stabilito dal
es e e/ idu e della p o a ilità della isposta he l’a e a p e eduto.
Rinforzi Primari valore incentivante intrinseco.
Rinforzi Secondari privi di valore incentivante intrinseco, valore appetitivo/avversivo basato su
condizionamento di secondo ordine.
Modellamento, SHAPING:
o Addestramento a comportamenti molto complessi.
L’a i ale ost uis e u a ate a o plessa di o po ta e ti/asso iazio i e
otte e e l’i e ti o.
l’app e di e to della p i a o po e te, ua do app esa, si i fo za
Si rinforza
l’app e di e to della se o da.
Programmi di Rinforzo: SCHEMA FISSO SCHEMA VARIABILE
Dopo ogni rinforzo, per un Dopo ogni rinforzo per un tempo T non
INTERVALLO DI tempo fisso T non si fornisce alcun si fornisce alcun altro rinforzo, ma T
TEMPO rinforzo. Si fornisce un rinforzo varia casualmente intorno a un valore
dopo la prima risposta emessa allo medio. Si fornisce un rinforzo
scadere di T. dopo la prima risposta emessa allo
scadere di T.
RISPOSTE: RISPOSTE:
- poche o assenti dopo ogni rinforzo. - scarse ma ben distribuite nel tempo.
f e ue ti all’a i i a si dello
-
scadere di T
ESTINZIONE: ESTINZIONE:
- più rapida in assoluto. - più lenta che a intervallo fisso.
Il rinforzo è fornito solo ogni risposte N. Il rinforzo è fornito solo ogni risposte
RAPPORTO TRA N, ma il numero N varia casualmente
NUMERO DI intorno a un valore medio.
RISPOSTE E Lo sperimentatore stima una
INCENTIVI. P(Rinforzo|Rispota)
RISPOSTE: RISPOSTE:
- Rapide, a pacchetti di numerosità N - Frequenti, distribuite
seguiti da brevi pause uniformemente nel tempo
ESTINZIONE: ESTINZIONE:
- Relativamente rapida. - più lenta in assoluto.
sono pattern con cui sono presentati gli outcome dopo il comportamento che si cerca di
o condizionare.
partecipanti imparano il pattern di rinforzo e vi si adattano imparano quali
o comportamenti sono più adatti al fine di ottenere un rinforzo.
Qua do u a o segue za ha aggio a ia ilità, l’esti zio e della risposta che la provoca è
o
più lenta il partecipante generalizza più lentamente il fatto che C non sia presentata in
una prova al fatto che non verrà più presentata EFFETTI DI VARIABILITA'
CARATTERISTICHE DEGLI STUDI CLASSICI:
dell’app e di e to delle o ti ge ze di tipo A e B
Studiati gli effetti (CS ^ US) e (CS ^ -
o
US) e non gli effetti di contingenze di tipo C e D (-CS ^ US) e (-CS ^ -US).
Conclusioni Classiche:
o Ripetizione di Contingenze di Tipo A.
Contiguità temporale tra CS e US in quelle contingenze.
Valore incentivante di US in forma primaria/secondaria.
RIPETIZIONE, CONTIGUITA’
Negli anni a seguire si è riusciti a stabilire che, nonostante e
o sia o fatto i i po ta ti pe l’app e di e to guidato dall’espe ie za,
VALORE INCENTIVO,
non sono né necessari né sufficienti.
SINTESI DELLE PROSPETTIVE RISPONDENTE E OPERANTE:
Negli a i ’6 le due p ospetti e ispo de te ed ope a te o fluis o o i u a sola
o prospettiva unitaria.
Ciò he suppo ta/i de olis e l’app e di e to saper fare, o non saper fare, previsioni
o l’app e di e to i fo za sé stesso g azie a u a o ti ua o pa azio e t a iò
accurate
he a ia o app eso e, ua to e e o ale tali app e di e ti o se to o di
capire/prevedere e controllare il nostro ambiente.
Tutti i principali modelli algoritmici attuali che cercano di catturare i fenomeni noti
o algo it i di iduzio e dell’e o e
dell’app e di e to asso iati o BOTTOM-UP
sono
i
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.