Che materia stai cercando?

Gagliardi - Categorizzazione Appunti scolastici Premium

Questa dispensa si riferisce alle lezioni di Filosofia della scienza, tenute dal Prof. Roberto Cordeschi nell'anno accademico 2011 e tratta i seguenti argomenti:
[list]
Metodo sintetico;
Teorie della categorizzazione;
Fenomeno della tipicità;
Francesco Gagliardi;
Sistemi... Vedi di più

Esame di Filosofia della scienza docente Prof. R. Cordeschi

Anteprima

ESTRATTO DOCUMENTO

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

Il Problema della Categorizzazione (3)

• Superamento della Teoria Classica

Prima teoria: Teoria dei Prototipi

o Evidenze sperimentali sul “gradiente della tipicità”

o

• “Typicality View”

Teoria dei Prototipi e Teoria degli Esemplari sono entrambe

o basate sulla Similarità:

Confronto tra nuove osservazioni e istanze memorizzate

non su condizioni necessarie e sufficienti (Teoria Classica)

Prototipi Vs. Esemplari:“Experimentum Crucis” (Gagliardi 2009)

o Necessità di un approccio unificante (e.g. Murphy, 2002)

o “Phenomenon of Typicality”

• Lo studio della Categorizzazione e della natura dei concetti come

problema di rappresentazione della conoscenza

KR - Knowledge Representation

o

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 6 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

L’Apprendimento Automatico (1)

• L’apprendimento automatico o machine learning (Witten Frank2005)

settore dell’Intelligenza Artificiale (IA) riguardante i programmi

o che apprendono dall’esperienza precedente

applicazioni predittive (generalizzare dai dati)

applicazioni di estrazione della conoscenza

• (data mining, knowledge extraction, business intelligence)

Settore “storico” dell’IA

o Dai primi programmi che giocano a dama Arthur Samuel

(Samuel, 1959).

all’Autonomic Computing

• Sono state proposte varie formalizzazioni dell’apprendimento

automatico e vari tipi di rappresentazione della conoscenza estratta.

Prendiamo in considerazione la classificazione supervisionata

o basata su istanze

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 7 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

L’Apprendimento Automatico (2)

• Tipi di apprendimento:

Supervised Learning. Nell’apprendimento supervisionato un

o esperto umano, l’insegnante, fornisce una etichetta (detta category

label) o un valore numerico per ogni istanza dei dati osservati. Il

sistema utilizza tali dati per predire il valore corretto su nuove

istanze.

Questo è il settore del machine learning, con forse, il maggiore

numero di applicazioni.

Unsupervised Learning

o Reinforcement Learning

o Semi-supervised learning

o Data stream learning, online learning.

o

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 8 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

L’Apprendimento Automatico (3)

• Tipi di rappresentazione delle classi:

La rappresentazione basata su istanze (IB - Instance-based). La

o conoscenza estratta dal dataset consiste nella memorizzazione di

istanze, direttamente osservate (esemplari) o appartenenti

comunque all’insieme delle possibili osservazioni (e.g. Prototipi).

La classificazione avviene in base alla similarità tra una nuova

o osservazione, la cui classe è sconosciuta, con le istanze

rappresentative le cui classi sono note.

Le regole di classificazione (classification rules).

o Regole con eccezioni (rules with exceptions)

Regole con relazioni tra gli attributi (relational rules).

Gli alberi di decisione (decision trees).

o Metodi grafici (Reti Bayesiane, Catene di Markov, …)

o

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 9 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

Sistemi di Classificazione Supervisionata (1)

• Il problema della classificazione supervised si divide in due fasi:

una di apprendimento o di training

una predittiva o di classificazione

molto simile al procedimento sperimentale utilizzato in molte

o ricerche di psicologia cognitiva con soggetti umani

• Nella fase di training si usa un training set (stimulus set),

composto da osservazioni di cui sono note le classi di

o appartenenza

• Nella fase di training vengono apprese le rappresentazioni delle

classi (i concetti) che poi vengono usate nella successiva

fase di generalizzazione e classificazione.

• I sistemi basati su istanze possono essere usati come modelli

cognitivi per la categorizzazione basata su prototipi ed esemplari.

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 10 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

Sistemi di Classificazione Supervisionata (2)

• Modello black-box

Relazione funzionale Input/Output

o Input Output

Training Classifier

set System

Observation Class

• Modello funzionalista si basa sull’identità del behaviour del sistema

i.e., la specifica input-output

o consente la realizzabilità multipla della funzione

o

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 11 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

Sistemi di Classificazione Supervisionata (3)

• Modello white-box

“Apriamo” la scatola nera

o per imporre dei constraint di tipo psicologico

Cfr. fine-grain correspondence” by Pylyshyn (1984 , p.121),

• Modelli Funzionali e Modelli Strutturali

• Modello cognitivo deve prendere in considerazione anche la

plausibilità psicologica della realizzazione interna del sistema

un modello radicalmente strutturale comporta una ricorsione

o «asintotica» verso il microscopico

«The best material model of a cat is another, or preferably the

o same, cat» (Rosenblueth, Wiener, 1945)

• Vediamo come possiamo realizzare un classificatore con una

implementazione interna cognitivamente plausibile

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 12 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

Sistemi di Classificazione Supervisionata (4)

• In psicologia cognitiva abbiamo la Teoria dei Prototipi e la Teoria

degli Esemplari; per entrambe:

la categoria è rappresentata da istanze della classe:

o in un caso sono i prototipi astratti dall’osservazione

e nell’altro sono le istanze stesse precedentemente osservate.

classificazione si basa sulla similarità

o

• Nel machine learning si individuano diverse famiglie di

sistemi di classificazione automatica

in base al tipo di rappresentazione delle categorie

o predicati logici, alberi di decisione, istanze, etc…

o

• Nell’ Instance Based Machine Learning

le classi apprese dal sistema di classificazione automatica,

o vengono rappresentate da istanze della classe

classificazione utilizza una definizione di distanza

o

• Sistemi di classificazione Instance Based

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 13 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

Sistemi di Classificazione Instance-based (1)

• Un generico sistema di classificazione supervisionata basato su

istanze è un sistema del tipo (TS, D, RI, CA, LA):

Instances Based

Observation Experience Input Classifier System

Cross

TS

D( , ) Validation

Training Set

Distance Technique

uses

uses uses

Input RI LA

CA creates

uses Learning

Representative

Classification Algorithm

Items

Algorithm

Output uses

Output

Class Knowledge

“Apriamo” la scatola nera e individuiamo varie componenti

o

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 14 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

Sistemi di Classificazione Instance-based (2)

• Componenti interne di un sistema classificatore IB:

• D - La similarità viene formalizzata dando la definizione di una

distanza nello spazio delle possibili osservazioni

è possibile quantificare la vicinanza tra nuove istanze e le istanze

o memorizzate come rappresentative delle classi.

• RI - La rappresentazione delle classi è costituita da un insieme di

coppie composte da istanze con la rispettiva classe di appartenenza

• CA - L’algoritmo di classificazione assegna ad una nuova

osservazione la classe di appartenenza utilizzando le istanze

rappresentative e la distanza in base ad un criterio di maggior

vicinanza.

• LA - L’algoritmo di apprendimento utilizza il training set per

costruire un insieme di istanze rappresentative. Può essere di tipo

iterativo ed usare la funzione di classificazione con tecniche di cross

validation per incrementare le prestazioni ottenute (metalearning).

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 15 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

Sistemi di Classificazione Instance-based (3)

• D - La distanza

Date due possibili istanze, definiamo la distanza una funzione del

o [ [

( ) ∈ × → ∈ +∞ ⊂ \

D : a , b S S d 0,

tipo:

S è l'insieme delle possibili osservazioni

che soddisfa le seguenti proprietà :

o ⇔

(1) riflessività: D(a, b) = 0 a = b

(2) simmetria: D(a, b) = D(b, a).

(3) disuguaglianza triangolare: D(a, b) + D(b, c) ≥ D(a, c).

• Esempio: la distanza di Minkowski di ordine p generico:

1

⎛ ⎞ p

L

∑ p

α δ α

⎡ ⎤

( ) ( )

= ⋅ ≥ ∈

i i i i i

( ) ( ) ( ) `

D ( X , Y ) ( x , y ) con 0 e p

⎜ ⎟

⎣ ⎦

p i

⎝ ⎠

1

δ

con indichiamo le distanze per ogni singolo attributo

( i )

o

• Cfr. Similarity classifiers

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 16 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

Sistemi di Classificazione Instance-based (4)

• CA –– Algoritmo di classificazione

NN-Rule –– Regola del primo vicino

o kNN-Rule –– Regola dei k-vicini

o

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 17 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

Sistemi di Classificazione Instance-based (5)

• LA –– Algoritmi di Apprendimento

Gli Algoritmi Basati sui Prototipi

o Il Nearest Prototype Classifier (NPC)

Il Nearest Multiple Prototype Classifier (NMPC)

Gli Algoritmi Basati sugli Esemplari

o Il Nearest Neighbour Classifier (NNC)

Il k-NNC

Gli Algoritmi Ibridi e Iterativi

o PEL-C –– Prototype-Exemplar Learning Classifier

• Generalizzazione del T.R.A.C.E. –– Total Recognition by

Adaptive Classification Experiments

• Partono da una concepts description basata su prototipi

• Aggiungono istanze misclassificate e poi eventualmente

astraggono

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 18 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

NPC – Un Sistema di Classificazione basato su Prototipi

• Il Nearest Prototype Classifier (NPC)

L’algoritmo di apprendimento si basa sulla costruzione di un sola

o istanza rappresentativa per ogni classe presente nel training set.

calcolata come baricentro delle istanze appartenenti alla classe

l’istanza “proto-tipica” della classe che rappresenta

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 19 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

NNC - Un Sistema di Classificazione basato su Esemplari

• Il classificatore basato sul primo vicino (NNC — Nearest Neighbour

Classifier)

L’algoritmo di apprendimento consiste nella memorizzazione

o come istanze rappresentative di tutti gli esemplari del training set

è detto memory based; lazy learning

o

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 20 of 36

Roma, 10 Maggio 2011 Dipartimento di Filosofia, La Sapienza Università di Roma

Sistemi di Classificazioni Ibridi (1)

• Algoritmo di apprendimento iterativo per il T.R.A.C.E. e il PEL-C

Partono da un concepts description basata su prototipi (NPC)

o Aggiungono istanze misclassificate e poi eventualmente

o astraggono

1. Inizializza RI con i baricentri delle classi C k

2. WHILE NOT (Condizione di Terminazione)

(Trova una nuova istanza candidata)

2.1 Calcola le distanze tra ogni istanza di TS e ogni istanza di RI

2.2 Tra le istanze di TS misclassificate, trova l’istanza che è più lontana dall’istanza più vicina di

RI della sua stessa classe; sia X della classe C k

2.3 Aggiungi X ad RI. (Aggiorna RI) ; siano RI e TS

2.4 Considera solo le istanze di RI e di TS della classe C k k k

2.5 Aggiorna le posizioni di RI usando l’algoritmo di clustering k-means applicato solo a TS

k

:

con condizioni iniziali RI k rispetto alla RI

2.5.1 Applica la 1-NN rule agli item di TS

k k

aggiornando i baricentri calcolati rispetto alle

2.5.2 Ricalcola iterativamente le istanze di RI k

sottoclassi determinate tramite la 1-NN rule.

3. END

F. Gagliardi – Metodo sintetico e teorie delle categorizzazione Slide 21 of 36


PAGINE

36

PESO

870.40 KB

AUTORE

Atreyu

PUBBLICATO

+1 anno fa


DESCRIZIONE DISPENSA

Questa dispensa si riferisce alle lezioni di Filosofia della scienza, tenute dal Prof. Roberto Cordeschi nell'anno accademico 2011 e tratta i seguenti argomenti:
[list]
Metodo sintetico;
Teorie della categorizzazione;
Fenomeno della tipicità;
Francesco Gagliardi;
Sistemi di Apprendimento automatico.
[/list]


DETTAGLI
Corso di laurea: Corso di laurea in filosofia
SSD:
A.A.: 2011-2012

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Atreyu di informazioni apprese con la frequenza delle lezioni di Filosofia della scienza e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università La Sapienza - Uniroma1 o del prof Cordeschi Roberto.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Filosofia della scienza

Macchine di Turing
Dispensa
Logica
Dispensa
Logica e rappresentazione della conoscenza
Dispensa
Risoluzione automatica dei problemi
Dispensa