vuoi
o PayPal
tutte le volte che vuoi
Abstract
L’indagine statistica che si affronta in questo lavoro ha come oggetto la definizione delle regioni
dialettali nel Regno Unito. La finalità è quella di definire, a partire da una matrice di distanza fonetica,
quanto le città corrispondenti ai singoli dialetti siano distanti uno dall’altro.
L’analisi statistica è stata eseguita seguendo l’approccio del multidimensional scaling utilizzando due
tecniche le quali hanno permesso di definire meglio il problema. Come risultato si hanno grafici che
permettono una lettura immediata delle regioni dialettali all’interno del Regno unito.
KEYWORD: Uk dialect, multidimensional scaling.
Introduzione
Il termine dialetto può essere distinto in due accezioni principali ovvero la varietà di una
lingua e la lingua contrapposta a quella nazionale. La varietà di una lingua è definita come
un continuum linguistico geografico che condividono gli stessi caratteri strutturali e la
stessa storia della nazione, quindi una varietà linguistica intelligibile con altre del gruppo.
La lingua contrapposta a quella nazionale invece identifica una lingua autonoma che ha
caratteri strutturali e una storia distinti dalla lingua nazionale, prescinde da legame di
dipendenza e appartenenza alla lingua ufficiale anche se le somiglianze possono essere
notevoli.
La fonologia è la branca della linguistica che studia i sistemi di suoni delle lingue del
mondo. Più in particolare la fonologia si occupa di come i suoni linguistici (foni) siano
usati per distinguere significati e della competenza che i parlanti posseggono nei riguardi
del sistema fonologico della propria lingua. Più recentemente, è stato scritto che la
fonologia si riferisce principalmente alla branca della linguistica che riguarda i suoni delle
lingue, mentre, in senso più stretto, "la fonologia propria riguarda la funzione, il
comportamento e l'organizzazione dei suoni come unità linguistiche"[1].
Materiali e metodi.
Per l’analisi statistica delle regioni dialettali viene presa in considerazione la matrice
distanza ricavata dalla tabella “dialect” [2].
Tabella1.Matrice distanza dialetti [2]
Per l’analisi dei dati si utilizza il metodo del Multidimensional Scaling, una tecnica di
analisi statistica che permette di mostrare graficamente le differenze o somiglianze tra
elementi di un insieme[3].
Per l’approccio computazionale è stato utilizzato il software R-Studio, utilizzando le
funzioni “cdmscale” e “pco”.
La prima variabile da definire per strutturare i metodi è la definizione delle dimensioni su
cui analizzare i dati. Per determinare tale valore bisogna eseguire l’analisi di stress per
ogni valore di k fino ad avere un cambio di pendenza significativo che porta ad avere
valori relativamente stabili
Lo Stress-factor è una misura della bontà dell’adattamento per il modello di
Multidimensional Scaling. Più piccolo è lo stress migliore l'accordo tra dati e modello. Tale
stress misura le differenze delle distanze tra i punti nello spazio di calcolo di MDS e le
corrispondenti distanze tra i dati in input e i risultati elaborati dall'algoritmo. Lo stress
misura l'errore ma da anche indicazioni sull'utilizzo scorretto del numero di dimensioni
dello spazio di calcolo e rappresentazione.
Per la determinazione degli stress-factor è stato utilizzato il software R, utilizzando la
funzione “isoMDS” nel pacchetto “MASS” [4].
Tabella 2.Curva Stress-factor in funzione di k.
Analizzando il grafico si nota chiaramente che il cambio di pendenza avviene nella
dimensione k=3, e successivamente i valori di stress-factor calano in maniera non troppo
significativa. Per l’analisi che si intende effettuare si terrà conto di solo due dimensioni,
poiché l’oggetto di studio è principalmente un’analisi geografica che tiene conto solo di
una distanza su un piano.
Risultati
Poiché sono stati utilizzati due metodi diversi per l’analisi del problema, si ottengono due
principali risultati che verranno proposti di seguito.
Il primo risultato viene elaborato attraverso il metodo che utilizza la funzione “cmdscale”.
I risultato ottenuti sono la rappresentazione numerica delle distanze tra i vari oggetti.
Tabella 3. Risultati ottenuti con la funzione “cmdscale”.
Dalla precedente tabella possiamo ricavare un risultato grafico che esprime in maniera visiva
le distanze dialettali delle città, utilizzando coordinate xy rappresentabili su un piano
cartesiano a due dimensioni.
Tabella 4. Rappresentazione grafica su piano delle variabili, funzione “cmdscale”.
Infine possiamo costruire il diagramma di Shepard che mostra le cosiddette disparità (ossia le
distanze in ingresso, trasformate nello spazio di dimensione k dal MDS) .
[5]
Tabella 5. Diagramma di Shepard per l’analisi con funzione “cmdscale”.
Il secondo metodo che verrà illustrato prende in considerazione la funzione “pco”. I risultati
ottenuti attraverso questo metodo di scaling sono i seguenti:
Tabella 6. Risultati ottenuti con la funzione “pco”.
Dalla precedente tabella possiamo ricavare un risultato grafico che esprime in maniera visiva
le distanze dialettali delle città, come fatto in precedenza.
Tabella 7. Rappresentazione grafica su piano delle variabili, funzione “pco”.