Che materia stai cercando?

Dati linguistici

Appunti della facoltà di lettere e filosofia del professor De Masi sulla linguistica generale. Il file contiene una lunga trattazione sull'analisi dei dati testuali, su campioni probabilistici e sulle informazioni archiviate nei database (schemi e funzionamento).

Esame di Linguistica generale docente Prof. S. De Masi

Anteprima

ESTRATTO DOCUMENTO

Varianza = sommatoria di tutti gli scarti della media diviso il numero degli individui.

Abbiamo ottenuto una misura quadratica, per renderla lineare estraiamo la radice quadrata di tutta la formula

sommatoria. Varianza alta = dati meno omogenei.

Varianza = misura di variabilità (la sommatoria) > (6)``sigma al quadrato.

Scarto quadratico medio = la radice quadrata della varianza, la distanza media di ciascun individuo dalla media

(6signa), quanto mediamente i dati variano intorno alla media.

Statistica induttiva = serve a dirci qual è la probabilità che nell’estendere le proprietà del campione alla

popolazione nn commettiamo errore.

Le probabilità di errore, base delle previsioni statistiche, impossibile annullarle ma bisogna ridurle al minimo

possibile (95%).

Concetto di distribuzione dei dati = riconducibile a un grafico come si distribuiscono i casi intorno a certi valori

rappresento un valore in funzione dell’altro, ho 18 individui che assumono esattamente i valori corrispondenti

2 > 1 = 2 ha valore 1

1 > 2 = 1 ha valore 2

4 > 3 = 4 ha valore 3

1 > 4 = ecc

7 > 5 = ecc

3 > 6 = ecc

A volte i dati si dispongono in maniera più ordinata

oppure

tanti diversi andamenti, ma uno è molto importante perché esprime l’andamento normale < curva normale

2

valori di y massimi vicini alla medi; la media è il valore intorno a cui si concentrano il maggior numero dei casi

divide la campana in due parti perfettamente simmetriche.

Scale intervalli > più precise e dettagliate;

scale nominali > meno indicative (maschi/femmine, cattolici/musulmani).

Raccolta dati tramite questionari, ogni domanda definisce una variabile all’interno della quale noi mettiamo i

valori, per esempio “l’età” costituisce una scala a intervalli; il “titolo di studio” è una scala ordinale (laurea,

diploma, ecc) ma nn possiamo dire la differenza tra laurea e diploma e diploma e licenza media. Per esempio “il

lavoro svolto” si possono ordinare in base al reddito, ma a volte vorremmo inquadrare i soggetti nel ceto sociale ,

cosa difficile perché gli interessati tendono a sovrastimare le proprie condizioni. Così si divide la variabile grande

con variabili più piccole , per esempio il titolo di studio e il mestiere che possono essere indicativi per

l’individuazione del ceto sociale, anche se la casa è di proprietà e la grandezza, se la famiglia possiede altre

case, quante stanze... cioè faccio tante domande per avere tante risposte che mi diano la possibilità di comporre

un quadro giusto nei riguardo la variabile originaria che era il “ceto sociale”.

come facciamo a costruire un indice sintetico di tutte le domande? Potremmo incrociare due variabili es. titolo di

studio e professione - 12 classi. E se lo faccio a 3 variabili con 3 possibili valori ottengo 36 classi > nn è una

buona strada.

Posso mettere le diverse risposte possibili in ordine in ordine dando dei punti ad ogni risposta e sommo i punti di

ogni variabile. Ma come attribuire i punti? Come togliere la soggettività?

C’è una classe con 2 prof., uno di italiano e uno di matematica; i risultati del compito d’italiano e matematica

sono:

X1 6 4

X2 5 3

X3 6 5

X4 4 4

X5 8 2

X6 10 8

a) Media: I = 39 diviso 6 = 6,5; M = 26 diviso 6 =4,3

b) Varianza

c) Scarto quadratico medio

Per standardizzare i risultati si fa tutto questo procedimento.

Calcolare lo scarto e la media, dal voto grezzo tolgo la media, lo divido per lo scarto quadratico medio e ottengo il

voto standardizzato per confrontare.

I > X1 -0,5 > scarto I

M > -0,34 > scarto M

Lo scarto quadratico medio diventa l’unità di misura.

Z > nuova variabile come media 0 e come scarto quadratico medio 1 e con tutte e due possiamo fare i confronti,

per es X1 è più bravo in matematica.

Questo procedimento si può applicare ai sondaggi con questionari.

Linguistica Computazionale 3

Il materiale deve essere trattabile dalla macchina utilizzando una codifica che permette la lettura. La macchina si

serve di linguaggio binario O e 1 e le conseguenti combinazioni danno ulteriori informazioni. Per es, per avere

quattro informazioni devo avere due caratteri > 11/01/10/00 > stringhe di lunghezza 2.

In linguistica la ridondanza è un eccesso d’informazione che però ci tutela dagli errori, basterebbe una lettera per

esprimere un concetto ma gli errori d’interpretazione sarebbero tantissimi.

Computer > non magnetizzato = 0; magnetizzato 1 > l’unità d’informazione si chiama bit e corrisponde ad una

cifra binaria o 0 o 1 > le stringhe di bit codificano più caratteri e raggiungono la lunghezza di 8, formano un byte e

sono la codifica di un carattere > si possono costruire 2(8) (due all’ottava) cioè 256 caratteri. Ogni stringa binaria

corrisponde ad una cifra, es: 0 = 0, 1 = 1, 10 = 2.

322 si può scrivere in base 10 così:

3 x 10(2) + 2 x 10(1) + 2 x 10 (0)

11 su base binaria si scrive così:

1 x 2(1) + 1 x 2(0) quindi 11 è uguale a 3.

(regole: un numero elevato alla potenza 0 dà sempre 1, elevato alla potenza 1 dà sempre se stesso, elevato ad

altre potenze si moltiplica tante volte quanto indica la potenza).

esempi di trasformazione di numeri da binari a decimali:

1101 >

1 x 2(3) + 1 x 2(2) + 0 x 2(1) + 1 x 2(0) = 13

(cioè 6 + 4 + 2 + 1 = 13)

Abbiamo un valore intrinseco ed uno di posizione.

Su base decimale:

3425

3 x 10(3) + 4 x 10(2) + 2 x 10(1) + 5 x 10(0).

Se prendo un numero in base 10 e lo divido per 2, questa operazione può dare o resto 0 o resto 1; per es il

numero 13 con una serie di divisioni deve dare vari resti (algoritmo da decimale a binario).

Posso scrivere una corrispondenza biunivoca fra caratteri, un insieme di numeri binari e un insieme di numeri

decimali C<>B<>D.

Ogni carattere può essere rappresentato con un numero decimale per esempio sul computer Alt + 65 = A, quindi

le lettere sono frutto di stringhe di cifre binaria, quando premiamo A do un comando di scrivere una stringa che

corrisponde a 65 e corrisponde a un segno grafico sul monitor e queste associazioni sono arbitrarie, infatti ci

sono dei font con simboli dove associato al 65 c’è un disegno diverso dalla A. Quindi un numero binario può

essere letto come decimale al quale corrisponde un segno grafico che dipende dal font; ci sono delle proprietà

che appartengono al carattere: il font, la dimensione, lo stile.

Carattere; più caratteri = paragrafo; paragrafo; più paragrafi = pagina; paragrafo; allineamento; rientri.

Testo = entità che varia in funzione delle ns esigenze, possiamo servirci di dati salvati in formati diversi. Il nome

del file è composto da un prefisso ed un’estensione separati da un punto.

In un file ci sono informazioni di tipo ASCI e informazioni che ci dicono come deve essere (caratteri di controllo).

- La trasformazione di un numero da base 10 a base 2, si ottiene dividendo il numero per due fino ad ottenere un

quoziente inferiore a 2; si registrano i resti delle divisioni e l’ultimo quoziente; il numero viene rappresentato

scrivendo l’ultimo quoziente e riportando a ritroso, e resti delle divisioni.

37 : 2 = 18 resto 1

18 : 2 = 9 resto 0

9 : 2 = 4 resto 1

4 : 2 = 2 resto 0

2 : 2 = 1 resto 0

(ultimo quoziente)

=

100101

Questa procedura può essere utilizzata per trasformare qualsiasi numero dato in base 10, in altra base: il

divisore sarà il numero utilizzato per quella determinata base.

- La trasformazione di un numero da base 2 a base 10 si ottiene moltiplicando ogni cifra, partendo dall’ultima, per

la potenza di 2 che gli corrisponde (all’ultima cifra corrisponde 2(0) cioè 1, alla penultima 2(1), alla terzultima 2(2)

e così via) e sommando i risultati. Es.:

1 x 2(5) + 0 x 2(4) + 0 x 2(3) + 1 x 2(2) + 0 x 2(1) + 1 x 2(0) = 37 (cioè 32 + 4 + 1 = 37)

Altro esempio: 748 da base 10 a base 8: 748 : 8 = 93 resto 4

93 : 8 = 11 resto 5

11 : 8 = 1 resto 3

=

4


PAGINE

8

PESO

43.27 KB

PUBBLICATO

+1 anno fa


DETTAGLI
Corso di laurea: Corso di laurea in scienze della comunicazione
SSD:
A.A.: 2013-2014

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher cecilialll di informazioni apprese con la frequenza delle lezioni di Linguistica generale e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Salento - Unisalento o del prof De Masi Salvatore.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Linguistica generale

Riassunto esame Linguistica Generale, prof. De Masi, libro consigliato La linguistica, Berruto, Cerruti
Appunto
Riassunto esame Linguistica Generale, prof. De Masi, libro consigliato: La frase: l'analisi logica, Graffi
Appunto
Appunti di Linguistica Generale (Parte 1)
Appunto
Analisi linguistica
Appunto