vuoi
o PayPal
tutte le volte che vuoi
Calcolo dello scarto e della media
Dal voto grezzo si sottrae la media e si divide per lo scarto quadratico medio per ottenere il voto standardizzato per il confronto.
I > X1 - 0,5 > scarto IM > -0,34 > scarto M
Lo scarto quadratico medio diventa l'unità di misura.
Z > nuova variabile con media 0 e scarto quadratico medio 1. Con entrambi possiamo fare i confronti, ad esempio X1 è più bravo in matematica.
Questo procedimento si può applicare ai sondaggi con questionari.
Linguistica Computazionale 3
Il materiale deve essere trattabile dalla macchina utilizzando una codifica che permette la lettura. La macchina si serve di linguaggio binario (0 e 1) e le conseguenti combinazioni forniscono ulteriori informazioni. Ad esempio, per avere quattro informazioni devo avere due caratteri: 11/01/10/00, che sono stringhe di lunghezza 2.
In linguistica, la ridondanza è un eccesso di informazione che però ci tutela dagli errori. Basterebbe una lettera per esprimere...
un concetto ma gli errori d'interpretazione sarebbero tantissimi.
Computer > non magnetizzato = 0; magnetizzato 1 > l'unità d'informazione si chiama bit e corrisponde ad una cifra binaria o 0 o 1 > le stringhe di bit codificano più caratteri e raggiungono la lunghezza di 8, formano un byte e sono la codifica di un carattere > si possono costruire 28 (due all'ottava) cioè 256 caratteri. Ogni stringa binaria corrisponde ad una cifra, es: 0 = 0, 1 = 1, 10 = 2. 322 si può scrivere in base 10 così: 3 x 102 + 2 x 101 + 2 x 100. 11 su base binaria si scrive così: 1 x 21 + 1 x 20 quindi 11 è uguale a 3. (regole: un numero elevato alla potenza 0 dà sempre 1, elevato alla potenza 1 dà sempre se stesso, elevato ad altre potenze si moltiplica tante volte quanto indica la potenza). esempi di trasformazione di numeri da binari a decimali: 1101 > 1 x 23 + 1 x 22 + 0 x 21 + 1 x 20 =
13 (cioè 6 + 4 + 2 + 1 = 13)
Abbiamo un valore intrinseco ed uno di posizione. Su base decimale: 34253 x 103 + 4 x 102 + 2 x 101 + 5 x 100.
Se prendo un numero in base 10 e lo divido per 2, questa operazione può dare o resto 0 o resto 1; per esempio il numero 13 con una serie di divisioni deve dare vari resti (algoritmo da decimale a binario).
Posso scrivere una corrispondenza biunivoca fra caratteri, un insieme di numeri binari e un insieme di numeri decimali C<>B<>D.
Ogni carattere può essere rappresentato con un numero decimale, per esempio sul computer Alt + 65 = A, quindi le lettere sono frutto di stringhe di cifre binarie. Quando premiamo A, do un comando di scrivere una stringa che corrisponde a 65 e corrisponde a un segno grafico sul monitor e queste associazioni sono arbitrarie, infatti ci sono dei font con simboli dove associato al 65 c'è un disegno diverso dalla A. Quindi un numero binario può essere letto come decimale al quale
corrisponde un segno grafico che dipende dal font; ci sono delle proprietà che appartengono al carattere: il font, la dimensione, lo stile.
Carattere; più caratteri = paragrafo; paragrafo; più paragrafi = pagina; paragrafo; allineamento; rientri.
Testo = entità che varia in funzione delle ns esigenze, possiamo servirci di dati salvati in formati diversi. Il nome del file è composto da un prefisso ed un'estensione separati da un punto.
In un file ci sono informazioni di tipo ASCI e informazioni che ci dicono come deve essere (caratteri di controllo).
- La trasformazione di un numero da base 10 a base 2, si ottiene dividendo il numero per due fino ad ottenere un quoziente inferiore a 2; si registrano i resti delle divisioni e l'ultimo quoziente; il numero viene rappresentato scrivendo l'ultimo quoziente e riportando a ritroso, e resti delle divisioni.
37 : 2 = 18 resto 1
18 : 2 = 9 resto 0
9 : 2 = 4 resto 1
4 : 2 = 2 resto 0
2 : 2 = 1 resto 0
errore: per esempio se passa o nn passa corrente basta 1 e 0 se è un solo filo; se sono due fili, ci vogliono 4 situazioni possibili. In genere la comunicazione è disturbata e con questo sistema ci sono molte possibilità d'errore.
a > 111| |b > 100| |c > 010| |d > 001
La distanza tra due parole > D(alfa, beta) è data dal numero di posizioni nelle quali alfa e beta differiscono. Es:
P1 11
P2 10
P3 01
P4 00
D (P1, P2) = 1
D (P1, P4) = 2
Nel trasmettere P1 e P2 faccio un errore semplice, possono convertirsi tra loro, cosa che nn può succedere dove la distanza è 2 > quindi se ho distanze maggiori di 1 posso individuare l'errore. Installando 3 cavi, ricavo 3 stringhe per avere distanze maggiori di 1.
Possibili esiti di un errore semplice (codici di correttori di errori semplici).
011 - 101 - 110 > per il caso a questi sono gli esiti, cioè gli errori possibili.
Il linguaggio combina unità di primo livello in
unità di secondo livello che si combinano tra loro (fonemi, morfemi, frasi). Un sistema combinatorio è il linguaggio umano. Es: se ho un codice binario e devo fare stringhe di sette parole, quante combinazioni ho? > 2(7). Le lingue quindi hanno bisogno di costi aggiuntivi > stringhe che nn ricavo alcun significato. Es: se ho una sorgente di messaggi che mi invia 1 fra 4 messaggi possibili, ho così ridotto l'incertezza di quale messaggio mi doveva arrivare all'inizio. Ma quanta è l'incertezza che si è ridotta? È legata al numero di alternative possibili (1 mess su 4 è 1/; 1 mess su 8 è 1/8 e quindi meno). Logaritmo è la potenza che ci dà....lg2 a > logaritmo in base 2 di a > 2x = a > lg2 4 = 2 perché 2(2) = 4; è quel numero che bisogna mettere alla base per ottenere il numero di partenza. Entropia. DATABASE Nel file le informazioni vengono messe secondo una struttura, noi nei file
inseriamo dei record e ogni informazione è un campo quindi un insieme di record è un file. Ogni volume rappresenta un insieme di informazioni fisso. Ogni campo ha un valore. Per l'inserimento dei dati sempre uguali (es stesso autore, libri diversi) fare 2 file, uno con tutti i titoli, l'altro con i dati dell'autore, si possono richiamare le informazioni con un collegamento con un codice univoco.
Come si costruiscono gli archivi:
- Superbase > File > Nuovo > File Tipo Dati > Esterno (per richiamare un file esterno che può contenere dati lunghi) per mettere il riferimento al file esterno.
- Formato del Testo > se scegli Logico contiene un solo carattere che può essere Vero o Falso, gli altri li so.
- File > Indice > Criteri di ordinamento; è un file che contiene una chiave secondo la quale do un certo ordinamento, si possono fare Indici su ogni campo. Non cambia l'ordine di inserimento ma solo le visualizzazioni.
Solo
Valori Unici > vuol dire che il sistema impedisce l'inserimento di dati uguali; in questo caso non vaselezionato perché, per esempio, ci possono essere due titoli uguali di autori diversi.
Utilità > Editor Testi > per fare il file esterno. Per visualizzarlo fare click sull'alberello che si trova in basso.
Obiettivi: prendere i testi ed elaborarli tramite strutture particolari realizzate con Superbase.
File > Nuovo > Testi > Aggiungi: NemRec (tipo dati: intero) Calcolo... (formula di calcolo per NumRec > FormulaSER (“TESTI”) per far inserire automaticamente la numerazione del sistema come un contatore). RDO = di solalettura (Opzioni Campo). 5Campo POSIZIONE > Tipo Testo > Formato 14 Caratteri tutto maiuscolo.
Aggiungi...> TESTO > Tipo di Dati: Testo > Formato...400 normale.
Indici > fare solo valore unico a NUMREC.
Fare Statistiche: per es. quante volte un autore usa una parola. Per non scrivere ogni volta una
stessa parola,abbiamo bisogno di più file, es. file TESTI, file LISTA, file LEMMI.- File LEMMINUMRECPAROLA abbandonaLEMMA abbandonareCATEGORIA veF–INDICE abbandona abbandonare veAMBIGUO FCLITICOINVERSO anodnabbaTIPOSEMANTICAParola clitica = che nn può stare da sola, ha bisogno di una parola d’appoggio).Il campo CLITICO > numero per costringere il computer a contare due parole come per es “lavando|si.INVERSO > per creare degli indici inversi o analisi di tipo morfologico; es. tutte le parole che finiscono in ZIONE,cerca tutti gli inversi che cominciano con ENOIZ; oppure ordinare tutte le rime.- File LISTANUMRECPAROLALEMMACATEGORIAPOSIZIONECONTESTOINDICEF–INDICEConcordanza: prodotto al quale dobbiamo arrivare.Prima riga grassetto segna la posizione del lemma.Il lemma.Categoria grammaticale.Frequenza assoluta o numero occorrenze.Frequenza relativa > numero occorrenze lemma diviso il numero totale delle occorrenze.Seconda rigaSerie di sigle
del campo posizione; riga di testo (contesto in cui appare il lemma; es. 4; abbandonare, ve, 19, 0,00028); nel contesto appaiono le forme flesse.
ListRango - Rango > numero d’ordine occupato da un lemma nella lista decrescente delle frequenze. In caso diparità di frequenza si assegna lo stesso rango.
LemmaCG (categoria grammaticale)Freq (complessiva in tutte le opere)FOP1 (nelle singole opere)FOP2 (nelle singole opere)F.Cum (somma di tutte le frequenze entro un valore stabilito sempre dal primo a quello riferito).
ListCateg > divisi i lemmi per categorie.
ab = abbreviazioni
ag = aggettivo (modifica un nome)
ar = articolo
av = avverbio
Ogni cambio di categoria si cambia il campo.
Lessico Specifico > “Il Giornale”
Rango 1;Lemma fo