Codifica dei numeri e dei caratteri

Appunti di Fondamenti di informatica sulla codifica dei numeri e dei caratteri basati su appunti personali del publisher presi alle lezioni dell’università Accademia di belle arti …

Esame Fondamenti di informatica

Facoltà Grafica

Università Accademia di belle arti Santagiulia

Publisher gaia_vettore

A.A. 2021-2022

11 pagine

Appunto

Vota

Scarica

Estratto del documento

Risultati delle operazioni

PROBLEMA 1: Dato il numero decimale 25, come si scrive in binario (cioè in base 2)?

25 : 2 = 12 + 1

12 : 2 = 6 + 0

6 : 2 = 3 + 0

3 : 2 = 1 + 1

1 : 2 = 0 + 1

Leggo i resti dal basso verso l'alto: 11001 (base 2)

PROBLEMA 2: Dato il numero binario (cioè in base 2) 11001, come si scrive in decimale (cioè in base 10)?

1 * 2^4 + 1 * 2^3 + 0 * 2^2 + 0 * 2^1 + 1 * 2^0 = 16 + 8 + 0 + 0 + 1 = 25 (base 10)

PROBLEMA 3: Come si scrive il numero decimale (cioè in base 10) 63 in esadecimale (cioè nella base 16)?

63 : 16 = 3 + 15

Leggo il resto dal basso verso l'alto: 3F (base 16)

—> 3F (il 15 negli esadecimali si scrive con lettera F → 0-1-2-3-4-5-6-7-8-9-A-B-C-D-E-F)

PROBLEMA 4:

inverso: come si scrive il numero esadecimale (cioè in base 16) 3F in base 10 (cioè decimale)?

3 F

3 15

1 0

6 16

1 4

+ 15= 63

scrivo in modo distanziato le cifre del numero esadecimale (3-F) e scrivo partendo da destra verso sinistra, le potenze di sedici 0 16 (partendo da 1) e nella riga successiva le scrivo in forma estesa. Moltiplico poi la forma estesa della potenza di 16 per le cifre iniziali (3-F): sommo poi i vari prodotti trovati.

A cosa serve la notazione esadecimale?

Il computer non può gestire una notazione esadecimale, ma è stata inventata dagli informatici per comodità perchè è molto compatta: la notazione esadecimale viene usata principalmente per il fatto che ciascuna cifra esadecimale può rappresentare numeri di 4 cifre binari (bit) e di conseguenza due cifre esadecimali possono rappresentare 8 bit, cioè un

byte. Una cifra esadecimale corrisponde a 4 bit, due cifre esadecimali a 8 bit (ma 8 bit sono un byte). Esempio: prendo la F della notazione esadecimale, per rappresentare il 15esimo simbolo corrispondente binario, fa uso di 4 cifre (una cifra - F - corrisponde a 4 cifre binarie - 1111 -). ESERCIZIO 5: scrivere il numero binario di 8 cifre 11001000 nella notazione decimale e esadecimale: 1 1 0 0 1 0 0 0 7 6 5 4 3 2 1 0 2^7 2^6 2^5 2^4 2^3 2^2 2^1 2^0 128 + 64 + 0 + 0 + 8 + 0 + 0 + 0 = 200 11001000 (base 2) = 200 (base 10) 200 : 16 = 12 + 8 12 : 16 = 0 + 12 12 8 Siccome 12 nella notazione esadecimale corrisponde a C --> C8 11001000 (base 2) = C8 (base 16) Codifica dei numeri mediante i bit: una delle prime cose che si richiedeva ai computer è che essi fossero in grado di "comprendere" i numeri nella rappresentazione decimale, che abbiamo visto essere quella rappresentazione alla nostra natura umana. I computer, data la loro natura, operanosui numeri "scritti" secondo la rappresentazione binaria e devono quindi convertire, secondo gli algoritmi di trasformazione di base, i numeri decimali in ingresso (input) in numeri binari, per poi restituire in uscita (output) nuovamente i numeri decimali. ESERCIZIO 7: CODIFICA DEI NUMERI E DEI CARATTERI Se ho a disposizione 7 bit, quanti numeri posso rappresentare? 2^7=128 128 combinazioni da 0 a 127. Scrivere in notazione binaria e nella corrispondente notazione decimale il numero più basso e il numero più alto rappresentabile con 7 bit. Notazione binaria il più piccolo è: 0000000; mentre il più grande: 1111111 Il perché uno sia il più piccolo e l'altro il più grande lo capiamo facendo la conversione in decimale: 1 1 1 1 1 1 1 64 32 16 8 4 2 1 64 + 32 + 16 + 8 + 4 + 2 + 1 = 127 Mentre 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 + 0 + 0 + 0 + 0 + 0 + 0 = 0 corrisponde a 0 (base 10) e

1111111 corrisponde a 127 (base 10). 02il numero massimo che otteniamo non sarà mai pari perché c'è sempre quel = 1che rende dispari il numero.il computer scrive anche i numeri negativi: numeri + e - . Il segno ha 2 stati, ossia 1bit (log in base 2 di 2): rappresentazione in modulo e segno. Per convenzione si stabilisce che la prima cifra sia 0 per i numeri positivi e 1 per i numeri negativi.

CODIFICA DEI NUMERI E DEI CARATTERI 6esempio (numeri binari a 5 cifre), scrivo 6:convertiamo 6 in binario:6 : 2 = 3 + 03 : 2 = 1 +11 : 2 = 0 + 1110, ma se io sto usando una codifica a 5 cifre, ci devo mettere 2 zeri davanti-6 → 10110+6 → 00110con 5 cifre binarie posso rappresentare 32 stati: se non avessimo considerato ilsegno, in notazione con 5 bit, il numero più piccolo che potevamo rappresentare è 00000, che corrisponde a 0 e il più alto è 31. Se io ora devo considerare il bit più a sinistra come il bit del segno, lo devo togliere,

ossia:
1 bit (segno)+ 4 bit (modulo)2^4= 16
nel mettere il segno possiamo andare da 0000 (0 in base 10) a 1111 (15 in base 10),ma li rappresentiamo con il segno quindi andiamo da -15 fino a +15.
Da -15 fino a + 15 abbiamo 31 stati, non più 32, (conto lo 0 due volte, -0 e +0 ):mettendo la convenzione del segno abbiamo perduto un numero: il segno ha due stati, quindi gli serve un bit, che vado a togliere da quelli che servono per gestire i numeri (32-1=31).
codifica caratteri numeri con notazione esadecimale
sono 16 coppie di numeri esadecimali
perché sono 16 caratteri convertiti
nella conversione esadecimale: il numero 1 nella notazione esadecimale è 1, ma se traduco il carattere 1 in esadecimale è 31 (guardo ad esempio CODIFICA DEI NUMERI E DEI CARATTERI 7 la seconda riga). I caratteri non considerano i numeri come qualcosa che serve per contare, ma semplicemente traducono i simboli.
il punti ad esempio si chiamano E3-CF-D3... etc
gli spazi nella notazione esadecimale

è20Caratteri esadecimali appaiono adesempio nei link riferiti a pagine web il cui percorso (path) contenga degli spazi. Oppure su html vengono utilizzati gli esadecimali: colori RGB hanno 6 cifre esadecimali.

L'altra richiesta che si faceva ai computer era che fossero in grado di "comprendere" anche le lettere dell'alfabeto. In sostanza, c'era la necessità che il computer fosse in grado di comprendere dati alfanumerici:

numeri da 0 a 9
lettere dell'alfabeto, da A a Z
altri simboli di uso corrente nella scrittura (accenti, apostrofi, segni punteggiatura, etc)

LA CODIFICA STANDARD CODE FOR INFORMATION INTERCHANGE (ASCII)

Codice Standard Americano per lo Scambio di Informazioni detta anche US-ASCII impiegava 7 bit (poteva rappresentare 2^7 caratteri = 128 simboli diversi, di cui 95 stampabili) fu accettata come standard dall'ISO nasce nel 1961 (computer è nato nel 44)

CODIFICA DEI NUMERI E DEI CARATTERI 8 aveva 95 caratteri stampabili, tra cui lettere maiuscole,

lettere miuscole, numeri, simboli (lelettere accentate non hanno posto)

Prima del 44 facevano uso di schede di cartone, perforate (con tanti buchini).

Il lettore trasformava questi buchini del cartone in informazioni che il computer comprendeva.

Successivamente nacque l'esigenza di poter rappresentare anche le lettere accentate e altri simboli diatrici non impiegati nella lingua inglese ma in uso nelle altre lingue del mondo:

accento grave

accento acuto

umlaut tedesco

cediglia spagnola

ecc...

Codifica ACII estesa: è degli anni 80. Ha 8 bit, ed è in grado quindi di rappresentare il doppio dei caratteri (256) rispetto alla prima codifica ASCII.

Problemi non risolti dalla codifica ASCII anche considerando la sua estensione a 8 bit: lingue non latine, come il greco, l'ebraico, l'arabo, il cirillico, il cinese, il coerano, il giapponese

alfabeto diverso

numero di lettere diverso

proliferare di estensioni ASCII non-standard

ciascuna azienda produttrice di computer aveva un suo set di

caratteri proprietario. Le aziende, per vendere i computer all'estero si inventano i "set di caratteri proprietari".

CODIFICA DEI NUMERI E DEI CARATTERI 9

Entra in campo l'ISO, che si inventa una propria codifica di caratteri che si chiama 8859 che semplicemente è una versione localizzata per ciascuna lingua, alfabeto, per cui ad esempio i nostri caratteri corrispondono alla iso 8859-1 (sempre a 8 bit), quelli dell'europa orientale è iso 8859-2, 8859-5 per il cirillico. Microsoft crea un suo sistema di codifica che si chiama code page 1252, standard per le versioni europee di Windows.

LA CODIFICA UNICODE

Nel 1991, con l'intento di codificare in modo standard il più grande numero di caratteri possibile e di permettere l'utilizzo contemporaneo di caratteri appartenenti ad alfabeti diversi (ad esempio il greco e l'arabo) in un unico documento, fu introdotta una nuova codifica chiamata Unicode: set di caratteri più diffuso non tutte le

Applicazioni sono pienamente compatibili:

Inizialmente: 65.536 (=2 elevato alla 16) caratteri (code points)

Oggi: 2.097.152 (=2 elevato alla 21) di cui più di 100.000 già assegnati. I primi 256 code points corrispondono a quelli dello standard iso 8859-1.

Unicode è un consorzio costituito da ubm, apple, windows, microsoft... che decidono di unire le forze e rendere standard questa codifica 8 valida per tutti i sistemi operativi (piena compatibilità) ed oggi è l'insieme di caratteri più diffuso, ma non tutte le app sono pienamente compatibili: Office 2011 (più di 20 anni dopo invenzione unicode) e il produttore di Office è microsoft, ma Office 2011 versione mac non è compatibile in unicode perchè quello che noi abbiamo dell'informatica è il "meglio per le tasche di chi produce", ossia Microsoft produce due linee di prodotto ossia Windows e Office: quando vendo Office per mac ho venduto Office ma non Windows.

quindi faccio business quando vendo entrambi, allora Microsoft taglia le gambe a chi compra mac togliendo compatibilità unicode, invitando a comprare windows. Sistema di codifica che assegna un numero univoco ad ogni carattere usato per la scrittura di testi, indipendentemente dalla lingua, dalla piattaforma informatica e dal programma che si utilizza. Unicode è gestito da Unicode consortium.

Anteprima

Vedrai una selezione di 4 pagine su 11

Codifica dei numeri e dei caratteri Pag. 1

Codifica dei numeri e dei caratteri Pag. 2

Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.

Scarica

Codifica dei numeri e dei caratteri Pag. 6

Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.

Scarica

Codifica dei numeri e dei caratteri Pag. 11

Acquista con carta o PayPal

Scarica i documenti tutte le volte che vuoi

Dettagli

SSD

Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher gaia_vettore di informazioni apprese con la frequenza delle lezioni di Fondamenti di informatica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Accademia di belle arti Santagiulia o del prof Scienze matematiche Prof.

Appunti correlati

Invia appunti e guadagna

Recensioni

Ti è piaciuto questo appunto?

Codifica dei numeri e dei caratteri

Risultati delle operazioni

Recensioni

Domande e risposte

I migliori insegnanti di Informatica

Salvatore F.

Andrea D.

Pietro S.