Tecnologie digitali del suono e dell'immagine: Suono
1.1 Segnali e sistemi
Segnale: una grandezza fisica che può variare nel tempo, nello spazio o in una loro combinazione e che porta informazioni riguardanti lo stato di qualche particolare fenomeno fisico dal quale provengono.
Sistema: un circuito il quale può anche produrre un segnale.
1.2 Segnali continui e discreti
Il mondo reale si basa su segnali con caratteristiche analogiche, ovvero che assumono valori che variano con continuità. I computer invece possono trattare solo valori finiti, rendendoli incompatibili con il segnale analogico (continuo e caratterizzato da valori infiniti), perciò bisogna trasformare l'analogico in digitale. Per questo i segnali possono essere continui o discreti.
1.3 Trattamento informazione digitale
Sistema di acquisizione: insieme di operazioni per procedere al trattamento e elaborazione di un segnale proveniente dal mondo esterno è necessario effettuare la trasformazione da analogico a digitale.
- Sistema di elaborazione: elabora il segnale digitale in entrata, applicando delle procedure definite dal contesto, producendo un dato digitale elaborato in uscita.
- Sistema di distribuzione: per usufruire del segnale nel mondo reale per la manifestazione dei risultati, rende il segnale interfacciabile.
1.3.1 Sistema di acquisizione
- Rilevamento: l'elemento più importante di questa fase è il trasduttore, che fornisce in uscita una grandezza elettrica di valore, proporzionale a quello della grandezza fisica in esame. Un microfono fornisce un segnale proporzionale all'onda di pressione acustica misurata.
- Condizionamento: il segnale che arriva dal trasduttore, per ottenere garanzie sulla precisione e immunità al rumore nel trasferimento al circuito successivo, viene sottoposto ad amplificazione e filtrazione.
- Multiplexing: se nel sistema di acquisizione è presente più di un trasduttore, serve un elemento di raccordo tra i trasduttori e il circuito di campionamento: l'analog multiplexer, che collega un trasduttore alla volta al circuito, ripetendo l'operazione ciclicamente per ciascuno dei trasduttori. In tal modo è possibile trattare i segnali provenienti da più traduttori con un solo circuito, ma questa operazione dà problemi di temporizzazione e sequenzialità nel trasferimento dei segnali.
- Campionamento: eseguito dal circuito SAMPLE & HOLD, preleva a intervalli regolari il valore del segnale continuo in ingresso e lo mantiene stabile durante il suo trattamento. Per trattare un segnale proveniente dal trasduttore è necessario considerare solo alcuni dei valori da esso assunti a intervalli regolari e prefissati (gli intervalli sono detti periodo di campionamento), ottenendo così un segnale discreto. I valori registrati sono ancora quelli del segnale originario ma sono spogliati di tutti gli infiniti valori presenti tra un prelievo e il successivo. Dunque aumentando la frequenza di campionamento, aumenta la quantità di informazioni prelevate e quindi anche la qualità. La frequenza minima del campionamento è indicata dal Teorema di Nyquist ed è il doppio della massima frequenza. Quando il teorema di Nyquist non viene rispettato si può incappare in due problemi: sottocampionamento (risultato l'aliasing, esempio il pattern Moiré, ossia una distorsione dell'immagine o suono) e sovracampionamento (ridondanza di dati inutili e controproducente perché appesantisce il lavoro del sistema di elaborazione).
- Conversione/Quantizzazione: l'ADC usa il sistema di quantizzazione che permette di trasformare un segnale continuo campionato (discretizzato) in un segnale quantizzato (digitale). Il convertitore AD fissa un intervallo di riferimento, all'interno del quale deve trovarsi la grandezza da misurare e lo suddivide in sottointervalli (gradini) più o meno ampi ai quali approssima (quantizza) la grandezza elettrica ricevuta in ingresso. Per definire la conversione A/D bisogna stabilire un intervallo continuo di valori della grandezza da misurare e il numero totale di livelli discreti che devono essere rappresentati in uscita, che insieme definiscono il passo di discretizzazione (ampiezza del gradino). Se al sensore arriva una tensione compresa tra 5 e 4,9 V: il convertitore AD farà corrispondere ad essa la rappresentazione di una temperatura di 20°C, ad un valore compreso tra 4,8 e 4,9V una temperatura di 19°C. Il passo di discretizzazione è l'ampiezza del gradino.
1.3.2 Sistema di elaborazione
Normalmente è costituito da più calcolatori con programmi specifici che permettono di elaborare i dati, in alcuni casi sono previste interfacce uomo-macchina come per l'ecografia.
1.3.3 Sistema di distribuzione
Il sistema di distribuzione è costituito dall'insieme di apparecchiature che sono capaci di fornire una rappresentazione dell'informazione affinché sia resa disponibile all'utente finale. Le apparecchiature di solito coinvolte sono stampanti o monitor. I principali passaggi sono:
- Conversione: trasforma il dato digitale in forma analogica, per ottenere una grandezza elettrica.
- Demultiplexing: separa opportunamente il segnale.
- Ricostruzione: ricostruisce il segnale su ciascun singolo elemento della batteria di circuiti.
- Visualizzazione: dispositivo con i circuiti.
1.4 Grandezze analogiche e digitali
Le grandezze analogiche sono continue, ovvero variano nel tempo o nello spazio con continuità e possono assumere infiniti valori in qualunque intervallo considerato. Le grandezze digitali sono discrete perché all'interno di un intervallo possono assumere solo un numero finito di valori. Un'immagine analogica sarà una distribuzione continua di variazioni di intensità luminose tra il nero e il bianco, su due direttrici orizzontale e verticale, mentre un'immagine digitale assumerà un numero limitato di valori.
1.4.1 Strumenti di misura analogici e digitali
In uno strumento analogico il segnale in uscita, o la sua visualizzazione, è una funzione continua della grandezza fisica oggetto della sua misura (misurando). Ci sono due tipi di lettura:
- Lettura diretta: valore misurato è direttamente leggibile su una scala graduata nell'adeguata unità di misura.
- Lettura indiretta: il valore viene reso da un traduttore come segnale che rappresenta una grandezza diversa da quella del misurando e al quale è proporzionale.
In uno strumento digitale la grandezza fisica misurata è rappresentata come numero, solitamente tramite un display. Risoluzione: capacità di rilevare la variazione della grandezza fisica in esame; indica la minima variazione della grandezza rilevabile dallo strumento, quindi quantifica l'errore commesso nell'approssimare il valore reale della grandezza misurata.
1.8 L'immagine come distribuzione di energia
Le immagini sono distribuzioni bidimensionali di valori di luminosità e di colore, che cambiano il loro valore al variare delle due coordinate del piano.
2. Luce, immagini e visione
Le immagini digitali hanno dimensioni finite, no profondità inerente, un numero finito di pixel e rappresentazione numerica dell'energia luminosa. Le immagini si possono classificare in reali, scientifiche e sintetiche.
2.2 La luce e grandezze fotometriche
La luce, dal punto di vista psicofisiologico, è la sensazione/energia prodotta dalla radiazione compresa tra i limiti dei raggi infrarossi (sopra 760 nm) e ultravioletti (sotto 380 nm) che stimola i recettori dell'occhio umano inviando al cervello segnali che sono interpretati. Dal punto di vista fisico, è una forma di energia che può essere interpretata secondo:
- La teoria corpuscolare: basata sul teorema di Maxwell, che afferma che un campo elettrico e uno magnetico, ortogonali fra loro, si auto-sostengono e si propagano lungo una direzione perpendicolare ai campi stessi nello spazio con una data velocità.
La luce bianca è la somma del contributo di tutte le frequenze mentre il nero è l'assenza delle frequenze. L'intensità luminosa è l'energia che una sorgente emette in un secondo (watt) e, dal punto di vista psicofisiologico, dipende dall'energia emessa ma anche dalla forma e dimensione della sorgente e anche dal colore della luce. Siamo portati a vedere più luminosa la radiazione di un fiammifero piuttosto che quella di un blocco di ferro portato all'incandescenza. Per tener conto del modo di vedere dell'occhio (la sua risposta ovvero grandezze definite per sorgenti luminose e ai fenomeni luminosi) si introducono le grandezze fotometriche, superfici illuminate:
- Candela: intensità luminosa in una data direzione di una sorgente che emette una radiazione monocromatica con una certa frequenza.
- Intensità luminosa (watt): l'energia che una sorgente emette in un secondo, definita come numero intero o frazionato della candela.
- Flusso luminoso (lm/s): di una sorgente puntiforme è il rapporto tra l'intensità luminosa e il suo angolo solido. L'unità di misura è il lumen (lm). Potenza visibile che una sorgente emette in tutte le direzioni.
- Quantità di luce (Q): prodotto del flusso luminoso per il tempo durante il quale viene emesso. Flusso di energia luminosa emesso in una direzione.
- Illuminamento (lux): l'effetto dell'incidenza di un fascio di luce sopra una superficie. È definito dal rapporto tra il flusso luminoso (incidente uniformemente su una superficie) e l'area della superficie stessa.
- Luminanza (nit): rapporto tra l'intensità luminosa emessa da una sorgente estesa sulla superficie dell'elemento considerato.
- Riflettanza: quanto una superficie riflette. Se è bianca la riflettanza è > 80%, se nera è < 5%.
2.3 Principio d'indeterminazione
Il passaggio dal mondo fisico reale all'informazione ottica, catturata con un opportuno dispositivo, costituisce una trasformazione (mapping) di tipo distruttivo che produce una indeterminazione (ex: illusioni ottiche) — data un'immagine retinica e la sua rappresentazione, non è possibile ricostruire cosa l'abbia determinata — la quale può essere di due tipi:
- Fotometrico: confusione fra componenti dell'illuminazione e delle proprietà delle superfici che, nel mondo fisico, sono ben separate.
- Geometrico: eliminazione dell'informazione sulla profondità per effetto della riduzione del numero di dimensioni nello spazio entro cui si collocano rispettivamente gli oggetti e le corrispondenti immagini.
2.4 Raggruppamento percettivo
Il nostro sistema visivo tende a considerare maggiormente l'interezza piuttosto che le singole parti. Secondo gli studi della Gestalt le leggi che definiscono il raggruppamento percettivo sono 6:
- Vicinanza: elementi più vicini tra loro.
- Somiglianza: elementi simili per forma e colore.
- Continuità di direzione: elementi messi di fila sono percepiti come unità.
- Chiusura: tendiamo a chiudere le figure aperte.
- Buona forma: quando figure differenti si uniscono mantengono la loro forma originale.
- Esperienza passata: unifichiamo le forme anche in base alla nostra esperienza, non creiamo forme nuove.
2.5 Il ricevitore occhio
La parte bianca che ricopre l'occhio si chiama sclera e si fonde nella zona anteriore con la cornea. Tra la cornea e l'iride c'è un'area detta camera anteriore in cui è presente un liquido detto umore acqueo; la zona nera dentro l'iride è la pupilla. La quantità di luce è regolata dalla dimensione della pupilla, che è variata dai muscoli circolari lungo la circonferenza dell'iride, che contraggono la pupilla, ed i muscoli radiali, simili a raggio verso la pupilla, che la dilatano. Gli occhi sono mossi da tre paia di muscoli antagonisti extraoculari.
Il cristallino, dietro l'iride, ha una struttura a strati sovrapposti e cresce continuamente; esso può deformarsi sotto l'azione dei muscoli intraoculari. L'area racchiusa tra il cristallino e la retina è detta camera posteriore ed è riempita da una sostanza relativamente densa cioè l'umore vitreo.
La luce passa in questo modo: cornea → camera anteriore → pupilla/iride → cristallino → retina. I raggi luminosi provenienti da:
- Sorgenti lontane giungono paralleli alla cornea, subiscono la rifrazione e convergono in un punto detto fuoco, la cui distanza dalla cornea è la distanza focale e dipende sia dalla densità della cornea sia dalla sua convessità.
- Sorgenti vicine divergono quando arrivano alla cornea; per far sì che i raggi convergano nel fuoco, il cristallino aggiunge al potere della cornea un potere di rifrazione supplementare, ispessendosi quando gli oggetti osservati sono vicini e diventando più sottile quando sono lontani. Il processo di cambiamento di forma del cristallino per mantenere costante la distanza focale è detta accomodazione.
L'affaticamento degli occhi è determinato dall'uso dei muscoli intraoculari che deformano il cristallino per permettere l'accomodazione. L'immagine è detta a fuoco quando il punto focale cade sulla retina. La ricezione dell'informazione visiva è un processo che coinvolge la retina; essa è composta da tre strati di cellule:
- Le cellule gangliari.
- Le cellule intermedie.
- Le cellule recettive assorbono la luce e la trasformano in informazione neurale e sono composte da bastoncelli e coni (permettono di vedere i colori), che formano delle sinapsi con le cellule dello strato intermedio e raccolgono informazioni. Gli assoni delle cellule gangliari formano le fibre del nervo ottico che esce dall'occhio in un punto indicato come macchia cieca (non percepisce alcun segnale).
I bastoncelli hanno soglia bassa, cioè reagiscono in condizioni di luce debole (notte, visione scotopica), i coni hanno soglia elevata, cioè sono meno sensibili (visione fotopica). La distribuzione di coni e bastoncelli all'interno della retina non è uniforme; prevalgono i coni che si trovano al centro della retina nell'area di maggior acuità visiva, la fovea, dove mettiamo a fuoco e quindi ci sono i ricettori dei colori; nella zona periferica rispetto alla fovea invece ci sono i bastoncelli che sono i recettori di luce. I bastoncelli, in tutto l'occhio, sono in numero maggiore dei coni ma vale il contrario per la zona della fovea.
Un pezzo di elemento visivo viene confrontato con un altro e viene mediato. Un recettore confronta gli elementi registrati con il recettore vicino: un cono confronta ciò che registra con il bastoncello che ha vicino. Succede anche nelle macchine fotografiche. I bastoncelli codificano la luce ma non colori (acromatici); i coni codificano tre colori RGB. Cellule bipolari possono cambiare segno + -; cellule gangliari trasmettono elementi ricevuti al nervo ottico (molti elementi vengono persi prima di essere trasmessi al cervello).
Sensibilità fotorecettori [Coni – Bastoncelli]
Devo adattare i livelli di robopsina quando passo da un luogo buio a uno luminoso o viceversa. Ogni fotorecettore ha una sua sensibilità, ma i rossi sono sensibili maggiormente rispetto agli altri. La zona giallo verde vanta della somma dei picchi di rosso e verde. Per ogni pixel della mia immagine associo un numero per la luminosità.
Teoria del tristimolo
Qualsiasi colore reale come somma pesata delle risposte dei tre pigmenti allo stimolo di colore. Coni per il rosso altezza d'onda alta, coni verdi a metà, coni blu bassa onda avviene una mediazione tra questi tre tipi di coni.
2.6 Le proprietà della visione
Devo individuare delle zone di pixel quindi unirli assieme. In Gimp sono filtri per rilevamento contorni. La sensibilità al contrasto dell'occhio, cioè la sua risposta alle variazioni dell'intensità luminosa, è non lineare — possiamo riconoscere un'area dallo sfondo grazie all'intensità luminosa. Noi percepiamo il contrasto tra due intensità luminose grazie alla frazione di Weber che è costante (2%), per cui la risposta dell'occhio non è lineare rispetto alle variazioni di luminosità.
Uno degli elementi del rapporto (∆I) è la soglia di contrasto, ovvero la minima differenza di intensità luminosa percepibile dall'occhio umano. Quanto stabilito dalla funzione di Weber è osservabile negli effetti percettivi come il contrasto simultaneo, per cui la sensibilità al contrasto dipende anche dal contesto in cui sono inseriti gli oggetti, simultaneo a colori. La soglia di contrasto è correlata inoltre con la frequenza spaziale (cicli/grado), che rappresenta la rapidità di variazione di luminosità tra pixel contigui. Per definire la frequenza spaziale ci riferiamo a immagini costituite da reticoli in cui l'intensità luminosa varia in modo sinusoidale lungo la direzione orizzontale con diversa frequenza. (imm.: frequenza spaziale di sinistra minore di quella di destra).
La frequenza spaziale è correlata al livello di dettaglio, maggiore è la frequenza maggiore è il livello di dettaglio (determina brusche variazioni di luminosità).
es. Una pagina con caratteri stampa a una elevata frequenza spaziale poiché se ci fosse una piccola sfocatura, eliminerebbe le frequenze alte e il testo sarebbe difficile da comprendere.
-
Riassunto esame Tecnologie Digitali del Suono e dell’Immagine, prof. Lombardo, libro consigliato Audio e multimedia…
-
Riassunto esame sociologia dei mutamenti, prof. Enzo Lombardo, libro consigliato Il tramonto dell'Europa, Lombardo
-
Riassunto esame estetica della comunicazione, docente Lombardo, libro consigliato Tra poesia e physiologia di Lomba…
-
Riassunto esame Nuovi media, sicurezza e rischi digitali, Prof. Sideri Daniela, libro consigliato Mondo digitale, V…