Estratto del documento

Classificazione dei segnali

Per quanto riguarda i segnali acustici, esistono due tipi di segnali:

  • Segnali analogici (segnali continui): segnali 'reali' definiti per ogni istante di tempo.
  • Segnali digitali o numerici (discreti): segnali formati da numeri di un alfabeto finito, usati particolarmente per la memorizzazione di segnali analogici su macchine o calcolatori.

Trasformazione segnali analogici a segnali digitali

Poiché ogni computer ha una memoria limitata e non infinita e i segnali analogici possiamo considerarli come infiniti, abbiamo bisogno di un metodo per trasformare i segnali da analogici a digitali. Questo metodo è chiamato campionamento. Infatti, molti dei segnali che troviamo nella realtà dove viviamo sono analogici e quindi continui sia per quanto riguarda:

  • Ampiezza: s(t)
  • Tempo: t

Per questo motivo dovremo quindi discretizzare e quindi trasformare da analogico a digitale sia l'ampiezza che il tempo.

  • La discretizzazione rispetto al tempo è chiamata campionamento.
  • La discretizzazione rispetto all'ampiezza è chiamata quantizzazione.

L'intero procedimento da analogico a digitale è chiamato PCM (Pulse Code Modulation) o modulazione impulsiva codificata ed è chiamato così anche il segnale analogico da cui si parte.

Campionamento di segnali analogici

Il campionamento di segnali analogici consiste nel:

  • Prendere l'ampiezza dell'onda in determinati istanti di tempo costanti detti intervallo di tempo di campionamento o periodo di campionamento (T).
  • La frequenza di campionamento è indicata con f=1/T.
  • La prima figura a parte rappresenta il segnale analogico mentre la seconda immagine rappresenta l'intervallo di tempo di campionamento preso sull'onda considerata.

Teorema del campionamento di Nyquist-Shannon

Il teorema del campionamento detto di Nyquist-Shannon ha delle condizioni da adottare per essere usato:

  • Banda limitata: per applicare il campionamento a un segnale audio dobbiamo avere a disposizione una sorgente di rumore da campionare con una banda limitata. Questo è possibile tramite un filtro passa basso (Lowpass Antialiasing filter).
  • Frequenza di campionamento: deve essere più del doppio della frequenza più alta della curva e del suono considerati, infatti per avere un campionamento decente dobbiamo scegliere una frequenza di campionamento che sia più del doppio (almeno un 10% in più) della banda dell’onda (Fc>2*fmax). Se non rispetto questa condizione, inserisco nel campionamento una distorsione, che poi sarà molto difficile da eliminare.

Le frequenze di campionamento più utilizzate sono:

  • 32 Hz: frequenza di broadcast
  • 44,1 Hz: per uso non professionale
  • 48 Hz: per uso professionale
  • Multipli di 44,1 e 48 per campionamenti più precisi, introdotte dopo rispetto alle prime 3.

Aliasing

Quando non viene rispettata la condizione Fc>2*fmax avviene il fenomeno di aliasing. All’interno del segnale si creeranno delle distorsioni e non si potrà più determinare il segnale analogico iniziale, perdendo quindi delle informazioni importanti.

Frequenze di campionamento usate

In passato, le frequenze di campionamento più usate erano:

  • 32 Hz: per broadcasting
  • 44,1 Hz: per utilizzatori comuni
  • 48 Hz: per utilizzatori professionali

Successivamente, per la volontà di avere suoni sempre più uguali a quelli discreti corrispondenti, si aggiunsero altre frequenze di campionamento più alte che equivalgono ai multipli delle prime 3:

  • 88,2 Hz
  • 96 Hz
  • 176,4 Hz
  • 192 Hz

Interpolazione lineare frequenze di campionamento entrata-uscita

È importante tenere frequenze di campionamento uguali in entrata e in uscita. Questo perché, altrimenti, se ho frequenze di campionamento diverse in entrata e in uscita, si creano dei rumori indesiderati. Se ho frequenze diverse, devo usare il fenomeno dell’interpolazione per renderle uguali.

L’interpolazione agisce trasformando le frequenze di campionamento e rendendole uguali tra loro:

  • Interpolazione per uscita con frequenza di campionamento multipla dell’entrata: basta prendere il doppio dei valori o la metà dei valori.
  • Interpolazione per uscita con frequenza di campionamento non multipla rispetto all’entrata: in questo caso il procedimento sarà ancora più complesso dell’interpolazione di multipli. È il caso quindi di evitare l’interpolazione.

Campionamento completo

Fasi nella memorizzazione

  • Inizialmente ci sono dei suoni percepibili come variazione di pressione.
  • Un microfono preamplifica queste variazioni di pressione e le fa passare in un filtro passa basso che limita la banda.
  • Qui subentra un convertitore analogico-digitale (ADC) che esegue il campionamento (lungo certi istanti di tempo prende delle ampiezze, come spiegato prima).
  • Questo nuovo segnale viene memorizzato.

Fasi nella riproduzione

  • Qui un convertitore digitale-analogico (DAC) fa il procedimento del convertitore analogico-digitale al contrario.
  • Troviamo poi un filtro passa basso.
  • Infine, il suono viene amplificato.

Aliasing spiegato bene

Per ricostruire la massima frequenza della banda del segnale sorgente, abbiamo bisogno di almeno due valori per ciclo (picco minimo e massimo). Le frequenze maggiori del doppio della frequenza di campionamento vc (quelle che superano la frequenza che limita nella banda il segnale), non sono rappresentabili perché al di fuori della banda frequenziale che essa rappresenta. Ma queste frequenze vengono ribaltate nel codominio come basse frequenze v1 secondo la relazione: v1 = vc – va (dove va è la frequenza non rappresentabile). Considerando le ±kvc ±repliche corrispondenti ai multipli k-esimi di vc si può scrivere: v1 = va. Per questo motivo se non conosciamo la banda frequenziale del segnale, una volta scelta la frequenza di campionamento si dovranno eliminare tutte le componenti superiori o uguali alla sua metà grazie a un filtro passa basso.

Quantizzazione di segnali analogici (discretizzazione delle ampiezze)

Dopo aver campionato il segnale nel tempo, c’è bisogno anche di campionarlo per quanto riguarda l’ampiezza. La trasformazione da ampiezza analogica ad ampiezza digitale è chiamata quantizzazione del segnale.

Procedimento di quantizzazione

Per effettuare la quantizzazione, i passi da eseguire sono i seguenti:

  • Prima di iniziare qualsiasi procedura, dobbiamo dividere la banda d'ampiezza del segnale in arrivo appena campionato in intervalli aventi larghezza di banda fissa.
  • Per ogni valore di intervallo associamo un'unica parola identificativa in binario positivo.
  • Per ogni valore di ampiezza nell’intervallo T del tempo dato dal campionamento, arrotondiamo il valore d’ampiezza campionato al più vicino intervallo.
  • Ripetiamo l’operazione per tutti gli intervalli T del segnale campionato ed avremo un segnale quantizzato.
  • La quantizzazione produrrà SEMPRE una certa degradazione del segnale di partenza, un errore e quindi, parlando di segnali acustici, un rumore chiamato rumore di quantizzazione.

Parole identificative binarie, intervalli di tempo, M e V

Sono sequenze di bit che possono assumere 2n configurazioni diverse. Più n scelto, più bit scelgo e più la precisione della quantizzazione sarà migliore (minore errore di quantizzazione).

  • T: è l'intervallo di tempo scelto che deriva dal campionamento del suono.
  • M: insieme di tutti i valori sull’asse delle ordinate, insieme di tutti i bit scelti. M=22 per esempio.
  • V: ogni valore separato da un intervallo sulle ordinate è chiamato V, quindi avremo V1, V2, ecc.

Quantizzazione passo a passo

  • Riceve in ingresso un numero reale x[n].
  • Restituisce il valore più vicino tra gli M possibili livelli di quantizzazione (v1…...vm).

Quantizzazione lineare uniforme

La quantizzazione spiegata sopra è chiamata quantizzazione lineare uniforme ed è caratterizzata da:

  • Passo di quantizzazione costante = 2/n
  • Dati M livelli di quantizzazione, se V è compreso in (-V;+V) allora Xq[n]=X[n]+e[n]
  • Segnale quantizzato = segnale originale + errore introdotto dalla quantizzazione.

Errore di quantizzazione

Come detto sopra, la differenza tra il segnale originario ed il segnale quantizzato è chiamato errore di quantizzazione ed è appunto dovuto dall’arrotondamento del segnale continuo originario. Nella prima parte della figura si nota il segnale PCM ed il segnale quantizzato, nella seconda invece notiamo l’errore di quantizzazione, che nella maggior parte dei casi prende la forma classica a dente di sega.

Nella quantizzazione esistono principalmente due errori:

  • Errore granulare
  • Errore di sovraccarico

Errore di granularità ed errore di sovraccarico

Errore di granularità

  • Ogni Tc (frequenza di campionamento), il segnale Xq(kTc) varia di una quantità pari a e anche dove il segnale sembra avere andamento quasi costante (linea dritta iniziale di PCM) presenta delle variazioni di ampiezza.
  • Tutto questo crea il rumore granulare.
  • L’errore assume valore nell’intervallo [0, /2].
  • Errore dovuto alla quantizzazione, si può ridurre ma non si può togliere appunto perché stiamo eseguendo una quantizzazione ed una digitalizzazione di un suono analogico.
  • Per ridurre l’errore di granularità è necessario ridurre il ad un valore più piccolo.

Errore di sovraccarico

  • Se il segnale PCM presenta delle variazioni molto rapide di ampiezza (di ampiezza maggiore di ), allora il segnale digitale non riuscirà a seguire l’andamento della curva PCM originale.
  • Questo introduce il cosiddetto errore di sovraccarico.
  • L’errore assume valore nell’intervallo [0;+∞].
  • Utile trovare un compromesso tra errore di granularità ed errore di sovraccarico scegliendo una media tra grande e piccolo.

Confronto segnale originario ed errore prodotto da campionamento + quantizzazione

Sia f(t) il segnale analogico e Ek(t) l’errore proveniente dallo stesso segnale campionato e quantizzato, bisogna rispettare il seguente standard per avere un segnale conforme all’originale:

\(SNR = \frac{f(t)}{\sqrt{E_k(t)}}\)

Dove Ek(t) non considera solo l’errore istantaneo ma è una media degli errori di tutto il segnale ed è chiamato errore quadratico medio.

Delta costante e delta adattivo

Per la scelta del dobbiamo tenere conto di due classificazioni di segnali:

  • Segnali stazionari:
    • Segnali invarianti statisticamente rispetto al tempo.
    • ricavabili fissi nel tempo e quindi non adattivi.
  • Segnali non stazionari:
    • Si sceglie un adattivo, cioè un che si adatta alla banda considerata per ridurre l’errore di quantizzazione.
    • Questo dipende dalla larghezza di banda dell’ampiezza della funzione considerata.

Quantizzazioni non lineari

Oltre alla quantizzazione lineare uniforme e a quella adattiva esistono altre due forme di quantizzazione:

  • Quantizzazione floating point
  • Quantizzazione differenziale (DPCM)

Quantizzazione floating point

Per segnali che sono non stazionari si usa la quantizzazione floating point, composta da una codifica tramite mantissa ed esponente. La mantissa e l’esponente è un metodo per rappresentare i numeri binari nei calcolatori che segue il seguente schema:

  • È uguale alla notazione decimale nella fisica.
  • In questo modo l’errore di quantizzazione aumenta o diminuisce con la gamma dinamica del segnale originario.

La quantizzazione floating point viene usata molto poco e ne esistono 3 tipi differenti:

  • Istantanea: per ogni numero campione del segnale viene calcolata la coppia mantissa-esponente. È ottimale per ridurre il rumore di quantizzazione, ma crea problemi durante la compressione.
  • Sillabica: il valore dell’esponente varia adattivamente in funzione della gamma dinamica del segnale sorgente. Quando l’ampiezza aumenta o diminuisce per un certo intervallo di tempo, viene variato l’esponente.
  • A blocchi: il valore dell’esponente viene codificato ogni N valori del segnale sorgente.

Quantizzazione differenziale (DPCM)

La quantizzazione differenziale consiste nel codificare la differenza tra un valore campionato e il valore campionato successivo invece dei valori stessi. Questa forma di quantizzazione avrà bisogno quindi di una memoria a differenza dell’istantanea che non ne ha bisogno.

Un segnale sorgente f(t) campionato agli istanti di tempo kπ/ω0 viene perciò codificato come un segnale: f'(kπ/ω0) = f(kπ/ω0) - f((k-1)π/ω0)

La quantizzazione differenziale non introduce perdita di informazione frequenziale e consente una compressione della codifica tanto più vantaggiosa quanto più il segnale f(t) è caratterizzato da una banda in bassa frequenza, poiché questo corrisponde ad una derivata del segnale stesso caratterizzata da valori modesti e quindi a un intervallo più stretto di valori da codificare e da trasmettere.

Compressione segnali audio

La funzione principale della compressione dati è quella di ridurre la quantità di dati nell’unità di tempo mantenendo integra l’informazione originale. I metodi di compressione sono nati per permettere una riduzione della velocità di trasmissione dei dati su un canale tra sorgente e destinazione. Esistono principalmente 2 tipi di compressione dati:

  • Lossless (compressione senza perdita di informazione):
    • Si basa sull’eliminazione di ridondanza all’interno della traccia.
    • Costituita da un encoder ed un decoder che costituiscono il codec.
  • Lossy (compressione con perdita di informazioni)
    • Mantengono solo certi componenti dell’informazione originale.
    • Tengono conto di chi dovrà ascoltare la traccia, del ricevitore. Quindi tendono a selezionare i giusti segnali per soddisfare il ricevitore.
    • In una traccia esistono principalmente 3 tipi di segnali:
      • Essenziali: segnali più importanti, che non possono essere eliminati.
      • Ridondanti: segnali che si ripetono, che possono essere eliminati per comprimere.
      • Irrilevanti: segnali inudibili all’orecchio umano che possono essere eliminati.
    • Anche esso costituito da encoder e decoder che costituiscono il codec della compressione.
    • Queste tecniche sono ancora molto immature e rappresentano il “futuro” della compressione dati.

Compressione audio - parametri

Qualunque compressione audio deve fare un compromesso tra:

  • Bitrate (bit per secondo): minore è il bitrate, maggiore sarà la compressione.
  • Processing delay: tempo impiegato da encoder e decoder per comprimere e decomprimere il file.
  • Signal quality: indica la qualità del suono dopo che la traccia è stata compressa. Questa si ricava con test d’ascolto soggettivi oppure (con meno precisione) con test oggettivi e anatomici.

Bitrate: I file audio sono connessi per natura al tempo. Infatti, ad ogni secondo è associato un certo contenuto informativo e quindi una certa sottosequenza di cifre binarie. Il numero di cifre binarie che compongono queste sottosequenze è chiamato bitrate.

BITRATE = frequenza di campionamento * BIT parole di quantizzazione usate * numero canali (mono, stereo)

Siccome la compressione diminuisce la lunghezza del file, le sottosequenze diminuiranno di lunghezza e quindi il bitrate medio diminuirà.

Anteprima
Vedrai una selezione di 8 pagine su 34
Informatica Applicata Alla Musica, Appunti Completi, Goffredo Haus Pag. 1 Informatica Applicata Alla Musica, Appunti Completi, Goffredo Haus Pag. 2
Anteprima di 8 pagg. su 34.
Scarica il documento per vederlo tutto.
Informatica Applicata Alla Musica, Appunti Completi, Goffredo Haus Pag. 6
Anteprima di 8 pagg. su 34.
Scarica il documento per vederlo tutto.
Informatica Applicata Alla Musica, Appunti Completi, Goffredo Haus Pag. 11
Anteprima di 8 pagg. su 34.
Scarica il documento per vederlo tutto.
Informatica Applicata Alla Musica, Appunti Completi, Goffredo Haus Pag. 16
Anteprima di 8 pagg. su 34.
Scarica il documento per vederlo tutto.
Informatica Applicata Alla Musica, Appunti Completi, Goffredo Haus Pag. 21
Anteprima di 8 pagg. su 34.
Scarica il documento per vederlo tutto.
Informatica Applicata Alla Musica, Appunti Completi, Goffredo Haus Pag. 26
Anteprima di 8 pagg. su 34.
Scarica il documento per vederlo tutto.
Informatica Applicata Alla Musica, Appunti Completi, Goffredo Haus Pag. 31
1 su 34
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher The_Bous di informazioni apprese con la frequenza delle lezioni di Informatica Applicata Alla Musica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano o del prof Haus Goffredo.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community