Capire le basi dei file audio digitali
Se hai circa 40 anni o più, probabilmente sei cresciuto con un giradischi o un lettore di cassette in casa per ascoltare la musica acquistata in negozio. Tra il 1982 e il 1983, il compact disc è entrato nel mercato e ha cambiato per sempre il modo in cui la musica veniva archiviata e trasportata. In questo articolo, esamineremo come funziona l'audio digitale e sfatiamo alcuni miti sulla conversione tra il dominio analogico e quello digitale.
Cos'è l'audio digitale?
In parole povere, un file audio digitale è una rappresentazione di un segnale analogico che utilizza una serie di parole digitali. Nel dominio digitale, ovvero un computer, le informazioni possono essere archiviate come 1 o 0.
I computer possono combinare stringhe di 1 e 0 per rappresentare i caratteri in un documento di testo, i colori in una fotografia, i comandi in un programma o i livelli di tensione in un file audio.
Per decenni, lo standard per la memorizzazione dell'audio nel dominio digitale è stato lo standard CD-DA (Red Book Compact Disc Digital Audio) con una frequenza di campionamento di 44,1 kHz con una profondità di 16 bit.
La frequenza di campionamento descrive la frequenza con cui un livello di tensione viene misurato e memorizzato. Per catturare l'intero spettro sonoro udibile, il teorema di campionamento di Nyquist-Shannon afferma che la frequenza di campionamento deve essere almeno il doppio della frequenza più alta che si desidera registrare affinché venga ricreata con precisione.
La seconda considerazione nella conversione di un segnale analogico nel dominio digitale è la necessità di memorizzare una quantità adeguata di risoluzione per rappresentare correttamente il segnale originale. Lo standard Red Book utilizza una lunghezza di parola digitale di 16 bit. Ciò significa che esiste una stringa di 16 1 e 0 che può essere utilizzata per rappresentare 65.536 livelli di tensione. Se stai convertendo l'uscita di un microfono in digitale e la tensione massima è 1 volt, una risoluzione di 16 bit significa che la risoluzione è 0,000015258789 volt. Sono molti i dettagli.
Infine, lo standard Red Book afferma che due canali audio verranno campionati contemporaneamente per creare una registrazione stereo.
Un po' di matematica veloce sull'audio di qualità CD
Per gli interessati, è facile calcolare il bitrate effettivo di un file audio di qualità CD. Poiché campioniamo il segnale audio a 44.100 volte al secondo e ogni campione ha un livello di tensione rappresentato da una parola a 16 bit, e lo facciamo per due canali, 44.100 volte 16 volte due è 1.411.200 o 1.411 kilobit al secondo.
Per calcolare quanto spazio ci vorrebbe per memorizzare una canzone come "Bohemian Rhapsody" dei Queen, puoi semplicemente moltiplicare 1.411.200 per il numero di secondi nella canzone (in questo caso, 355 secondi) per un totale di 500.976.000 bit, o circa 60 megabyte di dati.
Come vengono creati i file audio digitali?
Un dispositivo chiamato convertitore analogico-digitale (ADC) è responsabile della presa del segnale analogico e della sua conversione in un valore rappresentato digitalmente. Questi dispositivi sono comuni e si trovano collegati al microfono dello smartphone o al microfono Bluetooth dell'auto. Sono incredibilmente compatti e, rispetto a quando furono introdotti per la prima volta, poco costosi.
L'ADC funziona in diversi modi, ma descriveremo le basi. Immagina, se vuoi, una serie di interruttori del comparatore, ciascuno impilato uno sopra l'altro e riferito a una tensione sempre crescente. Manterremo l'esempio semplice e diciamo che abbiamo otto interruttori, ognuno dei quali viene attivato a
Incrementi di 0,125 volt. Se inseriamo un segnale analogico nel nostro albero degli interruttori del comparatore con un livello di 0,3 volt, i due interruttori in basso si accenderanno e otterremo la parola digitale 0010 (che è 2). Se aumentiamo la tensione a 0,8 volt, attiviamo tutti gli interruttori tranne gli ultimi due e otteniamo la parola 0110 (che è 6).
Conteggio in digitale
Contare in digitale è facile, una volta capito come funziona. Ogni spazio in una parola digitale rappresenta un valore pari a 2 rispetto alla potenza della posizione. Quindi, il primo spazio è 2 alla potenza di 0, che è 1. Il secondo spazio è 2 alla potenza di 1, che è 2, lo spazio successivo è 2 alla potenza di 2 che è 4, e così via.
2^0 =1 2^1 =2 2^2 =4 2^3 =8
Per codificare un valore utilizzando questo formato, assegniamo semplicemente un 1 o uno 0 a ciascun segnaposto in modo tale che i valori di somma rappresentati dai segnaposto con un 1 rappresentino il valore originale.
0000 =0 0001 =1 0010 =2 0011 =3 0100 =4
0101 =5 0110 =6 0111 =7 1000 =8
Nel nostro esempio sopra, stiamo usando una risoluzione molto bassa di 3 bit, il che significa che possiamo mostrare solo otto livelli diversi. Questa risoluzione limitata, ovviamente, introduce qualche errore, noto come errore di quantizzazione. La matematica può diventare molto complicata molto rapidamente. Basti dire che nel nostro esempio, il nostro digitalizzatore teorico non conosce la differenza tra una tensione di 0,63 e 0,73 volt. Questo è un grande errore e non funzionerebbe nel tentativo di campionare l'audio. Fortunatamente, la nostra risoluzione a 16 bit ci offre 65.536 livelli tra cui scegliere.
Che ne dici di quei pazzi grafici dei gradini delle scale?
Hai senza dubbio visto immagini di marketing che mostrano un confronto tra la risoluzione audio di qualità CD e l'audio ad alta risoluzione a 96 kHz, 24 bit.
Sebbene il concetto di avere una frequenza di campionamento più elevata e una maggiore risoluzione sia accurato, ciò non significa che il segnale audio di qualità CD ne risenta in alcun modo.
Per dimostrarlo, abbiamo creato due toni di prova da 20 kHz in Adobe Audition. La prima traccia ha una frequenza di campionamento di 96 kHz e una risoluzione di 24 bit.
Come puoi vedere, la forma d'onda appare liscia e dettagliata e mostra circa cinque campioni per ciclo.
La seconda traccia è la stessa onda sinusoidale da 20 kHz memorizzata con una frequenza di campionamento di 44,1 kHz e una risoluzione di 16 bit.
Come puoi vedere, non c'è alcuna differenza significativa nella forma delle due forme d'onda. Ancora più importante, entrambi sembrano onde sinusoidali e nessuno dei due ha alcun calpestio.
Capire l'audio digitale
La memorizzazione del segnale audio nel dominio digitale offre vantaggi di packaging e affidabilità distinti rispetto ai supporti di memorizzazione analogici come dischi in vinile e nastri magnetici. Naturalmente, i file digitali non si degradano nel tempo. I file digitali sono anche impermeabili ai problemi di velocità di riproduzione. Se il tuo giradischi o registratore a cassette sta suonando troppo lentamente, la musica non suonerà correttamente.
In un prossimo articolo, esamineremo le opzioni di formato file disponibili per la memorizzazione di file audio digitali. Fino ad allora, assicurati di fare un salto dal tuo rivenditore specializzato nel miglioramento dei dispositivi mobili per vedere tutti gli ultimi aggiornamenti dell'unità sorgente compatibili con i media digitali disponibili per la tua auto, camion o SUV.