Buono sconto 4% su Toner e Cartucce agli utenti AZpoint. SU Iomiricarico.it!!
I vantaggi del suono digitale (elevata fedeltà del segnale riprodotto, durata dei supporti e utilizzo di algoritmi di correzione degli errori per garantire l’integrità dei dati anche in presenza di supporti rovinati) hanno però un costo: l’elevato spazio occupato dai dati.
Un cd audio da 74 minuti corrisponde a 650 MB di dati, mentre un singolo brano, in media, si aggira attorno ai 40-50 MB di dimensione. Lo sviluppo di formati di compressione audio nacque dall’esigenze di veicolare su media meno capaci degli attuali dvd , dati audio e video assieme, gli standard di compressione MPEG-1 erano pensati per il formato VideoCD, concepito come sostituto delle videocassette VHS e mai veramente decollato in Occidente ( ha avuto un certo successo, invece nei mercati dell’Estremo Oriente); inoltre formati come il RealAudio/RealVideo erano pensati per lo streaming su una rete Internet che a parte pochi casi (per lo più grandi aziende del settore, università e strutture militari) non poteva certo contare, nel decennio scorso sugli accessi a banda larga disponibili oggi. Ricercò, quindi la quadratura del cerchio, combinando i vantaggi dell’audio digitale alla compattezza dei dati sottoposti a compressione.
Gli algoritmi di compressione sono essenzialmente di due tipi:
- Lossless (senza perdita), tali algoritmi consentono di mantenere l’integrità dei dati i quali, una volta compattati, risultano assolutamente identici a quelli originali, queste tecniche vengono dette anche di compressione non distruttiva.
L’esempio più famoso è sicuramente quello del formato ZIP, utilizzabile per comprimere qualsiasi tipo di dato, il rovescio della medaglia è che questi algoritmi difficilmente riescono a raggiungere ratei di compressioni elevati con elementi grafici o audio/video, in alcuni casi limite il file ottenuto può avere addirittura dimensioni uguali o superiori dell’originale.
- Lossy ( con perdita) conosciute anche come tecniche di compressione distruttiva, questi algoritmi raggiungono livelli eccellenti di compressione eliminando una parte considerata non necessaria dell’informazione del flusso originale.
Ovviamente la selezione dell’informazione da mantenere segue regole ben precise per non pregiudicare l’integrità apparente del output risultante, ne sono un esempio il formato JPEG per le immagini, MPEG 1/2/4 per lo streaming video e, appunto i vari formati di compressione audio come MP3, MP3 pro, Windows media audio, OGG vorbis, ecc.
La teoria alla base dei vari algoritmi di compressione dell’audio si basa sulla definizione di modelli psicoacustici che descrivono in maniera affidale l’andamento del rumore udibile durante l’ascolto di un brano musicale. In base agli studi effettuati si è notato che l’udito umano non è generalmente in grado di percepire tutti i suoni riprodotti da un impianto stereo.
La maggior parte delle persone, specie se non più giovani ha una soglia di percezione delle frequenze superiori che si attesta attorno ai 15 kHz, in particolar modo se le alte frequenze sono mischiate con toni bassi, cosa piuttosto comune nei brani musicali. Inoltre quando al timpano giunge un rumore improvviso e molto forte ( uno scoppio, un colpo di tamburo, ecc.) a causa delle vibrazioni indotte esso non è in grado di percepire i suoni più deboli immediatamente successivi (fenomeno del mascheramento acustico).
Infine si è riscontrato che il sistema uditivo umano è in genere incapace di percepire i suoni che hanno un’intensità minore del rumore di fondo circostante, tale fenomeno varia in funzione dei suoni emessi (pensiamo al rumore di una strada trafficata che ci impedisce di udire suoni emessi anche ad una distanza piuttosto breve). In conclusione si vide che la soglia di massima percezione del sistema uditivo si situava nell’intervallo fra i 2,5 e i 5 kHz mentre si attenuava di molto rispetto alle note più gravi o acute.
Utilizzando queste informazioni per lo sviluppo di algoritmi di compressione si sono potuti ottenere risultati veramente notevoli, files le cui dimensioni erano anche 1/20 di quelle originali con una qualità di ascolto pressoché identica.
La spiegazione di come operano concretamente questi algoritmi è piuttosto complessa ed esula dagli scopi di questo articolo, in genere viene operata una compressione nel dominio delle frequenze, eliminando sulla base dei modelli psicoacustici le informazioni ridondanti, lo spettro sonoro viene suddiviso in un certo numero di intervalli e la risoluzione di campionamento viene ridotta in base alle frequenze esaminate. Vengono applicati poi dei processi iterativi nidificati per il controllo del bit rate e del rumore. Basti sapere che l’output ottenuto, nel caso del formato MP3 è da 10 a 12 volte più piccolo della dimensione del file audio originale (estratto per esempio da un CD) a parità di qualità apparente e tale dimensione si dimezza ulteriormente per il formato MP3 Pro, sviluppato da Thompson e da Coding Technologies a partire dal 2001.
|