Elenet.net
+10 voti
Spiega il funzionamento del formato MP3.
quesito posto 4 Novembre 2015 in Classe terza da Samuele Capizzi Corsista (103 punti)
  

15 Risposte

–3 voti
il formato MP3 elimina ciò che l'orecchio umano non riesce a sentire.
Questi suoni vengono eliminati ma ne viene lasciata una piccola parte in modo da non rendere
"drastico" il taglio. 
Ma questa è soltanto una parte delle tecniche usate per la compressione, innanzitutto :
il segnale è analizzato e viene deciso in che modo distribuire i bit a disposizione, dopodichè diviso
in sotto-bande, elaborate separatamente da algoritmi.
Il bitrate a disposizione viene calcolato, ottenendo il numero di bit da allocare per ogni frame.
Il bitrate corrisponde al numero di bits per secondo usati per la 
memorizzazione del file. Più alto sarà il bitrate e più alta la risoluzione sonora. 
Le frequenze di ogni frame vengono confrontate con i modelli della psicoacustica contenuti nel 
compressore. A partire da questi modelli viene determinato quali frequenze elaborare accuratamente,
poichè percepibili dall' orecchio umano, e quali potranno essere eliminate o tagliate parzialmente,
poichè non saremo in grado di ascoltarle comunque.
Successivamente entrano in gioco gli effetti di mascheramento: se c'è un suono forte e un suono 
debole è possibile eliminare quest'ultimo, calcolando i millisecondi durante i quali non sarà audibile.
Allo stesso modo due suoni che si sovrappongono (perchè di forte intensità) o parti del suono statiche
(silenzio, fruscio del suono) vengono intelligentemente mascherate.
risposta inviata 4 Novembre 2015 da Gabriele.Salemi Corsista (67 punti)
–3 voti

Per capire il funzionamento di un MP3 è prima necessario avere bene in mente il processo che permette di trasformare un brano da un formato analogico ad un formato digitale
Nei file Wav ad esempio, ogni secondo di una canzone viene digitalizzato a 44.1 KiloHertz (ovvero 44100 volte al secondo). Ogni valore viene memorizzato in 2 bytes (16 bits) e su due canali per riprodurre l'effetto stereo. In pratica quindi un file Wav occupa su Hard disk uno spazio di 44100 x 16 bits x 2 = 1141200 bits al secondo (o se preferite 176400 bytes). Considerando che mediamente un brano musicale ha una durata di 3 minuti e mezzo, lo spazio necessario per memorizzarlo sul pc è di 176400 x 210 = 37044000 o se preferite 37 Megabytes
i files MP3 hanno avuto un così grande successo negli ultimi anni perche con questo formato infatti è possibile memorizzare un brano musicale con qualità identica a quella appena vista per un file Wav, usando solamente 3 o 4 Mega!

secondo i criteri di compressione per poter operare, il formato MP3 si basa su un concetto semplice: filtrare un brano musicale digitale ed eliminaretutte le informazioni non necessarie riducendo in questo modo lo spazio. L'orecchio umano è uno strumento pressocchè perfetto ma anche esso ha dei limiti. La banda passante dell'orecchio umano si estende dai 20 Hz ai 20.000 Hz, ma esso risulta molto più sensibile a quelle della gamma media, dai 700 ai 6.000 Hz, nelle quali si concentra la maggior parte delle informazioni.Lo studio della percezione uditiva è la psicoacustica che analizza principalmente 2 fattori che vengono poi utlizzati nella codifica MP3 e sono la percezione uditiva che dice nell'area dei suoni, solo alcuni possono essere uditi dall'orecchio umano; il mascheramento non è altro che la sovrapposizione di suoni deboli con suoni forti. 

risposta inviata 4 Novembre 2015 da Giuseppe terranova (20 punti)
–4 voti
Il nome MP3 proviene dallo standard MPEG, acronimo di Moving Picture Experts Group
Il formato MP3 si basa su un concetto semplice: filtrare un brano musicale digitale ed eliminare tutte le informazioni che non sono necessarie, riducendo in questo modo lo spazio.
Si utilizza per il funzionamento d'MP3 uno speciale programma ovvero l'Encoder MP3 che analizza il file digitale non compresso e lo trasforma in file MP3.
Il segnale audio viene filtrato e suddiviso in 576 aree mediante un processo che utilizza la Discrete Cosine Transformation che elimina tutte le frequenze non necessarie. A questo punto nel segnale risultante vengono individuate le soglie di mascheramento grazie al DFT (Discrete Fourier Transformation)
Dopo il mascheramento viene applicato il processo definito di Joint Stereo. Al di sotto di una certa frequenza, l'orecchio non riesce a percepire la posizione spaziale dei suoni per cui essi possono essere registrati su un singolo canale solamente ( quindi nel formato mono ) con un significativo risparmio di spazio. 
Una volta che il file è pronto, i dati vengono analizzati nuovamente e compressi utilizzando la codifica di Hufmann che permette una riduzione dei dati (senza perdita di informazione) di circa il 20%. A questo punto si formerà il file MP3 finale

 

risposta inviata 4 Novembre 2015 da JuvGiuse99 (25 punti)
–5 voti

Prima di tutto è necessario capire come è possibile inserire dei suoni in un computer. Un suono si propaga nell’aria sotto forma di onda. Questa onda viene trasformata da analogica a digitale attraverso un processo chiamato campionamento. Durante questa fase il suono viene scomposto in un certo numero di informazioni al secondo. Maggiori sono le informazioni, più fedele sarà la riproduzione digitale della forma d’onda.

Le variabili su cui si può intervenire in fase di campionamento sono tre:

  1. Tipo di canale (mono o stereo).
  2. Frequenza del campione. Indica il numero di campioni presi al secondo. Esempio: 22 Khz = 22.000 campioni al secondo. 11.025 Hz  è adatto per la registrazione della voce, 22.050 Hz è adatto per la registrazione di qualità nastro mentre 44.100 Hz si addice alla registrazione di qualità CD. Ridurre la frequenza di campionamento comporta una perdita di risoluzione.

Dimensioni del campione di un'onda (8 – 16 bit). Possiamo immaginare il segnale campionato come formato da tanti livelli che visivamente somigliano ad una scala, la quale segue un andamento il più fedele possibile alla forma d’onda originale. Gli 8 bit offrono una qualità acustica inferiore rispetto a quella di un nastro perché rendono in 256 valori  le informazioni sui livelli dei campioni. I dati d'onda a 16 bit producono invece la massima qualità sonora (16 bit =65.536 valori sui livelli) paragonabile a quella di un CD. Convertendo campioni da 16 bit a 8 bit si dimezza il file originario ma contemporaneamente si riduce pesantemente la qualità della musica.

Per mantenere una qualità audio pari a quella del cd,  dovremmo campionare la traccia per 44100 volte al secondo utilizzando una risoluzione di 16 bits. In stereo ciò vuol dire circa 1.7 Kb/s. Da cui appare evidente la necessità di utilizzare dei sistemi di compressione per poter salvare spazio su hard disk e rendere agevolmente trasportabili i file musicali o su dischetti o attraverso la rete. Ecco quindi la nascita dell'MP3 visto che i tradizionali sistemi di compressione (ZIP, LZW, ecc.) generalmente non permettono di comprimere i files audio in modo efficace.

 METODO DI COMPRESSIONE DELL' MPEG 1 LAYER III

 

Tenendo conto di ciò che abbiamo appena letto, passiamo alla compressione del suono vera e propria. Essa è composta di 4 fasi:

  1. Una volta quantizzata la forma d’onda, le informazioni digitali che la rappresentano vengono suddivise attraverso dei filtri in 32 sottobande che coprono l’intera gamma di frequenze udibili dell’orecchio umano.
  2. A questo punto intervengono gli algoritmi di compressione costruiti sul modello psicoacustico (Perceptual Coding), che identificano quelle frequenze che per ogni banda vengono completamente coperte (si tiene conto dell’effetto frequenze e di quello temporale) e si passa alla loro eliminazione.
  3. Laddove esistano frequenze parzialmente mascherate da altre, viene determinato il numero di bits necessari per rappresentarle tenendo conto del fatto che possono essere introdotti degli errori di quantizzazione (rumore audio) poiché essi saranno comunque mascherati e quindi non udibili (1 bit di quantizzazione introduce circa 6 dB di rumore).
  4. Le informazioni rimanenti verranno organizzate nel bitstream (flusso di dati finale = file MP3).
 
risposta inviata 4 Novembre 2015 da Mattia.L (32 punti)
–9 voti
il formato MP3 elimina ciò che l'orecchio umano non riesce a sentire.
Questi suoni vengono eliminati ma ne viene lasciata una piccola parte in modo da non rendere
"drastico" il taglio. 
Ma questa è soltanto una parte delle tecniche usate per la compressione, innanzitutto :
il segnale è analizzato e viene deciso in che modo distribuire i bit a disposizione, dopodichè diviso
in sotto-bande, elaborate separatamente da algoritmi.

Il bitrate a disposizione viene calcolato, ottenendo il numero di bit da allocare per ogni frame.

Il bitrate corrisponde al numero di bits per secondo usati per la 
memorizzazione del file. Più alto sarà il bitrate e più alta la risoluzione sonora. 
Le frequenze di ogni frame vengono confrontate con i modelli della psicoacustica contenuti nel 
compressore. A partire da questi modelli viene determinato quali frequenze elaborare accuratamente,
poichè percepibili dall' orecchio umano, e quali potranno essere eliminate o tagliate parzialmente,
poichè non saremo in grado di ascoltarle comunque.
Successivamente entrano in gioco gli effetti di mascheramento: se c'è un suono forte e un suono 
debole è possibile eliminare quest'ultimo, calcolando i millisecondi durante i quali non sarà audibile.
Allo stesso modo due suoni che si sovrappongono (perchè di forte intensità) o parti del suono statiche
(silenzio, fruscio del suono) vengono intelligentemente mascherate.

 

risposta inviata 4 Novembre 2015 da Alessandro.Orlando (22 punti)
modificato 4 Novembre 2015 da Alessandro.Orlando

Domande correlate

+10 voti
11 risposte
quesito posto 4 Novembre 2015 in Classe terza da Samuele Capizzi Corsista (103 punti) | 1,844 visite
+12 voti
9 risposte
quesito posto 4 Novembre 2015 in Classe terza da Samuele Capizzi Corsista (103 punti) | 3,893 visite
778 domande
1,565 risposte
639 commenti
1,445 utenti