Muzislovník - datové záhlaví MP3 podruhé

Datové záhlaví mp3 podruhé

V srpnu jsem tu načal povídání o zvukově datovém formátu mp3. Půlstránečka stačila jen na první dva bajty záhlaví souboru (anglicky 2 bytes of the header the file). Nemyslím si, že byste měli bajt po bajtu skládat soubory mp3 (create the mp3 files byte per byte), ale neškodí někdy tušit, co který bajt znamená (which byte means what).

 

Vyšší čtyři bity (most significant bits, MSB) třetího bytu záhlaví, pokud při počítání vynecháme ID3 tag, udávají velikost datového toku (bit rate). Ne však přímo číselně, to bychom se se čtyřmi bity dostali jen k číslu 16, ale kódovaně prostřednictvím tabulky (coded into a table). Bitová hodnota 0000 udává volný čili variabilní datový tok (variable bit rate, VBR), hodnota 1111 je chybová (error value). Nejvyšší tabulková je 160 kilobitů za sekundu (kilobites per second, kbps) odpovídající kódu 1110 a nejnižší je 8 kb/s (kbps) pro kód 0001. VBR znamená, že každý rámec zvukových dat může být kódován jinou hustotou datového toku (each frame could have its own bitrate). Každý rámec má pak tuto hodnotu označenu samostatně.

 

Třetí a čtvrtý bit téhož bytu, pokud nejnižší označíme jako první, udává vzorkovací kmitočet (sample frequency), opět kódovaně a opět pro každou verzi mpeg jinak. Druhý bit v pořadí třetího bytu záhlaví udává, jsou-li rámce nadstavené (padded frames), nebo nikoliv, čili jestli přesně dodržují délku 418 bytů, nebo jestli se zkracují úměrně tomu, aby se vešly do datového toku za vteřinu. A nejnižší bit (the lowest significant bit, LSB) tohoto bytu je volný (private), využitelný i třeba pro nějaký váš účel, pokud si „empétrojky“ chcete nějak značkovat.

 

Nejvyšší dva bity (two MSBs) čtvrtého bytu záhlaví informují o prostorových dispozicích nahrávky. 00 značí plné stereo (full stereo), 01 je tzv. spojené stereo (joint stereo), kdy nízké frekvence jsou monofonní a stereo jsou jen ty vysoké, 10 jsou dva samostatné monofonní kanály (dual channels) a 11 je jeden monofonní kanál (mono channel).

 

Dva bity pod ním patří intenzitě spojení pásem pro spojené stereo (joint stereo). Je to zase kódová tabulka a významy hodnot se liší verze od verzi. Čtvrtý bit čtvrtého bytu záhlaví mp3 udává, jestli je nahrávka autorsky chráněna (copyrighted), tzv. copyright bit. Bit pod ním je údaj, jestli jde o kopii z originálního média (original bit), a nejnižší dva bity kódují údaj o emfázi signálu (emphasis) - podobně jako při rozhlasové frekvenční modulaci (FM), i zde lze kvůli kvantizačnímu šumu (to decrease the quantization noise level) před kódováním zesílit vysoké frekvence a po dekódování je zase zpátky zeslabit i s přeneseným šumem.

Psáno pro časopis Muzikus