分类: 乐理基础
日期:2023-03-07
专业音频基础概念——数字音频是如何工作的?
数字音频是什么?
数字音频是通过电脑以及数字设备等方式来表示模拟信号,并将其进行录制、回放的一种方法。与视频的帧类似,数字音频也是由一系列的采样样本组成的,声音的回放其实就是这些样本序列的再构成。数字音频有许多不同的格式,不同格式的数字音频则是有着不同的保真度和动态范围。
数字音频的原理是什么?
数字音频本质上来讲是有限的。声学声音和模拟信号都是由实际存在的、流动着的波形构成的,而数字信号则是实际存在着的物体的近似值。就像由无数的帧组成的视频一样,数字音频也是由一系列的采样样本构成的。
本文将会着重介绍脉冲编码调制(PCM),这是最常用的数字音频编码系统。而其他的系统,诸如DTS以及杜比数字等,则在电影和技术行业更为常用。
在PCM音频系统中,信号每秒被多次采样,每个采样都记录了某一特定时刻波的振幅。由于模拟波形并不能被完美无缺地重建,因此每个采样都是取的近似值。而当这些样本按顺序播放时,便可以准确地重新再现声音。
专业音频基础概念——数字音频是如何工作的?
与模拟音频中用频率和振幅两个要素来定义声音一样,数字音频也有两个主要的参数:采样率和位深度。采样率指的是声音每秒被采样的次数,而位深度指的则是每个采样所能够捕获的动态范围量。
CD的标准采样率为44.1kHz,看上去这个数字好像是一个很随机的选择,但是其实根据奎斯特—香农采样定理,采样率必须要高于捕获最高频率的两倍。而人耳的听觉上限是20kHz,因此需要大于40kHz的采样率才能捕获整个范围(而额外的4.1kHz则是为了避免一种名为“混叠”的失真现象)。理论上,44.1kHz的采样率已经足够我们准确地再现任何声音了,但是还是有更高的采样率的存在。
另一种最为常见的采样率便是48kHz,它是电影以及视频声音的主要标准。这是因为它的设计与现有的每秒24帧的电影帧速率标准相互集成。而与奎斯特频率类似,24帧是刚好可以使得一系列图像看起来像是流畅的运动图像的神奇数字。而音频采样率必须要是帧速率的倍数,才能保持同步,44.1kHz会随着时间的推移而导致明显的音画不同步现象,因此48kHz的采样率最为合适。
更高的采样率也被广泛使用,但这些采样率的必要性却饱受争议。支持者称超高频率的采样率巧妙增加了保真度,并为信号添加了“味道”;而反对者则认为,44.1已经足够,而且采样率越高,文件大小也会越大,并且在抖动到较低采样率时,会无可避免地产生“伪阴影”。
这些更高的采样率通常都是44.1或者48的倍数,例如88.2、96以及192kHz都是现代设备和软件中常用的采样率选项。
以上是:专业音频基础概念——数字音频是如何工作的?的相关内容。
电平
FLAC
WAV
音频格式
音频