首页 单曲 套曲 视频 工具 音乐人

音频基础知识——音频失真是怎么回事?

分类: 乐理基础

日期:2023-03-01

音频基础知识——音频失真是怎么回事?
我们花了很多时间思考和谈论音频中的失真,甚至有时会听到它,但它到底是什么,为什么它很重要?

音频中的失真通常有两种类型的失真:

频率失真——由带宽不足和带宽限制之间的非平坦频率响应引起

非线性失真——由硬件中的非线性引起。

这篇文章是关于非线性失真的,因为如今频率失真在现代设备中很少成为问题。非线性失真常常被错误地称为 "非线性失真"。然而,失真不是非线性的,是硬件设备的非线性

正弦波——音频信号的组成部分
这里从只有一个频率正弦波信号(图 1)讲起。在音频频率上,该正弦波被听到为单音。

图 1 正弦波信号


正弦波是由多种形式的自然振动或振荡产生的。考虑时钟的摆轮,它有一个水平轴。如果我们在车轮的边缘做一个标记,从侧面看,标记的高度在轴的上方(和下方)划出了一个时间上的正正波。

非线性造成音频失真
现在,无论输入波形是什么,它都可以被认为是许多正弦波的总和,输出波形也可以。尽管如此,由于波形不同,输出波形包括输入波形中没有的正弦波成分,造成了信号是失真。

对于输入信号的每个正弦波分量(称为基波),非线性产生的信号是该分量频率的倍数,称为谐波。双频称为二次谐波或二阶谐波。三倍频称为三次谐波。这些新信号是谐波失真分量。

图 2 显示了来自一个非常糟糕的电路的输入和输出信号,该电路产生 20%幅度的二次谐波和 10% 的三次谐波。将二次和三次谐波信号添加到输出会使信号失真,使其不再是纯正弦波。选择这些高失真数字是为了清楚地显示效果。


图 2. 非线性失真示例。纯正弦输入信号为棕色,失真输出信号为黑色。


二次谐波总是导致正半周与负半周的形状不同。在本例中,三次谐波影响信号的峰值。那是因为我选择了三次谐波相对于基波相位角的相位角来做到这一点。不同的相位角会导致不同的形状变化。

乐器中的谐波示例
几乎所有乐器(和人声)产生的声音都包含许多谐波。例如,正弦波由陶笛产生,这是一种类似于口琴的小型手持管乐器,顾名思义,它会在每个音符中产生大量谐波。

添加更多谐波会改变音符的音调或音色。除非添加量很大,否则任何人通常都很难察觉差异,除非他们能够区分 Stradivarius 的声音和 Guarneri 的声音。

图 3 显示了小提琴的“谐波频谱”。频谱通常是功率或电压与频率的关系图。


图 3. 小提琴的频谱显示为谐波倍数


制作一把好小提琴的艺术是选择木材、它们的处理方法和它们的形状,以产生最理想的谐波振幅组合。“最想要的”可能是“柔和的”或“令人兴奋的”,这取决于音乐类型或个人喜好。

但是,如果添加的额外谐波很重要,则会听到新的效果。非线性产生的谐波恰好是原始频率的两倍、三倍等。大多数乐器产生的谐波实际上应该被称为“部分”,因为它们不是当前最低频率(基频)的精确倍数。

对于某些乐器来说,这些分音与基音一样响亮,甚至更响亮。例如,长笛产生几乎相等的基波和二次谐波。

部分谐波和最接近的谐波创建了一个新的频率分量,该频率分量出现在部分频率和谐波频率之间的差异处。这个属性总是比两者都低得多的频率,一种使声音变得粗糙而不是平滑的咆哮。

还产生了一个新频率的分量,该频率是部分频率和谐波频率的总和。这个新频率不会对组合声音产生太大影响,但它的频率要高得多,并且可能与该较高频率范围内的其他信号分量发生冲突。

值得庆幸的是,除非非线性非常严重,否则新频率分量对差频和和频的影响是最小的。

不幸的是,这还不是全部。非线性还导致这些和频和差频的信号出现在输入信号中两个分量的每种组合中。这些新频率被称为“互调失真分量”。

互调失真
这些分量要严重得多,许多新频率的影响通常是可以听到的,即使非线性相当轻微。那么为什么我们主要讨论和测量谐波而不是互调分量呢?

有两个原因。首先,过去测量谐波比较容易,但对于现代数字仪器来说,这不是一个问题。其次,我们用最简单的输入信号--正弦波来测量谐波。

为了测量互调,我们必须至少输入两个信号,它们都可以是正弦波,但是我们应该使用什么频率,它们的幅度(电压)应该相等还是不同?

直到 1970 年代,人们对此有很多困惑,人们做出了不同的选择,因此他们的结果没有可比性。世界音频界的大多数成员随后达成了一项国际协议,代表国际电工委员会的一个技术委员会。该委员会规定了两种互调失真:差频失真(以前称为 CCIR 失真)和调制失真(SMPTE失真)。

正如所暗示的那样,差频失真(参见图 4)测量由两个相同的高频信号(例如 19kHz 和 20 kHz)产生的 1kHz 差频信号的相对幅度。这是一个更重要的评估,因为它是高频线性度的度量,此时负反馈的失真减少效果往往较小。在图 4 中,19 kHz 和 20kHz 的输入信号会产生两个失真信号:

1. 1 kHz 的差分信号 (20 - 19 = 1)
2. 39 kHz (20 + 19 = 39) 的和信号



图 4 差频失真


调制失真使用低频信号和更低电压的更高频率信号,通常是其他信号的四分之一。例如,信号可能是 80 Hz 和 5kHz。如图 5 所示,非线性再次产生了两个新的输出失真信号分量:

1. 4920 Hz 处的差分信号 (5000 - 80 = 4920)
2. 5080 Hz 的和信号 (5000 + 80 = 5080)



图 5.调制失真


也可以测量由输入信号分量的谐波产生的其他互调分量。例如,如果我们有两个输入频率 f1 和 f2,则在 2f1 ± f2 和 2f2 ± f1 处存在互调分量,以及我们已经看到的 f1 –f2 和 f1 + f2。但是这些并没有告诉我们更多关于被测量设备的性能。

我们应该得出的结论是,我们应该消除所有非线性源,以免损坏再现的声音。然而,我们必须在放大器中使用的器件,即晶体管(,本质上是非线性的,因此我们必须使用精心挑选的设计技术来尽可能减少非线性。

这常常引发一个问题,“多少才够?” 发烧友经常就人类听觉的灵敏度和我们实际听到的失真程度争论这个问题。但是,对于这篇文章来说,这个话题太大了。文章来源网络,侵删。

资讯发布者

一切为了电音
关注TA

相关百科

电平

所谓电平,是指两功率或电压之比的对数,有时也可用来表示两电流之比的对数。电平的单位分贝用dB表示。常用的电平有功率电平和电压电平两类,它们各自又可分为绝对电平和相对电平两种。

FLAC

FLAC中文可解释为无损音频压缩编码。FLAC是一套著名的自由音频压缩编码,其特点是无损压缩。不同于其他有损压缩编码如MP3及AAC,它不会破坏任何原有的音频信息,所以可以还原音乐光盘音质 。2012年以来它已被很多软件及硬件音频产品(如CD等)所支持。

WAV

WAV是最常见的声音文件格式之一,是微软公司专门为Windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真。但WAV文件有一个致命的缺点,就是它所占用的磁盘空间太大(每分钟的音乐大约需要12兆磁盘空间)。它符合资源互换文件格式(RIFF)规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。Wave格式支持MSADPCM、CCITT A律、CCITT μ律和其他压缩算法,支持多种音频位数、采样频率和声道,是PC机上最为流行的声音文件格式;但其文件尺寸较大,多用于存储简短的声音片段。

音频格式

音频格式即音乐格式。音频格式是指要在计算机内播放或是处理音频文件,是对声音文件进行数、模转换的过程。音频格式最大带宽是20000Hz,速率介于40~50KHz之间,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。 音频格式日新月异,到2008年音频格式包括:CD格式、WAVE(*.WAV)、AIFF、AU、MP3、MIDI、WMA、RealAudio、VQF、OggVorbis、AAC、APE。

音频

音频是个专业术语,音频一词已用作一般性描述音频范围内和声音有关的设备及其作用。人类能够听到的所有声音都称之为音频,它可能包括噪音等。声音被录制下来以后,无论是说话声、歌声、乐器都可以通过数字音乐软件处理,或是把它制作成CD,这时候所有的声音没有改变,因为CD本来就是音频文件的一种类型。而音频只是储存在计算机里的声音。