音频的采样率，音频的采样和重采样技巧！

日期：2022-11-26

声音采样音频音乐采样器

音频的采样率，音频的采样和重采样技巧！

声音采样是指录音设备在单位时间内对模拟信号采样的多少，声音采样频率越高，机械波的波形就越真实越自然。在当今的主流采集卡上，声音采样频率一般共分为11025Hz、22050Hz、24000Hz、44100Hz、48000Hz五个等级，11025Hz能达到AM调幅广播的声音品质，而22050Hz和24000HZ能达到FM调频广播的声音品质，44100Hz则是理论上的CD音质界限，48000Hz则更加精确一些。

音乐采样器是一种重要的电子乐器，很多刚接触电脑音乐的朋友对它不是很了解。我们先了解什么是“采样”，“采样”即“采集样品”，还有更通俗的说法就是“取样”，从某些物料中取出部分样品。比如我们可以从水中取出部分样本用来检测，同样也可以从声音中取出部分特征的声音片段，这个过程就叫采样。借助于现代录音技术，我们可以将真实的乐器（钢琴、吉他、贝司、鼓等）演奏的声音录制，也可以将自然环境的声音录制，然后在录制的声音取出特征的样本保存到数字内存中。通过音乐采样器触发这些采样的声音，可以随时重组还原真实的演奏效果。一个音乐采样器通常还包含滤波、效果、调制、低频振荡等类似于合成器的功能，可以改变采样的波形特征从而演奏出不一样的声音效果。

一、重采样和降噪的关系

之所以降噪过程中需要借助重采样的力量来实现，原因是一般情况下我们从电脑端采集到的音频数据是44.1Khz或者48Khz的16位或者8位双通道的PCM数据，而对于目前一些通用开源的降噪库例如speex或者webrtc来说一般都是有对送入降噪音频频率特定的要求的，其中speex开源库的降噪模块可以对44.1Khz和48Khz等音频PCM数据进行降噪；webrtc则对输入的音频数据要求在32Khz及以下：8Khz、16Khz和32Khz。

（1）、speex虽然可以直接对44.1khz和48khz的PCM数据进行降噪，同时能够比较好的对麦克风的底噪进行了滤除，但是同时也在正常的声音部分引入了不可容忍的电流声，这种电流声噪点有点类似直接使用设定最低阈值和最高阈值一刀切得到的效果。

（2）、webrtc虽然仅仅支持32Khz以下频率的音频数据进行降噪，即需要对正常采集到的PCM数据（44.1Khz或者48Khz）进行重采样为32Khz、16Khz或者8Khz的数据来进行降噪，然后再通过重采样为44.1Khz或者48Khz的音频数据才能正常播放。虽然对比speex的降噪步骤webrtc的降噪比较繁琐，但是webrtc的降噪效果对比speex的降噪效果是更好的，不仅底噪被滤除了，而且没有引入电流噪声。

二、重采样知识记录

理解重采样，需要真正的实现如下几个功能:
（1）、实现重采样通道数、音频格式相同，但采样频率不同的音频；
（2）、实现重采样音频格式相同、采样频率相同但通道数不同的音频；（目前一些usb转耳机就是单通道的）

1、重采样基础知识

（1）、采样频率

采样频率在流媒体中是指每秒钟对音频的采样点数，单位为Hz（赫兹）。例如采样频率为44100hz是指每秒钟采集44100个样本点，其中每个样本点根据实际情况具有不同的内存空间，在下面将会讲述到。

（2）、声道数

是指该段音频能够通过一个设备的多个发声位置进行发声，常见的声道数有:
单声道：mono
双声道：stereo，包含左右两声道

2、声道：在双声道基础上增加了一个低音声道

5.1声道:包含一个正面声道、左前方声道、右前方声道、左环绕声道、右环绕声道、一个低音声道，最早应用于早期的电影院
7.1声道:在5.1声道的基础上，把左右的环绕声道拆分为左右环绕声道以及左右后置声道，主要应用于BD以及现代的电影院

（3）、重采样样本数和空间大小

每重采样样本数:这个就是说在重采样时需要多少个样本数据，这个样本数会根据不同的声道数和音频格式会有所区别，例如对于1024个16位单声道PCM样本而言，它的大小为1024*2*1=2048字节；而对于1024个16位单声道PCM样本而言，它的样本大小为1024*2*2=4096字节，这两个数字也是在使用ffmpeg进行重采样时常常看到的，因为一般情况下ffmpeg进行重采样时一般采用输入1024个样本来进行重采样，而根据音频格式不同，所输入的音频具体空间大小不同。理解好这一点也是对于重采样知识理解的核心。