论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2011-12-20 09:44 |只看该作者 |倒序浏览

作者：Joseph Pan （转载请注明出处http://www.cnblogs.com/weizhoupan/archive/2011/03/20/1989718.html ）

　　喜欢买碟或者卡拉ok的朋友一定不会对声道这个术语陌生。通常我们在音像店买回来的VCD或者DVD都是双声道的形式，唱片商在录制唱片时往往提供了两个或多个声道，以保存不同的音频内容，以形成立体声效。左声道保存的大多为一些背景声效，如卡拉OK的消音伴唱。而右声道保存的往往是较为主要的声音，比如主唱的歌声。利用多声道技术，听众可以清晰地分辨出各种乐器来自的方向，从而使音乐更富想象力，更加接近于临场感受。

　　有时候我们只需要音频里的单声道内容，比如喜欢用电脑录制卡拉ok的朋友就经常为了找歌曲的伴唱而流连于各大伴奏网站。现在的网络翻唱非常流行，很多网络歌手就是先搜索喜欢的歌曲的伴奏，然后利用Adobe Audition（前身就是大名鼎鼎的CoolEdit）录制自己的演唱，然后加一些简单的降噪和压限处理，最后mix到伴奏的音轨里面。尽管利用Audition也可以完成单声道的提取工作，但是操作起来比较复杂。

　　其实对WAV的单声道提取并不困难。关键在于对WAV文件格式的理解。

一、WAV的文件头

　　WAV为微软公司(Microsoft)开发的一种声音文件格式，它符合RIFF(Resource Interchange File Format)文件规范。所有的WAV都有一个文件头，这个文件头包含了音频流的编码参数。

偏移地址	字节数	类型	内容
00H~03H	4	字符	资源交换文件标志（RIFF）
04H~07H	4	长整数	从下个地址开始到文件尾的总字节数
08H~0BH	4	字符	WAV文件标志（WAVE）
0CH~0FH	4	字符	波形格式标志（FMT）
10H~13H	4	整数	过滤字节（一般为00000010H）
14H~15H	2	整数	格式种类（值为1，表示数据PCMμ律编码的数据）
16H~17H	2	整数	通道数，单声道为1，双声道为2
18H~1BH	4	长整数	采样频率
1CH~1FH	4	长整数	波形数据传输速率（每秒平均字节数）
20H~21H	2	整数	数据的调整数（按字节计算）
22H~23H	2	整数	样本数据位数

　　表1　　WAV的文件头

　　由表1我们可以得到以下几个重要的信息：

16H~17H处记录通道数，当值为1时，表示文件为单声道；当值为2时，表示文件为双声道。
18H~1BH处记录采样频率。它的取值与声卡的支持情况有关。常见的有8000、11025、22050、44100、48000、96000等。其中，44100是大多数歌曲文件采用的标准采样频率。
22H~23H处记录样本数据位数。即每一个采样的长度。常见的有8位和16位。这里还包含了另外一个信息：若样本的数据位数为n，对于双声道文件，则低n/2位用于存放左声道；高n/2位用于存放右声道。

　　根据这三点信息，我们可以自己编程实现单声道的提取。下面我们就来一步步动手实现。由于程序涉及的只是简单的二进制文件读写操作，因此这里只举C#作简单示例，其他语言的处理与之大同小异。

二、文件读取类的编写

　　为了方便以后对WAV文件的研究，我们可以先单独写一个WAV文件读取类，专门获取文件头的每一块信息：

WaveAccess

三、单声道提取

　　前面提到，若样本的数据位数为n，则对单声道的提取，其实就是提取出n/2的数据。对于任意一位数据，其在新的数据队列中的索引k’与其在源数据队列中的索引k满足如下的映射关系：

k = 2*k’ – k’mod(n/2) + n/2

　　但这里有个问题，加入只是将高或者低n/2的数据提取出来合为一个新的文件，则样本的数据位数和文件长度都需要修改为原先的一半，如果没有进行修改，播放速度将变为原来的两倍。

　　另外一种解决思路是将我们需要的那n/2的数据提取出来，然后覆盖另外n/2的数据。这样，头文件就不需要进行修改，因为没有任何属性发生了改变，只是文件的内容发生了变化。

　　根据上面的思想，对整个WAV文件作一次遍历，每次读入n位数据，如果是要提取左声道，则取出低n/2位数，覆盖高n/2位数；如果是要提取右声道，则取出高n/2位数，覆盖低n/2位数。据此编写singleChannelExtract函数如下：

singleChannelExtract

四、实验结果

　　根据上面的分析，完成单声道提取器如图1所示。

　　　　　　　　　图1　单声道提取器

　　运行该程序后，点击“open...”按钮，打开文件打开对话框，选中要进行单声道提取的文件。完成后，Format Info栏将显示该wav文件的信息。之后，单击“Extract!”按钮，弹出一个文件保存对话框，选择要保存的路径点确定，开始提取单声道，完成后将提示“Done!”。

　　图2和图3分别给出了对一段音频进行右声道提取前和提取后的结果。

　　　　　　　　　　　　　　　　　　　　　　　　图2　提取右声道前

　　　　　　　　　　　　　　　　　　　　　　　　图3　提取右声道后

　　注意图3中原来的左声道内容已经被右声道的内容覆盖，因此此时虽然还是双声道，但两个声道的内容是一样的，因此在使用上与单声道并没有区别。但如果只想保留一个声道，则可以根据前面的阐述，将每个采样值n/2位内容提取出来并合并成一个文件，再修改头文件相关数据，从而达到需要的结果。

『附相关程序下载』

文库|博客

返回列表

Chinaunix › 论坛 › 操作系统 › 移动操作系统 › C#实现WAV音频单声道提取

C#实现WAV音频单声道提取 [复制链接]

浏览过的版块