从wav到Ogg Opus 以及使用java解码OPUS

摘要:
PCM通过采样、量化和编码三个步骤将连续变化的模拟信号转换为数字代码。Wav是微软专门为Windows开发的标准数字音频文件。播放机可以通过此数据播放PCM数据。OPUS编解码器https:无法从文件本身获取音频元数据(采样率,

PCM

自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。

采样率

采样频率,也称为采样速度或者采样率,定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数是采样周期或者叫作采样时间,它是采样之间的时间间隔。通俗的讲采样频率是指计算机每秒钟采集多少个信号样本。

工业界常用的16K,就是1s有16000个采样点。

WAV

PCM是原始语音,依据采样率的定义,我们知道要播放PCM,需要知道采样率,因此需要一个文件格式可以封装PCM,wav就是微软公司专门为Windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息。

WAV格式

wav文件前44个字节,定义了采样率,channel等参数,播放器通过这个数据就可以播放PCM数据了。

MP3

wav 很好的解决了PCM播放的问题,但是PCM实在是太大了,因此出现了mp3等音频格式,通过一定的压缩算法压缩语音,以便于互联网传输分享。

Ogg 与 Opus

随着音视频应用的越来越广泛,工业界有了越来越多的编解码器,比如Speek,Opus

Opus编解码器是专门设计用于互联网的交互式语音和音频传输。它是由IETF的编解码器工作组设计的,合并了Skype的SILK和Xiph. Org的CELT技术。

OPUS

OPUS编解码

https://github.com/lostromb/concentus 是一个纯java库,可以编解码OPUS。

OPUS一般是分帧编码,比如一个320采样点(640字节)的数据,编码后为70多个字节,和PCM一样,编码后的OPUS不能直接播放:

  • 无法从文件本身获取音频的元数据(采样率,声道数,码率等)
  • 缺少帧分隔标识,无法从连续的文件流中分隔帧(尤其是vbr情况)

伴随着HTML5的发展,出现了OGG媒体文件格式,Ogg是一个自由且开放标准的多媒体文件格式,由Xiph.Org基金会所维护。Ogg格式并不受到软件专利的限制,并设计用于有效率地流媒体和处理高质量的数字多媒体。“Ogg”意指一种文件格式,可以纳入各式各样自由和开放源代码的编解码器,包含音效、视频、文字(像字幕)与元数据的处理。

OGG音频

压缩类型格式说明
有损Speek以低比特率处理语音数据(〜2.1-32 kbit / s /通道)
Vorbis处理中高级可变比特率(每通道≈16-500kbit / s)的一般音频数据
Opus:以低和高可变比特率处理语音,音乐和通用音频(每通道≈6-510kbit / s)
无损FLAC处理文件和高保真音频数据
未压缩OggPCM处理未压缩的PCM音频,与WAV类似

参考: https://juejin.cn/post/6844904016254599175

借博主的图:

OGG封装

java 解码OPUS文件

通过ffmpeg可以轻松的将wav转换为opus文件,本质是一个ogg封装的opus,我们可以通过vorbis-java 来读取opus文件。

通过OpusInfoTool,可以打印OPUS文件信息:

Processing file "C:UsersjqpengDownloadsopuswav16k.opus"

Opus Headers:
  Version: 1
  Vendor: Lavf58.27.103
  Channels: 1
  Rate: 16000Hz
  Pre-Skip: 104
  Playback Gain: 0dB

User Comments:
  encoder=Lavc58.53.100 libopus

Logical stream 81c1bbc0 (-2118009920) completed

Opus Audio:
  Total Data Packets: 579
  Total Data Length: 41406
  Audio Length Seconds: 11.564333333333334
  Audio Length: 00:00:11.56
  Packet duration:     20.0ms (max),     20.0ms (avg),     20.0ms (min)
  Page duration:     1000.0ms (max),    965.0ms (avg),    580.0ms (min)
  Total data length: 41406 (overhead: 2.34%)
  Playback length: 00:00:11.56
  Average bitrate: 28.70 kb/s, w/o overhead: 27.97 kb/s

再借助concentus ,我们来解码OPUS文件为PCM文件。


public void testDecode() throws IOException, OpusException {
        FileInputStream fs = new FileInputStream("\wav16k.opus");
        OggFile ogg = new OggFile(fs);
        OpusFile of = new OpusFile(ogg);
        OpusAudioData ad = null;

        System.out.println(of.getInfo().getSampleRate());
        System.out.println(of.getInfo().getNumChannels());

        OpusDecoder decoder = new OpusDecoder(of.getInfo().getSampleRate(),
                                              of.getInfo().getNumChannels());
        System.out.println(of.getTags());
        FileOutputStream fileOut = new FileOutputStream("wav16k.pcm");
        // 
        byte[] data_packet = new byte[of.getInfo().getSampleRate()];
        int samples = 0;
        while ((ad = of.getNextAudioPacket()) != null) {
            // NOTE: samplesDecoded 是decode出来的short个数,byte需要*2
            int samplesDecoded =
                    decoder.decode(ad.getData(), 0, ad.getData().length
                            , data_packet, 0, of.getInfo().getSampleRate() / 2,
                                   false);

            fileOut.write(data_packet, 0, samplesDecoded * 2);
            samples += samplesDecoded;
        }

        System.out.println("samples: " + samples);
        System.out.println("durationSeconds: " + (samples / 16000f));
        fileOut.close();
    }

感谢您的认真阅读。

如果你觉得有帮助,欢迎点赞支持!

不定期分享软件开发经验,欢迎关注作者, 一起交流软件开发:

免责声明:文章转载自《从wav到Ogg Opus 以及使用java解码OPUS》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇微信公众号+h5项目开发Swoole跟thinkphp5结合开发WebSocket在线聊天通讯系统教程下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

mysql安装,以及从csv插入数据

1.mysql安装     用管理员身份打开cmd命令行工具,cd到解压文件的bin目录:    ・MySql的Windows服务安装: mysqld install 回车  ・生成无密码的root用户: mysqld --initialize-insecure 回车  ・启动mysql : net start mysql  (或从windows服务手动启...

Samba安装配置

Samba简介 Samba官网:http://www.samba.orgSMB(Server Messages Block,信息服务块)是一种在局域网上共享文件和打印机的一种通信协议,它为局域网内的不同计算机之间提供文件及打印机等资源的共享服务。SMB协议是客户机/服务器型协议,客户机通过该协议可以访问服务器上的共享文件系统、打印机及其他资源。通过设置“N...

VINS-Mono运行

修改 修改地图保存的路径因为我们现在跑的是euroc数据集,所以我们要修改的地方有两处。 euroc_config.yaml中的pose_graph_save_path项pose_graph_save_path: "/home/kk/自己的路径/" euroc_config.yaml中的output_path项output_path: "/home/kk/...

jmeter 中的 Beanshell 使用

一、操作变量:通过使内置对象vars可以对变量进行存取操作     a) vars.get("name"):从jmeter中获得变量值     b) vars.put("key","value"):数据存到jmeter变量中 二、操作属性:通过使用Bean shell内置对象props 可以对属性进行存取操作     a) props.get("STAR...

JAVA中使用动态链接库须知

好不容易 使用cygwin+windows打了个包,放到JAVA中使用。但是还是会报各种错。   JAVA中使用.so文件 static{ System.loadLibrary("test"); //加载libtest.so } 以上是网上的经典用法,很简单的一句。但是用的时候还是出错了。。。 主要还是.so路径找不到。找了大半天,终于,问题解决了...

Excel 数据对比,窗口并列排序操作(xlw文件格式的由来)

步骤1:打开Excel文件,输入一些数据 步骤2:点击视图,创建新窗口(这里就会创建一个和步骤1一抹一样的的表格,我们可以在任务栏上看到) 第三步:点击视图里面的全部重排按钮,在重拍窗口里面选择需要拍了的方式(自己选择,这里我选择垂直并排) 到这来,两个一模一样的垂直的窗口就显示出来了,如下所示 补充说明:如果我们想下次打开这个文件还是这种垂直并排...