基于AudioQueue实现音频的录制和播放

2023年6月6日下午3:33 • 人工智能 • 阅读 87

基于AudioQueue实现音频的录制和播放

基于AudioQueue实现音频的录制和播放
背景
总览
Audio Queue 架构
AudioQueueBuffer数据结构
创建 AudioQueueBuffer
释放 AudioQueueBuffer
Buffer Queue 和Enqueuing
Audio Queue Callback
音频录制
录制 AuidoQueueInputCallback 回调函数
创建一个录音 AudioQueue 的示例
音频播放
播放流程说明
通过AudioQueue来控制音频的播放
Audio Queue 的控制和状态
Audio Queue 运行状态的监控
demo地址
参考文献

背景

在iOS中常使用 AVPlayer、 AVAudioPlayer来播放在线音乐或者本地音乐，但是支持的格式都是封装好的，比如Mp3，Wav 格式的音频，但是如果需要播放流式的PCM音频数据该怎么办呢？答案是使用Audio Queue,它也是苹果官方封装的音频处理框架，可以用来播放或录制音频，并且支持平台级音频格式的编码和解码。

AudioQueue 有以下作用

连接设备的音频硬件
管理音频播放的内存数据
协作codec 进行音频的的编解码
实现音频的录制和播放

本篇文章主要以PCM 数据为例子进行讲解，讲解音频的录制和实现，文末会附带基于AudioQueue的录音器和播放起的源代码文件；

总览

本篇主要介绍来音频的录制和播放过程，共包含三个部分，Audio Queue 架构、音频的录制、和音频的播放，其中Audio Queue 架构是实现录制和播放的核心，理解了AudioQueue的实现原理，再来看录制和播放将会更加高效率；

Audio Queue 架构

Audio Queue 架包含三个部分: audio queue buffers, Buffer queue 和 audio queue callback; audio queue buffers 在结构上是一个数组结构，存储的AudioBuffer数据，下面会专门分析 AudioQueueBuffer 的数据结构； Buffer queue 可以理解为管理类，用来管理和组织这些 audio queue buffers 按照一定的顺序进行排列和运行，并且协调 audio queue callback 的调用；

AudioQueueBuffer数据结构

下面重点来说明AudioQueueBuffer的数据结构的数据结构如下，主要包含四个部分，其中最核心的是 aAduioData 部分。

typedef struct AudioQueueBuffer {
    const UInt32   mAudioDataBytesCapacity;
    void *const    mAudioData;
    UInt32         mAudioDataByteSize;
    void           *mUserData;
} AudioQueueBuffer;
typedef AudioQueueBuffer *AudioQueueBufferRef;

mAudioData, 它代表要录制和播放的音频数据；
mAudioDataByteSize: 用来表示 audioData的 length;
mAudioDataBytesCapacity: 表示一个mAudioData 需要分配的空间，单位是字节（ Byte）,它的值必须大于mAudioDataByteSize，否则音频的数据放不下会出现丢失;
mUserData: 一个万能指针，用来传递调用者的值，一般结合 bridge（void *）传递 self对象,实现C函数和OC 语言的交互

创建 `AudioQueueBuffer`

调用函数 AudioQueueAllocateBuffer 来分配,以下为示例代码；

int result =  AudioQueueAllocateBuffer(_audioQueue, kAudioBufferSize, &_audioQueueBuffers[i]);
   NSLog(@"Mic AudioQueueAllocateBuffer i = %d,result = %d", i, result);
   AudioQueueEnqueueBuffer(_audioQueue, _audioQueueBuffers[i], 0, NULL);

释放 `AudioQueueBuffer`

销毁则是通过 AudioQueueDispose来实现；

- (void)freeAudioBuffers {
    for(int i=0; i<kaudioqueuebuffercount; i++) { int result="AudioQueueFreeBuffer(_audioQueue," _audioqueuebuffers[i]); nslog(@"audioqueuefreebuffer i="%d,result" = %d", i, result); } audioqueuedispose(_audioqueue, yes); < code></kaudioqueuebuffercount;>

Buffer Queue 和Enqueuing

Buffer queue 的数据结构是一个队列，队列里可以存放许多 Auido Queue Buffer, 存放的Buffer数量不受限制，推荐使用三个，例如录制的过程，一个buffer 负责收集麦克风的数据，一个buffer负责将数据传递给磁盘，还有一个Buffe用来做备用，防止磁盘I/O 时间过长出现卡顿。Enqueuing的含义是加入队列，可以通过下图来了解Enqueue的过程。

音频录制Buffer Queuing的Enqueuing说明：

读取麦克风的数据到内存中，然后将数据写入到buffer中；
当第一个buffer数据写满后，会将数据存放到磁盘中，并且触发回调函数，这个时候回调函数需要处理数据，将新的音频数据覆写到该buffer中；
在回调函数中将采集的音频数据写入到磁盘中；
当三个buffer 都填满后之后会继续复用第一个buffer;
重复第2部进行填充数据和进行回调；
重复第3步将数据写入磁盘中

Audio Queue Callback

Audio Queue 的Callback 是开发的重要内容，它是通过 AudioQueueEnqueueBuffer函数来驱动数据,它是在音频录制或播放中进行重复调用的，调用的间隔取决于buffer的大小，设置的buffer数据容量越大，回调触发的间隔也越大，一般为0.5秒到几秒不等； AudioQueueCallback分为两个部分，录制 AuidoQueueInputCallback 和播放 AudioQueuOutputCallBack

音频录制

音频录制的本质是调用手机上的录音设置（如麦克风，耳机）来采集声音，采集声音的声音进行数字编码调制，形成音频数据，然后读取到内存中，最后写入到手机设备的硬盘中进行保存。iOS 的录音实现是通过Audio Queue 进行实现，下面主要分析AudioQueu的的结构和使用原理。

录制 AuidoQueueInputCallback 回调函数

AudioQueueInputCallback (
    void                               *inUserData,
    AudioQueueRef                      inAQ,
    AudioQueueBufferRef                inBuffer,
    const AudioTimeStamp               *inStartTime,
    UInt32                             inNumberPacketDescriptions,
    const AudioStreamPacketDescription *inPacketDescs
);

inUserData 用户数据指针，本身是一个无类型的指针，常被用来指向调用实例；
inAQ 调用该 CallBack的AudioQueue;
inBuffer 初始化AudioBuffer的时候我们封装好的音频数据；
inStartTime 每个buffer 对应的时间，这里我们用不上；
inNumberPacketDescriptions结合 inPacketDescs的参数使用，一般涉及到编码的地方会用到；
inPacketDescs 对应buffer的音频包描述，一般涉及到编码的地方会用到；

音频录制的调用实例

// &#x97F3;&#x9891;&#x5F55;&#x5236;&#x7684;&#x56DE;&#x8C03;&#x51FD;&#x6570;
void AudioAQInputCallback(void * __nullable               inUserData,
                          AudioQueueRef                   inAQ,
                          AudioQueueBufferRef             inBuffer,
                          const AudioTimeStamp *          inStartTime,
                          UInt32                          inNumberPacket,
                          const AudioStreamPacketDescription * __nullable inPacketDescs) {
    DBAudioMicrophone * SELF = (__bridge DBAudioMicrophone *)inUserData;
    NSLog(@"Mic Audio Callback");
    if (inNumberPacket > 0)
    {
        [SELF processAudioBuffer:inBuffer withQueue:inAQ];
    }
}

// &#x8BFB;&#x53D6;&#x5F55;&#x5236;&#x5230;&#x7684;&#x97F3;&#x9891;&#x6570;&#x636E;

- (void)processAudioBuffer:(AudioQueueBufferRef)inBuffer withQueue:(AudioQueueRef)inAudioQueue {
    NSData *data = [NSData dataWithBytes:inBuffer->mAudioData length:inBuffer->mAudioDataByteSize];
    [self.sendData appendData:data];
    if (_isOn) {
        AudioQueueEnqueueBuffer(inAudioQueue, inBuffer, 0, NULL);
    }
}

创建一个录音 AudioQueue 的示例

- (void)audioNewInput {
    /// &#x521B;&#x5EFA;&#x4E00;&#x4E2A;&#x65B0;&#x7684;&#x4ECE;audioqueue&#x5230;&#x786C;&#x4EF6;&#x5C42;&#x7684;&#x901A;&#x9053;
    AudioQueueNewInput(&_audioDescription, AudioAQInputCallback, (__bridge void * _Nullable)(self), NULL, kCFRunLoopCommonModes, 0, &_audioQueue);}

说明：
1._audioDescription 是 AudioStreamBasicDescription 类型的数据结构，主要用来描述数据的特点，包含采样率，位深，声道数量，音频格式，音频包，音频帧等数据；
2.AudioAQInputCallback 是音频的回调函数；
3.kCFRunLoopCommonModes 当前AudioQueue所运行的Runloop;
4._audioQueue 是AudioQueuueRef 类型的指针，此处用它的指针来进行实例化；

下面看一下AudioStreamBasicDescription的初始化赋值；

+ (AudioStreamBasicDescription)defaultAudioDescriptionWithSampleRate:(Float64)sampleRate numOfChannel:(NSInteger)numOfChannel {
    AudioStreamBasicDescription asbd;
    memset(&asbd, 0, sizeof(asbd));
    asbd.mSampleRate = sampleRate;
    asbd.mFormatID = kAudioFormatLinearPCM;
    asbd.mFormatFlags = kLinearPCMFormatFlagIsSignedInteger | kAudioFormatFlagIsPacked;
    asbd.mChannelsPerFrame = (UInt32)numOfChannel;
    asbd.mFramesPerPacket = 1;//&#x6BCF;&#x4E00;&#x4E2A;packet&#x4E00;&#x4FA6;&#x6570;&#x636E;
    asbd.mBitsPerChannel = 16;//&#x6BCF;&#x4E2A;&#x91C7;&#x6837;&#x70B9;16bit&#x91CF;&#x5316;
    asbd.mBytesPerFrame = (asbd.mBitsPerChannel/8) * asbd.mChannelsPerFrame;
    asbd.mBytesPerPacket = asbd.mBytesPerFrame * asbd.mFramesPerPacket;
    return asbd;
}

说明：传入的参数是采样率和声道的数据，这里位深一般用的是16位；

音频播放

播放流程说明

音频的播放也包含三个部分，1.磁盘的的音频输入流；2.音频队列； 3. 扬声器；

说明：
首先读取磁盘中的音频数据，第二，填充音频数据到Audio Queue 中；第三，驱动数据，使用扬声器播放数据；

通过AudioQueue来控制音频的播放

1.声明AudioStreamBasicDescription 来描述音频特征，如采样率，位深，声道数量等；

   audioDescription.mSampleRate =16000;//&#x91C7;&#x6837;&#x7387;
        audioDescription.mFormatID =kAudioFormatLinearPCM;
        audioDescription.mFormatFlags =kLinearPCMFormatFlagIsSignedInteger |kAudioFormatFlagIsPacked;
        audioDescription.mChannelsPerFrame =1;///&#x5355;&#x58F0;&#x9053;
        audioDescription.mFramesPerPacket =1;//&#x6BCF;&#x4E00;&#x4E2A;packet&#x4E00;&#x4FA6;&#x6570;&#x636E;
        audioDescription.mBitsPerChannel =16;//&#x6BCF;&#x4E2A;&#x91C7;&#x6837;&#x70B9;16bit&#x91CF;&#x5316;
        audioDescription.mBytesPerFrame = (audioDescription.mBitsPerChannel / 8) * audioDescription.mChannelsPerFrame;

2.AudioQueueOutputCallback 设置回调函数

AudioQueueOutputCallback (
    void                  *inUserData,
    AudioQueueRef         inAQ,
    AudioQueueBufferRef   inBuffer
);

说明：
inUserData: 用户指针，用来处理用户数据；
inAQ： auidoQueue的引用对象
inBuffer： AudioQueueBufferRef 对象，用来描述音频数据；

3.处理音频回调函数收到的数据

static void AudioPlayerAQInputCallbackV2(void* inUserData,AudioQueueRef outQ, AudioQueueBufferRef outQB){
    DSAQPool* pool = (__bridge DSAQPool*)inUserData;
    [pool playCallBack:outQB];
}

-(BOOL)enqueueBuffer:(AudioQueueBufferRefWrapper*)buf{
    if(AudioQueueEnqueueBuffer(audioQueue, buf.ref,0,NULL) == noErr){
        buf.inUse = YES;
        @synchronized (_buffers) {
            [_buffers addObject:buf];
        }
        return YES;
    }else{
        //DDLogError(@"AudioQueueEnqueueBuffer error.");
        return NO;
    }
}

说明：
1.AudioPlayerAQInputCallbackV2是回调函数，数据在播放的过程中会不停的触发；
2. -(BOOL)enqueueBuffer:(AudioQueueBufferRefWrapper*)buf； 在回调的过程中需要不停的对buffer进行赋值，驱动扬声器进行播放；

Audio Queue 的控制和状态

常用的控制有开始，暂停和停止；

开始-AudioQueueStart 控制开始录制或者开始播放；
暂停 AudioQueuePause 控制暂停，可以调用开始的方法继续播放；
停止 AudioQueueStop结束，调用这个方法后不能再调用start方法进行播放了，表示音频已经播放完成了。

Audio Queue 运行状态的监控

1.检测声音的分贝值

-(float)getCurrentPower {
    UInt32 dataSize = sizeof(AudioQueueLevelMeterState) * _audioDescription.mChannelsPerFrame;
    AudioQueueLevelMeterState *levels = (AudioQueueLevelMeterState*)malloc(dataSize);
    OSStatus rc = AudioQueueGetProperty(_audioQueue, kAudioQueueProperty_CurrentLevelMeterDB, levels, &dataSize);
    if (rc) {
        NSLog(@"NoiseLeveMeter>>takeSample - AudioQueueGetProperty(CurrentLevelMeter) returned %d", rc);
    }
    float channelAvg = 0;
    for (int i = 0; i < _audioDescription.mChannelsPerFrame; i++) {
        channelAvg += levels[i].mAveragePower;
    }
    free(levels);
    return channelAvg ;
}

说明：这个方法主要用来监控声音的分贝数，一般在录音的过程中需要对音量的大小进行反馈会用到；也可以利用 AudioQueueGetProperty 来监控音频的运行状态，具体可以参照： AudioQueuePropertyID 中的说明；

demo地址

音频录制： https://github.com/data-baker/BakerIosSdks/tree/main/DBAudioSDK/Classes/DBToolKit/DBMicrophone
音频播放：https://github.com/data-baker/BakerIosSdks/tree/main/DBAudioSDK/Classes/DBToolKit/DBPlayer

参考文献

苹果开发者文档：https://developer.apple.com/library/archive/documentation/MusicAudio/Conceptual/AudioQueueProgrammingGuide/AQPlayback/PlayingAudio.html

Original: https://www.cnblogs.com/DataBaker/p/15775000.html
Author: DataBaker
Title: 基于AudioQueue实现音频的录制和播放

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/576842/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

NLP项目实践——中文序列标注Flat Lattice代码解读、运行与使用

NLP项目实践——中文序列标注Flat Lattice代码解读与使用 1. 原文与项目地址 * 1.1 原文 1.2 项目 2. 运行环境 3. 项目结构 4. 参数介绍 * 4….

人工智能 2023年6月16日
0062
目标检测中的mAP+PyTorch实现

mAP mAP，全称为mean Average Precision，在目标检测任务中被用于衡量检测器的好坏。本文第一部分讲解mAP的概念以及计算过程，第二部分专注于用代码实现mAP…

人工智能 2023年7月12日
0051
【深度学习】3-从模型到学习的思路整理

前言活动地址：CSDN21天学习挑战赛 🚀 个人主页：清风莫追🌊 本文整理了从模型，到损失，再到损失关于权值的梯度的一些思路🔥 希望和大家一起加油，一起进步！文章目录前言 1…

人工智能 2023年6月23日
0073
pytorch 的一些介绍以及常用工具包展示

文章目录 * – 一、pytorch 简介 – 二、pytorch 优势 – 三、pytorch 常用工具包 – 四、pytorch…

人工智能 2023年6月15日
0086
代码会说话——pyttsx3简介

目录一、pyttsx3 概述二、pyttsx3的安装三、pyttsx3的运用四、全套代码一、pyttsx3 概述代码会说话：pyttsx3是Python中的文本到语音转…

人工智能 2023年7月29日
0061
分位数回归（quantile regression）简介和代码实现

普通最小二乘法如何处理异常值？它对待一切事物都是一样的——它将它们平方！但是对于异常值，平方会显著增加它们对平均值等统计数据的巨大影响。我们从描述性统计中知道，中位数对异常值…

人工智能 2023年6月24日
00106
论文研读笔记（二）——通过深度强化学习避免碰撞的编队控制

通过深度强化学习避免碰撞的编队控制（Formation Control with Collision Avoidance through Deep Reinforcement Le…

人工智能 2023年6月1日
0090
Intriguing properties of neural networks

作者： 19届 lz 论文：《Intriguing properties of neural networks》特性: 根据单元分析的各种方法，我们发现单个高级单元和高级单元的随…

人工智能 2023年7月14日
0074
使用Tushare的股票数据与Echarts可视化结合

使用Tushare的股票数据与Echarts可视化结合 tushare ID=399224由于最近学习了些前端可视化知识，并且想结合到一些实际案例当中，于是乎想做个股市看板，用Tu…

人工智能 2023年7月16日
0077
基于Halcon学习的边缘提取【一】edges_image.hdev例程

*读取图片 read_image (Image, ‘fabrik’) *&#x8FD…

人工智能 2023年6月21日
0092
从 0 到 1，开发一个智能问答机器人

「搜索」并不局限于我们常说的搜索引擎、搜索框，实际上，问答机器人本质上也是一种「搜索」，输入相关查询，返回最接近或最相关的答案。今天，我们将演示如何利用 Jina 全家桶，创建…

人工智能 2023年7月13日
0055
BGRA透明通道导致的bug

最近在读BGRA带透明通道的图像时，遇到一个bug。对于下图，csdn页面显示是白底的，因此利用opencv进行读取的时候，应该采用如下的方式 img = cv2.imread(i…

人工智能 2023年6月22日
0079
深入ftrace function原理

前面我们学习了ftrace的一些基本概念和用法，本章开始我们深入学习ftrace提供了哪些机制，根据之前的学习，我们知道了ftrace可用来快速排查以下问题特定的内核函数调用的频…

人工智能 2023年6月26日
0092
智能驾驶ADAS算法设计及Prescan仿真(1): 前向碰撞预警FCW算法设计与simulink仿真

前言：本系列文章将对智能驾驶ADAS算法进行完整的介绍，并在simulink中搭建算法模型，并在Prescan中搭建场景并且与simulink联合仿真对ADAS算法进行验证。智能…

人工智能 2023年6月10日
0090
K210学习笔记（一）——什么是K210？

K210学习笔记（一）——什么是K210？一、K210是什么？二、为什么选择K210 K210功耗仅为0.3w，典型设备工耗为1W，算力为1TOPS（比树莓派、Jetson N…

人工智能 2023年6月23日
0095
基于W800的AIOT离在线一体方案说明（阿里飞燕+离线语音控制）

人工智能 2023年5月23日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于AudioQueue实现音频的录制和播放

基于AudioQueue实现音频的录制和播放

背景

总览

Audio Queue 架构

AudioQueueBuffer数据结构

创建 AudioQueueBuffer

释放 AudioQueueBuffer

Buffer Queue 和Enqueuing

Audio Queue Callback

音频录制

录制 AuidoQueueInputCallback 回调函数

创建一个录音 AudioQueue 的示例

音频播放

播放流程说明

通过AudioQueue来控制音频的播放

Audio Queue 的控制和状态

Audio Queue 运行状态的监控

demo地址

参考文献

大家都在看

创建 `AudioQueueBuffer`

释放 `AudioQueueBuffer`