iOS Swift实现外接麦克风录音与蓝牙/耳机实时播放同步方案问询

阿华AIGC实验室

2026-4-30

嘿，我来帮你梳理下这个iOS实时音频采集+外接设备输出的问题——这确实是个容易踩坑的领域，尤其是涉及外接硬件的时候，我之前做过类似的需求，给你分享下可行的方案和避坑指南：

先明确：AVAudioRecorder + AVAudioPlayer 行不通

你猜的没错，这俩组合完全没法实现实时需求——Recorder是把音频先写到本地文件，Player再从文件读取播放，中间的延迟至少几百毫秒，根本达不到“实时监听”的效果，所以这条路直接放弃就好。

可行方案：优先用AVAudioEngine，底层需求用RemoteIO

iOS上实现实时音频直通（采集即播放），核心就是用AVAudioEngine（高级API，推荐）或者RemoteIO Audio Unit（底层API，低延迟场景），以下是具体实现思路和代码示例：

方案1：AVAudioEngine（快速上手，API友好）

AVAudioEngine是Apple主推的现代音频框架，封装了Core Audio的底层复杂度，适合快速搭建实时流。核心逻辑就是把麦克风输入节点直接连接到输出节点，形成一条直通的音频流。

实现步骤&代码示例

import AVFoundation

class RealTimeAudioLoop {
    private let audioEngine = AVAudioEngine()
    private var isRunning = false

    func start() throws {
        guard !isRunning else { return }
        
        // 1. 配置AVAudioSession：必须设置为.playAndRecord，允许蓝牙设备
        let session = AVAudioSession.sharedInstance()
        try session.setCategory(
            .playAndRecord,
            mode: .default,
            options: [.allowBluetoothA2DP, .allowBluetooth]
        )
        try session.setActive(true)

        // 2. 获取输入（外接麦克风）和输出（耳机/蓝牙）节点
        let inputNode = audioEngine.inputNode
        let outputNode = audioEngine.outputNode

        // 3. 连接输入到输出：用输入节点的格式作为连接格式
        let inputFormat = inputNode.inputFormat(forBus: 0)
        audioEngine.connect(inputNode, to: outputNode, format: inputFormat)

        // 4. 启动引擎
        try audioEngine.start()
        isRunning = true
    }

    func stop() {
        guard isRunning else { return }
        
        audioEngine.stop()
        audioEngine.reset() // 重置引擎，避免下次启动出问题
        try? AVAudioSession.sharedInstance().setActive(false)
        isRunning = false
    }
}

关键注意事项

权限：Info.plist必须添加NSMicrophoneUsageDescription，否则App会崩溃，要向用户说明为什么需要麦克风权限
设备路由切换：用户插拔耳机、切换蓝牙设备时，音频路由会变化，要监听AVAudioSession.routeChangeNotification，在回调里重启engine

延迟优化：如果觉得默认延迟太高，可以给inputNode添加tap时指定更小的buffer大小，比如：

inputNode.installTap(onBus: 0, bufferSize: 512, format: inputFormat) { buffer, time in
    // 这里可以做自定义处理，比如音效，不需要的话直接忽略，连接已经实现直通
}

方案2：RemoteIO Audio Unit（底层控制，低延迟）

如果你的需求对延迟要求极高（比如专业音频设备），可以用Core Audio的RemoteIO，它是最底层的音频输入输出组件，延迟更低，但API是C风格的，上手难度高一些。

核心思路

通过设置输入回调，把采集到的音频数据直接拷贝到输出回调，实现直通。

简化代码示例

import AVFoundation

class RemoteIOAudioLoop {
    private var audioUnit: AudioUnit?
    private let session = AVAudioSession.sharedInstance()

    func start() throws {
        // 1. 配置Session，和AVAudioEngine一样
        try session.setCategory(.playAndRecord, mode: .default, options: [.allowBluetoothA2DP, .allowBluetooth])
        try session.setActive(true)

        // 2. 查找并初始化RemoteIO组件
        var desc = AudioComponentDescription(
            componentType: kAudioUnitType_Output,
            componentSubType: kAudioUnitSubType_RemoteIO,
            componentManufacturer: kAudioUnitManufacturer_Apple,
            componentFlags: 0,
            componentFlagsMask: 0
        )
        
        guard let component = AudioComponentFindNext(nil, &desc) else {
            throw NSError(domain: "AudioError", code: -1, userInfo: [NSLocalizedDescriptionKey: "无法找到RemoteIO组件"])
        }

        var audioUnit: AudioUnit?
        AudioComponentInstanceNew(component, &audioUnit)
        self.audioUnit = audioUnit

        // 3. 启用输入输出总线
        var enable: UInt32 = 1
        AudioUnitSetProperty(audioUnit!, kAudioOutputUnitProperty_EnableIO, kAudioUnitScope_Input, 1, &enable, UInt32(MemoryLayout.size(ofValue: enable)))
        AudioUnitSetProperty(audioUnit!, kAudioOutputUnitProperty_EnableIO, kAudioUnitScope_Output, 0, &enable, UInt32(MemoryLayout.size(ofValue: enable)))

        // 4. 设置输入回调：把采集到的数据直接渲染到输出
        let inputCallback = AURenderCallbackStruct(
            inputProc: { (inRefCon, ioActionFlags, inTimeStamp, inBusNumber, inNumberFrames, ioData) -> OSStatus in
                let manager = unsafeBitCast(inRefCon, to: RemoteIOAudioLoop.self)
                // 直接把输入总线（1）的数据渲染到输出总线（0）
                return AudioUnitRender(manager.audioUnit!, ioActionFlags, inTimeStamp, 1, inNumberFrames, ioData)
            },
            inputProcRefCon: UnsafeMutableRawPointer(Unmanaged.passUnretained(self).toOpaque())
        )

        AudioUnitSetProperty(audioUnit!, kAudioUnitProperty_SetRenderCallback, kAudioUnitScope_Output, 0, &inputCallback, UInt32(MemoryLayout.size(ofValue: inputCallback)))

        // 5. 设置音频格式：这里用单声道16位PCM，44.1kHz
        var format = AudioStreamBasicDescription(
            mSampleRate: 44100.0,
            mFormatID: kAudioFormatLinearPCM,
            mFormatFlags: kAudioFormatFlagIsSignedInteger | kAudioFormatFlagIsPacked,
            mBytesPerPacket: 2,
            mFramesPerPacket: 1,
            mBytesPerFrame: 2,
            mChannelsPerFrame: 1,
            mBitsPerChannel: 16,
            mReserved: 0
        )

        AudioUnitSetProperty(audioUnit!, kAudioUnitProperty_StreamFormat, kAudioUnitScope_Input, 1, &format, UInt32(MemoryLayout.size(ofValue: format)))
        AudioUnitSetProperty(audioUnit!, kAudioUnitProperty_StreamFormat, kAudioUnitScope_Output, 0, &format, UInt32(MemoryLayout.size(ofValue: format)))

        // 6. 初始化并启动AudioUnit
        AudioUnitInitialize(audioUnit!)
        AudioOutputUnitStart(audioUnit!)
    }

    func stop() {
        if let audioUnit = audioUnit {
            AudioOutputUnitStop(audioUnit)
            AudioUnitUninitialize(audioUnit)
            AudioComponentInstanceDispose(audioUnit)
            self.audioUnit = nil
        }
        try? session.setActive(false)
    }
}

关键注意事项

内存管理：Core Audio的API需要手动管理AudioUnit实例，记得在stop时释放资源
延迟优化：可以设置kAudioUnitProperty_MaximumFramesPerSlice来降低每次处理的帧数，进一步减少延迟
错误处理：Core Audio的API返回OSStatus，要注意处理错误码，比如noErr是成功，其他都是失败

可参考的资源

Apple官方文档：直接搜索“AVAudioEngine”或“RemoteIO Audio Unit”，里面有详细的API说明和基础示例
开源项目：在GitHub上搜索“iOS realtime audio loop”，能找到很多基于这两个框架的小项目，比如实时麦克风监听工具，这些都可以直接参考代码逻辑
Core Audio Programming Guide：如果想深入底层，这个官方指南会帮你理解音频流的工作原理

常见避坑点

蓝牙设备兼容性：有些蓝牙设备（比如旧款蓝牙耳机）可能不支持实时音频传输，要多测试不同设备，Session的options要同时包含.allowBluetooth和.allowBluetoothA2DP
后台运行：如果需要App在后台也能运行，要在Info.plist添加audio后台模式，并确保Session激活时设置options: [.mixWithOthers]（如果需要）
音频格式匹配：输入和输出的音频格式必须一致，否则连接会失败，AVAudioEngine会自动处理格式转换，但RemoteIO需要手动设置

内容的提问来源于stack exchange，提问作者ndr