Linux环境下捕获并存储WebRTC入站视频流的最优方案咨询

阿华AIGC实验室

2026-5-15

Optimal Solutions for Capturing Inbound WebRTC Video Streams on Linux

针对你在Linux环境下录制Chrome中WebRTC入站视频流的需求——排除屏幕录制、xvfb+ffmpeg这类方案，且已经评估了抓包解码和修改Chromium源码的方向——我整理了几个更实用的替代方案，供你参考：

1. Capture Streams via Chrome DevTools Protocol (CDP)

Chrome DevTools Protocol（CDP）是个被低估的工具，它允许你通过代码直接控制Chrome，获取浏览器内部的媒体流，完全不需要修改浏览器源码，也不用手动抓包。

How it works:

CDP的Media和WebRTC域提供了直接操作媒体流的接口：你可以定位到通话中的入站流轨道，调用录制命令指定编码格式和输出路径，浏览器会直接帮你把流保存成本地文件。用Python的pyppeteer或者Node.js的puppeteer就能轻松封装这些操作，实现自动化录制。

Quick Python Example (with pyppeteer):

import asyncio
from pyppeteer import launch

async def record_webrtc_inbound_streams():
    # 启动Chrome，可加--headless=True实现无界面录制
    browser = await launch(headless=False, args=['--use-fake-ui-for-media-stream'])
    page = await browser.newPage()
    await page.goto('your-webrtc-call-url-here')
    
    # 等待通话连接建立（根据实际情况调整时长）
    await asyncio.sleep(10)
    
    # 启动录制，指定MP4格式和码率
    await page._client.send('Media.startRecording', {
        'targetId': page.target.id,
        'options': {
            'mimeType': 'video/mp4',
            'videoBitsPerSecond': 2000000,
            'recordAudio': True  # 不需要音频可改为False
        }
    })
    
    # 录制30秒，按需调整
    await asyncio.sleep(30)
    
    # 停止录制并保存文件
    recording_result = await page._client.send('Media.stopRecording')
    with open('inbound_webrtc_stream.mp4', 'wb') as output_file:
        output_file.write(recording_result['data'])
    
    await browser.close()

asyncio.get_event_loop().run_until_complete(record_webrtc_inbound_streams())

Pros & Cons:

✅ 无需修改浏览器，代码量小，容易自动化
✅ 直接获取浏览器处理后的媒体流，不用手动解码RTP包
❌ 依赖Chrome的CDP版本，API可能随浏览器更新略有变化
❌ 多参与者场景下，需额外处理流的区分（可通过WebRTC Stats API获取每个流的SSRC来区分）

2. Automated Packet Capture + libwebrtc Decoding

如果你倾向于抓包方向，但觉得Wireshark手动操作太麻烦，可以用libpcap自动抓取RTP包，再配合libwebrtc的解码模块直接转成可保存的视频文件——这比手动导出Wireshark包再解码高效多了。

How it works:

用libpcap过滤UDP端口（WebRTC默认用UDP传输）的数据包，通过SSRC区分不同参与者的流
从通话的SDP中提取编码格式（比如VP8/H.264），初始化libwebrtc的视频解码器
将捕获的RTP包送入解码器，得到原始YUV视频帧
用FFmpeg的编码模块（仅用于保存文件，不是屏幕录制）把YUV帧转成MP4/MKV文件

Pros & Cons:

✅ 精准控制每个参与者的独立流，不受浏览器界面限制
✅ 适合需要底层数据的场景（比如分析流质量）
❌ 需要编写C++代码，还要编译libpcap和libwebrtc，上手门槛较高
❌ 必须获取通话的SDP参数才能正确配置解码器，否则无法解码

3. Browser Extension for Stream Capture

开发一个轻量的Chrome扩展，利用浏览器原生的MediaStreamTrack和MediaRecorderAPI，直接捕获页面中的入站WebRTC流并保存。

How it works:

扩展监听目标通话页面的加载，注入内容脚本
脚本遍历页面中的MediaStream实例，识别入站流轨道（可通过WebRTC的Stats API判断方向）
用MediaRecorder将流录制成本地文件，或者通过扩展API上传到服务器

Quick Content Script Example:

document.addEventListener('DOMContentLoaded', () => {
    // 监听MediaStream的创建，也可直接遍历已存在的流
    const originalGUM = navigator.mediaDevices.getUserMedia;
    navigator.mediaDevices.getUserMedia = async (constraints) => {
        const stream = await originalGUM(constraints);
        // 可通过WebRTC Stats判断是否为入站流，再录制
        recordStream(stream, `inbound_stream_${Date.now()}.mp4`);
        return stream;
    };
});

function recordStream(stream, filename) {
    const recorder = new MediaRecorder(stream, { mimeType: 'video/mp4' });
    const chunks = [];

    recorder.ondataavailable = (e) => chunks.push(e.data);
    recorder.onstop = () => {
        const blob = new Blob(chunks, { type: 'video/mp4' });
        const downloadLink = document.createElement('a');
        downloadLink.href = URL.createObjectURL(blob);
        downloadLink.download = filename;
        downloadLink.click();
        URL.revokeObjectURL(blob);
    };

    recorder.start();
    // 1分钟后停止录制，按需调整
    setTimeout(() => recorder.stop(), 60000);
}