如何限制Puppeteer处理多文件时的Chrome实例并发数？

阿华AIGC实验室

2026-5-29

嘿，我完全懂你现在的困扰——一下子启动上百个Chrome实例，不仅电脑资源直接拉满，搞不好还会直接崩溃。作为Node.js新手，异步并发控制确实是个容易卡壳的点，我给你几个实用的解决方案，一步步来解决这个问题：

方案1：用async库的mapLimit快速搞定（推荐）

这是最省心的方式，借助成熟的第三方库来帮你控制并发数，不用自己造轮子。

首先安装async库：

npm install async

然后结合你的需求写代码，这里我假设你用的是puppeteer做Chrome自动化（如果是其他工具，逻辑类似）：

const fs = require('fs').promises;
const async = require('async');
const puppeteer = require('puppeteer');

// 自定义并发数，比如同时跑5个任务，根据你的电脑配置调整
const CONCURRENCY_LIMIT = 5;

// 封装你的文件处理逻辑
async function processFile(filePath, browser) {
  const page = await browser.newPage();
  try {
    // 这里写你的具体处理逻辑：读取文件内容、Chrome自动化操作等
    const fileContent = await fs.readFile(filePath, 'utf8');
    await page.goto('https://example.com');
    // 比如填充内容、截图、爬取数据等操作...
    console.log(`✅ 处理完成：${filePath}`);
  } catch (err) {
    console.error(`❌ 处理失败：${filePath}`, err);
  } finally {
    // 只关闭当前页面，复用浏览器实例
    await page.close();
  }
}

async function main() {
  // 1. 读取目标目录下的所有文件
  const fileNames = await fs.readdir('./your-target-directory');
  // 转换为完整文件路径
  const filePaths = fileNames.map(name => `./your-target-directory/${name}`);

  // 2. 只启动一个Chrome浏览器实例（重点！不要每个文件开一个）
  const browser = await puppeteer.launch();

  try {
    // 3. 使用mapLimit控制并发，同时处理指定数量的文件
    await async.mapLimit(
      filePaths,
      CONCURRENCY_LIMIT,
      async (filePath) => await processFile(filePath, browser)
    );
  } finally {
    // 所有任务完成后关闭浏览器
    await browser.close();
  }

  console.log('🎉 所有文件处理完毕！');
}

// 启动主流程
main().catch(err => console.error('主流程出错：', err));

方案2：手动实现并发控制（适合理解原理）

如果不想依赖第三方库，可以自己写个简单的并发控制器，核心思路是维护一个“活跃任务计数器”，每当一个任务完成，就启动下一个任务：

const fs = require('fs').promises;
const puppeteer = require('puppeteer');

const CONCURRENCY_LIMIT = 5;

async function processFile(filePath, browser) {
  const page = await browser.newPage();
  try {
    const fileContent = await fs.readFile(filePath, 'utf8');
    await page.goto('https://example.com');
    // 你的处理逻辑...
    console.log(`✅ 处理完成：${filePath}`);
  } catch (err) {
    console.error(`❌ 处理失败：${filePath}`, err);
  } finally {
    await page.close();
  }
}

async function main() {
  const fileNames = await fs.readdir('./your-target-directory');
  const filePaths = fileNames.map(name => `./your-target-directory/${name}`);

  const browser = await puppeteer.launch();
  let activeTasks = 0;
  let currentIndex = 0;

  // 递归启动下一个任务
  async function runNextTask() {
    // 所有任务都已启动，等待剩余任务完成
    if (currentIndex >= filePaths.length) {
      while (activeTasks > 0) {
        await new Promise(resolve => setTimeout(resolve, 100));
      }
      return;
    }

    const filePath = filePaths[currentIndex];
    currentIndex++;
    activeTasks++;

    try {
      await processFile(filePath, browser);
    } finally {
      activeTasks--;
      // 当前任务完成，立刻启动下一个
      await runNextTask();
    }
  }

  // 启动初始的并发任务
  for (let i = 0; i < Math.min(CONCURRENCY_LIMIT, filePaths.length); i++) {
    runNextTask();
  }

  await runNextTask();
  await browser.close();
  console.log('🎉 所有文件处理完毕！');
}

main().catch(err => console.error('主流程出错：', err));

关键优化点：复用Chrome实例！

你之前的问题不仅是并发过高，更重要的是每个文件启动一个Chrome浏览器——这才是资源浪费的大头。上面的代码里，我只启动了一个浏览器实例，每个任务创建一个新页面，处理完就关闭页面，这样能大幅降低CPU和内存占用，比多实例高效太多。

你可以根据自己的电脑配置调整CONCURRENCY_LIMIT的值，比如8核CPU可以设为8，笔记本可以设为3-5，找到适合自己的平衡点。

内容的提问来源于stack exchange，提问作者naqushab