Windows批处理脚本多线程改造：按文件大小分类脚本优化

阿华AIGC实验室

2026-5-15

改造Windows批处理脚本以支持Windows 7多线程文件分类

Hey there! 我明白你现在的紧急需求——项目截止日期临近，想把现有的单线程批处理脚本改成能在Windows 7上跑的多线程版本，提升文件分类效率对吧？先理清楚现有脚本的逻辑，再给你一套可行的改造方案。

现有脚本功能回顾

你的当前脚本会遍历指定文件夹下的所有文件，对照tree_size.txt（CSV格式，每行是文件名,大小）里的数值，把文件路径分类写入对应的文本文件（比如0_10.txt、11_25.txt等）。原代码如下：

FOR %%I in (%inputDir%\*.*) DO ( 
FOR /F "tokens=1,2" %%A IN (%tree_size%) DO ( 
IF %%~nxI==%%A IF %%B LEQ 10.000 ( echo %%~dpnxI >> %inputDir%\0_10.txt)
IF %%~nxI==%%A IF %%B GTR 10.000 IF %%B LEQ 25.000 ( echo %%~dpnxI >> %inputDir%\11_25.txt)
IF %%~nxI==%%A IF %%B GTR 25.000 IF %%B LEQ 40.000 ( echo %%~dpnxI >> %inputDir%\26_40.txt)
IF %%~nxI==%%A IF %%B GTR 40.000 IF %%B LEQ 55.000 ( echo %%~dpnxI >> %inputDir%\41_55.txt)
IF %%~nxI==%%A IF %%B GTR 55.000 ( echo %%~dpnxI >> %inputDir%\56_plus.txt)
) 
)

不过这个脚本有两个明显的效率问题：一是嵌套循环导致重复遍历tree_size.txt（每个文件都要扫一遍整个CSV），二是单线程处理，文件量较大时速度会很慢。接下来咱们一步步优化改造。

多线程改造方案（适配Windows 7）

Windows 7的CMD本身没有原生多线程支持，但我们可以通过start命令启动多个独立子进程实现并发处理，同时加入线程数控制避免系统过载。以下是改造后的完整脚本：

@echo off
setlocal enabledelayedexpansion

:: ===== 配置参数（根据你的实际情况修改）=====
set "inputDir=C:\Your\Target\Folder"  :: 目标文件夹路径
set "tree_size=tree_size.txt"         :: 大小对照CSV文件
set "maxThreads=4"                    :: 最大并发线程数（建议和CPU逻辑核心数一致）
:: ==========================================

:: 第一步：预处理tree_size.txt，生成文件名-大小的映射临时文件（避免重复遍历CSV）
if exist file_sizes.tmp del /f /q file_sizes.tmp
for /f "tokens=1,2 delims=," %%A in (%tree_size%) do (
    echo %%A=%%B>>file_sizes.tmp
)

:: 初始化并发线程计数器
set "threadCount=0"

:: 遍历目标文件夹中的所有文件
for %%I in ("%inputDir%\*.*") do (
    :: 检查当前线程数，超过最大值则等待空闲线程
    :wait_for_thread
    set /a threadCount+=0
    if !threadCount! geq %maxThreads% (
        timeout /t 1 /nobreak >nul  :: 等待1秒后再次检查，Windows 7可用
        goto wait_for_thread
    )

    :: 启动子进程处理当前文件（/min 表示最小化窗口，避免弹窗过多）
    start /min "ProcessFile" cmd /c "call :process_single_file "%%~dpnxI""
    set /a threadCount+=1
)

:: 等待所有子进程处理完成
:wait_all_done
timeout /t 1 /nobreak >nul
:: 检测是否还有处理文件的子进程在运行
tasklist /fi "imagename eq cmd.exe" /fi "windowtitle eq ProcessFile" | findstr /i "cmd.exe" >nul
if not errorlevel 1 goto wait_all_done

:: 清理临时文件
if exist file_sizes.tmp del /f /q file_sizes.tmp
echo 所有文件分类完成！
goto :eof

:: ------------------------------
:: 子进程专用：处理单个文件的函数
:: ------------------------------
:process_single_file
set "full_file_path=%~1"
set "file_name=%~nx1"

:: 从临时映射文件中查找当前文件对应的大小
for /f "tokens=2 delims==" %%S in ('findstr /i "^%file_name%=" file_sizes.tmp') do (
    set "file_size=%%S"
    
    :: 根据大小分类写入对应文件
    if !file_size! leq 10.000 (
        echo !full_file_path!>>"%inputDir%\0_10.txt"
    ) else if !file_size! gtr 10.000 if !file_size! leq 25.000 (
        echo !full_file_path!>>"%inputDir%\11_25.txt"
    ) else if !file_size! gtr 25.000 if !file_size! leq 40.000 (
        echo !full_file_path!>>"%inputDir%\26_40.txt"
    ) else if !file_size! gtr 40.000 if !file_size! leq 55.000 (
        echo !full_file_path!>>"%inputDir%\41_55.txt"
    ) else if !file_size! gtr 55.000 (
        echo !full_file_path!>>"%inputDir%\56_plus.txt"
    )
)
goto :eof

关键改造点说明

预处理CSV文件：把tree_size.txt转换成文件名=大小格式的临时映射文件，每个文件只需要做一次精准查找，避免了原脚本中每个文件都遍历整个CSV的低效操作。
并发线程控制：通过threadCount变量限制最大并发数，防止启动过多进程导致Windows 7系统卡顿，建议设置为CPU的逻辑核心数（比如4核设为4，8核设为8）。
子进程处理：用start /min启动独立的CMD子进程处理单个文件，子进程通过调用:process_single_file函数完成分类逻辑，和原脚本的分类规则完全一致。
等待所有进程完成：通过tasklist检测子进程是否全部结束，确保所有文件都处理完成后再清理临时文件并提示完成。