如何用Python/Selenium等待文件处理完成后点击下载？

阿华AIGC实验室

2026-5-21

解决Selenium自动化中异步文件生成与下载的问题

看起来你已经搞定了打开网站、选择条件和触发处理的步骤，卡在了等待文件生成并自动下载这一环节对吧？我给你分享几个实用的方案，让整个流程更稳定可靠：

核心思路：用智能等待替代固定Sleep

网站生成文件是异步过程，固定time.sleep(10)太不靠谱——网络慢的时候会失败，网络快的时候纯浪费时间。推荐用Selenium的WebDriverWait来等待特定元素状态，精准触发下一步操作。

方案1：等待进度条完成（适合有明确进度提示的场景）

如果进度页面的进度条会显示完成百分比（比如“100%”），可以等待这个文本出现：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException

# 初始化Chrome并配置下载路径（避免弹窗）
options = webdriver.ChromeOptions()
prefs = {"download.default_directory": "/你的本地下载路径"}
options.add_experimental_option("prefs", prefs)
driver = webdriver.Chrome(options=options)

# --- 你已实现的代码部分 ---
driver.get("目标网站URL")
# 选择CSV格式、设置筛选条件的代码...
driver.find_element(By.ID, "start_process_btn").click()  # 点击开始处理

# --- 等待进度完成的核心代码 ---
# 先等待进度页面加载出来
WebDriverWait(driver, 20).until(EC.presence_of_element_located((By.CLASS_NAME, "progress-bar")))

try:
    # 等待进度文本变为100%（根据你的网页元素调整定位器）
    WebDriverWait(driver, 30).until(
        EC.text_to_be_present_in_element((By.CLASS_NAME, "progress-status"), "100%")
    )
    # 进度完成后，找到下载按钮并点击
    download_btn = driver.find_element(By.ID, "download_csv_btn")
    download_btn.click()
    print("文件开始下载啦！")
except TimeoutException:
    print("处理超时了，点击取消请求按钮")
    driver.find_element(By.ID, "cancel_request_btn").click()
    # 这里可以加重试逻辑，比如重新触发处理

# 可选：等待文件下载完成（如果需要后续处理文件，可以用文件监控工具替代sleep）
import time
time.sleep(5)

driver.quit()

方案2：等待“下载按钮”出现（更推荐，直接对应文件就绪状态）

如果文件准备好后会直接出现下载按钮，这是最精准的判断条件——不用管进度条，只要按钮能点了就触发下载：

# 前面初始化和触发处理的代码和上面一样...

try:
    # 直接等待下载按钮可点击（超时时间设30秒足够应对大多数情况）
    download_btn = WebDriverWait(driver, 30).until(
        EC.element_to_be_clickable((By.ID, "download_ready_btn"))
    )
    download_btn.click()
    print("文件准备就绪，开始下载！")
except TimeoutException:
    print("文件准备超时，请检查网站是否正常")

额外优化建议

避免下载文件被覆盖：每日更新的文件名字可能一样，下载后可以用Python自动重命名，加上日期戳：

import os
import datetime

download_folder = "/你的下载路径"
# 获取最新下载的文件
latest_file = max(
    [os.path.join(download_folder, f) for f in os.listdir(download_folder)],
    key=os.path.getctime
)
# 重命名为带日期的文件名
new_name = f"每日数据_{datetime.date.today().strftime('%Y%m%d')}.csv"
os.rename(latest_file, os.path.join(download_folder, new_name))