使用Python实现按钮点击自动化：网页CSV下载方案疑问

阿华AIGC实验室

2026-5-26

解决自动下载Razzball MLB投手数据CSV的方案

嘿，我来帮你拆解这个问题！你提到监控网络面板没发现API请求，这大概率是因为那个CSV是前端直接生成的——也就是说，页面加载后数据已经在页面里了（可能藏在HTML表格或者JS变量中），点击下载按钮只是触发了前端把数据转换成CSV并弹出下载的动作，所以看不到单独的API请求。这种情况下完全不用无头浏览器，用requests就能搞定，给你两个可行的思路：

思路1：提取页面原始数据，自己生成CSV

这是最直接轻量的方法，步骤大概是：

用requests.get()获取目标页面的源码
定位数据的存储位置：
- 要么是页面里的<table>标签，直接用BeautifulSoup解析表格的行和列
- 要么是某个<script>标签里的JSON全局变量（很多网站会把数据存在window.xxxData这类变量里），用正则表达式把变量内容匹配出来，再解析成Python可处理的字典/列表
用Python的csv模块把提取到的数据写成CSV文件

举个简单的代码片段示例（假设数据在JS全局变量中）：

import requests
import re
import json
import csv

url = "https://razzball.com/mlbpitchingstats/"
response = requests.get(url)
# 匹配类似 window.pitchingStats = { ... } 的JS变量
data_match = re.search(r'window\.pitchingStats\s*=\s*(.*?);', response.text, re.DOTALL)
if data_match:
    raw_data = data_match.group(1)
    pitching_data = json.loads(raw_data)
    # 假设pitching_data是列表，每个元素是一个投手的字典
    with open('mlb_pitching.csv', 'w', newline='', encoding='utf-8') as f:
        writer = csv.DictWriter(f, fieldnames=pitching_data[0].keys())
        writer.writeheader()
        writer.writerows(pitching_data)