如何在Python中读取ZIP压缩包内CSV文件的首行

如何在Python中读取ZIP压缩包内CSV文件的首行

阿华AIGC实验室

2026-4-14

如何在Python中读取ZIP压缩包内CSV文件的首行

嘿，这个需求太戳痛点了！碰到超大CSV被打包在ZIP里的时候，直接解压完全不现实——既占磁盘空间又费时间。用Python内置模块就能轻松搞定，不用装额外库，还能完全跳过解压步骤，直接逐行读取！

我给你写个实用的代码示例，改改路径就能用：

import zipfile
import csv

# 替换成你的ZIP文件实际路径
zip_file_path = "your_large_file.zip"
# 替换成ZIP包里的目标CSV文件名
target_csv_name = "huge_data.csv"

with zipfile.ZipFile(zip_file_path, 'r') as zip_container:
    # 先确认CSV文件在ZIP包里（可选但能避免踩坑）
    if target_csv_name not in zip_container.namelist():
        print(f"哎呀，ZIP包里找不到{target_csv_name}这个文件哦！")
        exit()
    
    # 直接打开ZIP内的CSV文件，得到类文件对象，不用解压到磁盘
    with zip_container.open(target_csv_name, mode='r', encoding='utf-8') as csv_file:
        # 用csv模块解析，支持标准CSV格式
        csv_reader = csv.reader(csv_file)
        
        # 读取首行（通常是表头）
        first_row = next(csv_reader)
        print("CSV首行内容：", first_row)
        
        # 如果需要继续逐行读数据，就用循环
        # 举个例子：只读取前5行数据预览
        count = 0
        for row in csv_reader:
            print(f"第{count+2}行数据：", row)
            count += 1
            if count >= 5:
                break

给你拆解下核心逻辑：

zipfile.ZipFile是Python自带的ZIP处理工具，open方法能直接获取ZIP内文件的文件对象，全程不用碰本地磁盘。
csv.reader会逐行读取数据，内存里只会保留当前处理的那一行，哪怕CSV有几十GB也不会爆内存。
如果你的CSV是特殊编码（比如GBK），只要在zip_container.open里加上encoding='gbk'就行。
要是不确定ZIP里有哪些文件，用zip_container.namelist()就能打印出所有文件名，精准找到目标CSV。

这种操作既高效又省空间，完美解决大文件的麻烦～

备注：内容来源于stack exchange，提问作者polliew

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠