如何在Google Colab中将本地CSV文件转为Pandas DataFrame

阿华AIGC实验室

2026-5-15

在Google Colaboratory中将本地CSV文件转换为Pandas DataFrame的解决方法

嘿，我来帮你搞定这个问题！你已经成功用files.upload()上传了泰坦尼克数据集的CSV文件，接下来转成DataFrame其实很简单，咱们一步步来：

方法一：直接读取Colab文件系统中的上传文件

当你运行files.upload()并完成文件上传后，这个CSV文件会被保存到Colab的当前工作目录里。你只需要知道上传的文件名（比如Kaggle泰坦尼克数据集通常是train.csv或titanic.csv），然后用Pandas的read_csv()直接读取即可：

# 先导入pandas
import pandas as pd

# 替换成你实际上传的文件名
df = pd.read_csv("train.csv")

# 验证一下数据是否加载成功
df.head()

方法二：从`uploaded`字典的字节数据中读取

files.upload()返回的uploaded是一个字典，键是上传的文件名，值是文件的字节流数据。你需要用io.BytesIO把字节流包装成文件对象，再传给read_csv()：

import pandas as pd
from io import BytesIO

# 假设你上传的文件名为'titanic.csv'，从字典中取出对应的字节数据
file_content = uploaded['titanic.csv']
# 把字节数据转成可读取的文件对象，再加载成DataFrame
df = pd.read_csv(BytesIO(file_content))

# 查看前几行数据确认
df.head()