如何将DataFrame按时间转换为每分钟一行的对应格式？

阿华AIGC实验室

2026-4-22

嘿，我明白你的需求了——你现在的DataFrame里每行对应一整天的数据，w和w_4列各自存了1440个每分钟的数值，想要把它们拆成每分钟一行，同时把日期精确到分钟对吧？之前用reshape('1Min')没达到效果很正常，因为那个方法是针对已有时间索引的重采样，而你的情况需要先展开列表再生成对应时间，下面给你具体的解决方案：

步骤1：处理列表格式（如果需要）

首先要确保w和w_4列是列表类型，如果你的数据里这两列是带[]的字符串（比如你示例里显示的[887, 665, 793, 800,...），需要先把它们转换成列表：

import pandas as pd
import ast

# 假设你的原始DataFrame名为df
df['w'] = df['w'].apply(ast.literal_eval)
df['w_4'] = df['w_4'].apply(ast.literal_eval)

步骤2：展开列表并生成分钟级时间戳

接下来我们把列表拆分成单行，同时为每个数值匹配对应的分钟时间：

# 将day列转换为datetime类型，方便后续计算时间偏移
df['day'] = pd.to_datetime(df['day'])

# 展开w和w_4列的列表，每个元素单独成一行
df_exploded = df.explode(['w', 'w_4'], ignore_index=True)

# 计算每个原始日期下的分钟偏移量（0到1439，对应一天的1440分钟）
df_exploded['minute_offset'] = df_exploded.groupby(['user_id', 'day']).cumcount()

# 生成精确到分钟的时间戳
df_exploded['datetime'] = df_exploded['day'] + pd.to_timedelta(df_exploded['minute_offset'], unit='min')

# 整理最终的列顺序和名称
final_df = df_exploded[['user_id', 'datetime', 'w', 'w_4']].rename(columns={'datetime': 'day'})