如何防止Pandas读取Excel时将‘2004E205’类字符串转换为科学计数法

阿华AIGC实验室

2026-4-1

我太懂这种抓狂的感觉了——明明指定了要读成字符串，结果带E的编码还是被转成了一串乱七八糟的长数字，完全没法用。咱们一步步把这个问题解决掉：

首先先揪出你代码里的一个小bug：你把dtype和parse_dates参数写到pd.read_excel的括号外面了！这直接导致这些设置根本没生效，这也是你的配置不起作用的核心原因之一。不过就算修正了这个，有时候dtype参数对这类"疑似科学计数法"的内容还是不太靠谱，咱们用更稳妥的方案来处理：

最靠谱的解决方案：用`converters`参数强制转字符串

converters参数是在读取每个单元格的第一时间就把内容转成字符串，跳过pandas的自动类型推断，从根源上避免科学计数法的转换。给你修正后的完整代码：

import pandas as pd

# 文件路径
2025_data = '/content/drive/MyDrive/Data Cleaning/2025-10 Data Checking/2025_data.xlsx'

# 读取所有sheet，重点用converters指定列类型
df_25_dict = pd.read_excel(
    2025_data,
    sheet_name=None,
    converters={
        'bg_code': str,
        'tranx_date_year': str,
        'journal_number': str,
        'journal_line_number': str,
        'prj_code': str
    },
    parse_dates=['tranx_date', 'entry_date']
)

# 遍历sheet查看信息，顺便验证bg_code的类型
for sheet_name, df in df_25_dict.items():
    print(f"Sheet: {sheet_name}")
    print(df.shape)
    print(df.columns)
    # 加两行验证代码，确认bg_code的类型和原始内容
    print(f"bg_code列数据类型: {df['bg_code'].dtype}")
    print(f"bg_code示例值: {df['bg_code'].head().tolist()}")