Python dbf包读取含memo数据的DBF文件失败求助

阿华AIGC实验室

2026-5-8

解决dBase III Plus带大Memo的DBF文件读取卡死问题

针对你遇到的在Python 3.6.3（Anaconda环境）用dbf 0.97.11读取带460MB Memo文件（RelLinks.DBT）时的卡死/数据为空问题，我整理了几个实用的排查和解决方向，你可以逐一尝试：

1. 先升级dbf包到兼容新版本

你用的dbf 0.97.11是2018年左右的旧版本，对大Memo文件的处理大概率存在性能瓶颈或兼容性bug。先升级到适配Python 3.6的最新稳定版（注意不要升太高，避免版本不兼容）：

pip install --upgrade dbf>=0.99.0,<1.0.0

升级后，用指定编码的方式重新尝试，并且逐行读取避免一次性加载全部数据：

import dbf

# 明确指定ascii编码，关闭忽略memo选项
table = dbf.Table('你的DBF文件名.dbf', codepage='ascii', ignore_memos=False)
table.open()

# 只读取前10条，逐行处理减少内存压力
for idx, record in enumerate(table):
    if idx >= 10:
        break
    # 显式调用memo字段，触发读取
    memo_content = record['你的memo列名']
    print(f"第{idx+1}条记录的memo内容（前100字符）：{memo_content[:100]}...")
table.close()

2. 换用更靠谱的DBF读取库

如果dbf库始终搞不定大Memo文件，建议换成dbfread配合pandas，这个组合对大文件和Memo格式的支持要稳定得多：
先安装依赖：

pip install pandas dbfread

然后用以下代码读取：

from dbfread import DBF
import pandas as pd

# 指定编码和对应的Memo文件路径，DBT和DBF在同目录时也可以不写memo_file参数
table = DBF('你的DBF文件名.dbf', encoding='ascii', memo_file='RelLinks.DBT')
df = pd.DataFrame(table)

# 查看前10条的memo列数据
print(df['你的memo列名'].head(10))

dbfread采用流式读取，不会一次性把整个大文件加载到内存，能有效避免卡死问题。