如何用SQL Loader导入含嵌入式的CSV文件至Oracle并去除换行符

阿华AIGC实验室

2026-5-28

解决SQL*Loader导入含换行字段CSV到Oracle的问题

我来帮你搞定这个SQLLoader处理带换行CSV字段的问题！从你的描述来看，核心问题是CSV字段内部包含换行符，导致SQLLoader误把这些换行当成了记录分隔符，加上你用了DIRECT=TRUE直接路径加载，很多常规处理逻辑会被限制，这也是你之前尝试的方案没生效的关键原因。

方案一：关闭DIRECT模式，用CONTINUEIF+字段替换处理

直接路径加载（DIRECT=TRUE）虽然速度快，但会跳过Oracle的很多常规数据处理步骤，包括CONTINUEIF判断和字段级的REPLACE函数支持。如果性能不是硬性要求，先关闭这个选项，再调整控制文件：

去掉控制文件开头的OPTIONS (DIRECT=TRUE)
添加CONTINUEIF LAST != '"'来识别未结束的字段（判断当前行末尾不是闭合引号时，将下一行合并到当前记录）
在字段定义中用嵌套的REPLACE函数替换掉所有换行符（兼容Windows的CRLF和Linux的LF）

完整的控制文件示例：

LOAD DATA
INFILE 'E:test.csv'
INTO TABLE TEMP
FIELDS TERMINATED BY "," OPTIONALLY ENCLOSED BY '"'
TRAILING NULLCOLS  -- 处理行尾可能的空字段
CONTINUEIF LAST != '"'
(
    COL1 CHAR(10),
    COL2 CHAR(10),
    COL3 CHAR(200) "REPLACE(REPLACE(:COL3, CHR(10), ' '), CHR(13), ' ')",
    -- 按你的实际字段继续定义其他列
)

为什么之前的`CONTINUEIF`没生效？

如果你的CSV行尾有空格或逗号（比如示例里的" CDE FGH" , ...），LAST != '"'会一直触发合并，因为行尾最后一个字符是空格/逗号而非引号。这时候可以调整为CONTINUEIF LAST NOT LIKE '%"'，不过更稳妥的是配合上面的字段替换逻辑一起处理。

方案二：必须用DIRECT模式？先预处理CSV文件

如果你的数据量极大，必须用直接路径加载提升性能，那需要先预处理CSV，把字段内部的换行符替换成空格，再导入：

比如用Python写个简单的预处理脚本（无需额外依赖，Python自带csv模块）：

import csv

# 读取原始CSV，处理字段内的换行
with open('E:test.csv', 'r', newline='', encoding='utf-8') as input_file, \
     open('E:test_clean.csv', 'w', newline='', encoding='utf-8') as output_file:
    reader = csv.reader(input_file)
    writer = csv.writer(output_file, quoting=csv.QUOTE_ALL)  # 保持字段的引号包裹
    
    for row in reader:
        # 替换所有类型的换行符为空格
        cleaned_cells = [cell.replace('\r\n', ' ').replace('\n', ' ').replace('\r', ' ') for cell in row]
        writer.writerow(cleaned_cells)

处理完成后，用test_clean.csv作为导入文件，你的原控制文件（带DIRECT=TRUE）就可以正常工作了。

额外注意事项

字段长度要设置足够大：比如CHAR(200)要能容纳处理后的最长字段内容，避免数据截断
换行符兼容性：不同系统的换行符不同（Windows是\r\n，Linux是\n），所以替换时要覆盖两种情况
引号转义：如果CSV里有转义的双引号（比如"He said ""Hi"""），OPTIONALLY ENCLOSED BY '"'会自动识别，不需要额外配置

内容的提问来源于stack exchange，提问作者DAVID_ROA