如何在PostgreSQL中提取分隔符分隔的字符串数据并赋值给变量

阿华AIGC实验室

2026-5-15

在PostgreSQL中实现分隔字符串拆分与变量赋值

嘿，我来帮你搞定这个问题！你需要把分隔符分隔的字符串（不管是逗号、空格还是固定长度格式）拆分成单独的值并赋值给不同变量，PostgreSQL提供了好几种灵活的方法，我分场景给你详细说明：

1. 直接在SQL查询中提取单个值

如果只是想在查询里快速拆分字符串并获取各个部分，用split_part()函数最直接——它专门用来按分隔符提取指定位置的子串，语法是split_part(目标字符串, 分隔符, 位置序号)（注意PostgreSQL里位置从1开始）。

示例1：逗号分隔字符串

比如你给出的'data1,data2,data3,data4'，可以这样提取：

SELECT
  split_part('data1,data2,data3,data4', ',', 1) AS var,
  split_part('data1,data2,data3,data4', ',', 2) AS list,
  split_part('data1,data2,data3,data4', ',', 3) AS comment,
  split_part('data1,data2,data3,data4', ',', 4) AS result;

示例2：空格分隔字符串（处理连续空格）

如果是像DB2例子里的空格分隔输入，且可能存在多个连续空格，先通过regexp_replace()把多空格替换成单个，再拆分：

SELECT
  split_part(regexp_replace('data1  data2 data3   data4', '\s+', ' ', 'g'), ' ', 1) AS var,
  split_part(regexp_replace('data1  data2 data3   data4', '\s+', ' ', 'g'), ' ', 2) AS list,
  split_part(regexp_replace('data1  data2 data3   data4', '\s+', ' ', 'g'), ' ', 3) AS comment,
  split_part(regexp_replace('data1  data2 data3   data4', '\s+', ' ', 'g'), ' ', 4) AS result;

2. 在PL/pgSQL中赋值给变量

如果是写存储过程、函数或者匿名块，需要把拆分后的值赋值给变量，有两种常用方式：

方式一：先转数组再赋值

用string_to_array()把字符串转成数组，再通过数组下标直接取值：

DO $$
DECLARE
  input_str TEXT := 'data1,data2,data3,data4';
  str_arr TEXT[];
  var TEXT;
  list TEXT;
  comment TEXT;
  result TEXT;
BEGIN
  -- 把字符串拆分成数组
  str_arr := string_to_array(input_str, ',');
  
  -- 逐个赋值给变量
  var := str_arr[1];
  list := str_arr[2];
  comment := str_arr[3];
  result := str_arr[4];
  
  -- 可选：打印验证结果
  RAISE NOTICE 'var: %, list: %, comment: %, result: %', var, list, comment, result;
END $$;

方式二：用SELECT ... INTO一次性赋值

更简洁的写法，直接通过SELECT语句把拆分结果批量赋值给变量：

DO $$
DECLARE
  var TEXT;
  list TEXT;
  comment TEXT;
  result TEXT;
BEGIN
  SELECT
    split_part('data1,data2,data3,data4', ',', 1),
    split_part('data1,data2,data3,data4', ',', 2),
    split_part('data1,data2,data3,data4', ',', 3),
    split_part('data1,data2,data3,data4', ',', 4)
  INTO var, list, comment, result;
  
  RAISE NOTICE 'var: %, list: %, comment: %, result: %', var, list, comment, result;
END $$;

3. 处理固定长度格式字符串（对应DB2的PIC定义）

如果你的输入是固定长度的结构化字符串（像DB2里用PIC X(n)定义的固定字段），PostgreSQL可以直接用substring()函数截取指定位置的子串，完全对应COBOL里的字段拆分逻辑。

比如DB2里的RECORD定义：

01 RECORD.
10 RECORD-A PIC X(02) VALUE SPACES.
10 WS-FILLER PIC X(01) VALUE SPACES.
10 RECORD-B PIC X(05) VALUE SPACES.
10 WS-FILLER PIC X(01) VALUE SPACES.
10 RECORD-C PIC X(03) VALUE SPACES.
10 WS-FILLER PIC X(01) VALUE SPACES.
01 INPUT-RECORD PIC X(13).

对应的PostgreSQL截取代码：

SELECT
  substring('ab cd123 ef ' FROM 1 FOR 2) AS record_a, -- 前2位
  substring('ab cd123 ef ' FROM 4 FOR 5) AS record_b, -- 跳过第3位的空格，取接下来5位
  substring('ab cd123 ef ' FROM 10 FOR 3) AS record_c; -- 跳过第9位的空格，取接下来3位

如果是在PL/pgSQL里赋值：

DO $$
DECLARE
  input_record TEXT := 'ab cd123 ef '; -- 长度13的固定格式字符串
  record_a TEXT;
  record_b TEXT;
  record_c TEXT;
BEGIN
  record_a := substring(input_record FROM 1 FOR 2);
  record_b := substring(input_record FROM 4 FOR 5);
  record_c := substring(input_record FROM 10 FOR 3);
  
  RAISE NOTICE 'record_a: %, record_b: %, record_c: %', record_a, record_b, record_c;
END $$;

内容的提问来源于stack exchange，提问作者Vishal D