如何提升Derby数据库的插入效率？附stop_times表结构说明

如何提升Derby数据库的插入效率？附stop_times表结构说明

阿华AIGC实验室

2026-5-25

提升Derby数据库stop_times表插入速度的实用方案

针对你提到的stop_times表（带自增主键、多个非空字段和Check约束），结合我平时优化Derby批量插入的经验，分享几个能有效提速的方向：

1. 优先用批量插入替代单条插入

Derby处理单条INSERT的事务开销、日志写入成本很高。建议改成批量插入语法：

INSERT INTO stop_times (feed_id, trip_id, arrival_time, departure_time, stop_id, stop_sequence, stop_headsign, pickup_type, drop_off_type)
VALUES 
(1, 'trip_001', '08:00:00', '08:00:00', 'stop_001', 1, 'Downtown', '0', '0'),
(1, 'trip_001', '08:05:00', '08:05:00', 'stop_002', 2, 'Downtown', '0', '0'),
-- 批量添加更多行
;

如果用JDBC代码，直接用addBatch() + executeBatch()方法，批量大小建议测试1000-5000条（根据你的内存情况调整），比单条插入速度能提升数倍。

2. 临时禁用索引与约束（插入后恢复）

你的表有主键索引（stop_times_id）和pickup_type的Check约束，每次插入时Derby都要维护索引、检查约束规则，这会拖慢速度。如果是一次性导入大量数据，可以：

先调整自增主键并删除主键约束：

-- 先把自增字段改成手动赋值
ALTER TABLE stop_times ALTER COLUMN stop_times_id NOT GENERATED;
-- 删除主键约束
ALTER TABLE stop_times DROP PRIMARY KEY;

删除Check约束：先查询约束名，再执行删除：

SELECT CONSTRAINTNAME FROM SYS.SYSCONSTRAINTS WHERE TABLENAME='STOP_TIMES' AND TYPE='C';
-- 假设查到约束名是SQL123456789012345
ALTER TABLE stop_times DROP CONSTRAINT SQL123456789012345;

导入完成后，再重新恢复主键和约束：

ALTER TABLE stop_times ALTER COLUMN stop_times_id GENERATED BY DEFAULT AS IDENTITY (START WITH 1, INCREMENT BY 1);
ALTER TABLE stop_times ADD PRIMARY KEY (stop_times_id);
ALTER TABLE stop_times ADD CONSTRAINT pickup_type_check CHECK (pickup_type IN ('','0','1','2','3')) NOT NULL DEFAULT '0';

3. 调整Derby内存与性能参数

通过JVM参数调整Derby的运行配置，减少IO瓶颈：

增大页缓存：-Dderby.storage.pageCacheSize=20000（单位是页，默认4KB一页，可根据服务器内存调整，比如1GB内存可设到200000）
临时关闭事务持久性：-Dderby.system.durability=test（此参数会跳过日志刷盘，速度提升明显，但生产环境绝对禁用，仅适合一次性导入）
优化日志写入：-Dderby.infolog.append=true（避免频繁创建日志文件，减少IO开销）

4. 合理控制事务大小

不要把所有插入放在一个超大事务里（容易导致内存溢出、锁等待），也不要每条插入都单独提交（事务开销太大）。建议每插入1000-5000条就提交一次事务，比如JDBC代码示例：

// 伪代码示例
int batchSize = 2000;
int count = 0;
connection.setAutoCommit(false);
for (StopTime st : stopTimesList) {
    stmt.addBatch(...); // 添加数据到批量任务
    count++;
    if (count % batchSize == 0) {
        stmt.executeBatch();
        connection.commit();
    }
}
// 提交剩余未批量的数据
stmt.executeBatch();
connection.commit();

5. 使用NOLOG模式（极端场景）

如果是一次性导入且数据可以重新生成，可以临时设置Derby为无日志模式：

CALL SYSCS_UTIL.SYSCS_SET_DATABASE_PROPERTY('derby.database.logFile', 'none');

导入完成后记得改回正常模式：

CALL SYSCS_UTIL.SYSCS_SET_DATABASE_PROPERTY('derby.database.logFile', 'derby.log');

⚠️ 注意：这个模式下如果数据库崩溃，数据会全部丢失，只适合非关键数据的一次性导入。

内容的提问来源于stack exchange，提问作者paulh

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，最新支持 DeepSeek-V4 系列与 GLM-5.1，受邀下单叠加9.5折

ArkClaw

7×24在线专属智能伙伴

Seedance 2.0 全面开放 API

创作无限可能，一键生成电影级 AI 视频

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠