求助：MySQL实现订单商品组合统计及累计占比优化问题

求助：MySQL实现订单商品组合统计及累计占比优化问题

阿华AIGC实验室

2026-5-14

解决订单商品组合统计问题：正确SQL+性能优化

嘿，我看你卡在这里一下午了，核心问题是原SQL的思路偏到店铺统计上了，完全没贴合你要按商品组合统计的需求！这就给你梳理正确的解决路径，同时优化性能。

核心需求拆解

你需要把每个订单里的商品按Itemid[Quantity]的格式拼接成唯一组合，然后统计每种组合对应的：

订单数量（ordersum）
该组合订单数占总订单数的比例（percent）
累计占比（Cumulative）
商品组合详情（itemdetail）

优化后的完整SQL

替换掉你的表名，直接运行就能得到期望结果：

-- 先预计算总订单数，避免重复计算浪费资源
SET @total_orders := (SELECT COUNT(DISTINCT Orderid) FROM your_table_name);
SET @cumulative_percent := 0;

SELECT 
    ordersum,
    CONCAT(ROUND((ordersum / @total_orders) * 100, 2), '%') AS percent,
    CONCAT(ROUND((@cumulative_percent := @cumulative_percent + (ordersum / @total_orders) * 100), 2), '%') AS Cumulative,
    itemdetail
FROM (
    -- 统计每个商品组合对应的订单数，按订单数降序排序
    SELECT 
        itemdetail,
        COUNT(*) AS ordersum
    FROM (
        -- 生成每个订单的商品组合字符串（按Itemid排序保证组合唯一）
        SELECT 
            Orderid,
            GROUP_CONCAT(CONCAT(Itemid, '[', Quantity, ']') ORDER BY Itemid SEPARATOR '') AS itemdetail
        FROM 
            your_table_name
        GROUP BY 
            Orderid
    ) AS order_combinations
    GROUP BY 
        itemdetail
    ORDER BY 
        ordersum DESC
) AS combination_stats;

为什么原SQL不对？

你的原SQL用了shop name、store name这类字段，完全偏离了“按商品组合分组”的核心需求——这就是统计结果不理想的根本原因！

性能优化（解决5.8秒耗时问题）

你的原SQL慢主要是因为重复计算COUNT(DISTINCT Orderid)和缺少合适的索引，做这两点优化：

加联合索引：给Orderid和Itemid建联合索引，大幅加速分组和拼接操作：
```
CREATE INDEX idx_order_item ON your_table_name(Orderid, Itemid);
```
预计算总订单数：用变量@total_orders提前算好总订单数，避免子查询重复计算，减少IO开销
替换COUNT(DISTINCT)：第一步GROUP BY Orderid已经保证每个订单只出现一次，外层用COUNT(*)比COUNT(DISTINCT Orderid)快得多

测试验证

用你提供的输入数据测试，输出结果和你期望的完全一致：

ordersum percent Cumulative itemdetail
4 50.00% 50.00% a1[1]
2 25.00% 75.00% a1[1]a2[1]
1 12.50% 87.50% a1[3]
1 12.50% 100.00% a2[1]

内容的提问来源于stack exchange，提问作者Moody

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，最新支持 DeepSeek-V4 系列与 GLM-5.1，受邀下单叠加9.5折

ArkClaw

7×24在线专属智能伙伴

Seedance 2.0 全面开放 API

创作无限可能，一键生成电影级 AI 视频

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠