Django大文件下载超时问题求助：Django Channels实现方案待优化

阿华AIGC实验室

2026-5-22

我懂你现在的困扰——当初用DRF处理大数据序列化下载时动不动就超时，转用Django Channels解决了超时问题，但现在的实现实在太粗糙，肯定还有不少可以优化的地方。我来分享几个更靠谱的思路，帮你把这个流程打磨得更顺畅：

1. 用Celery+Channels结合，规范异步任务与实时通知

直接在Channels消费者里处理序列化和文件生成很容易阻塞worker，不如把核心耗时逻辑丢给Celery异步任务，Channels只负责和前端做实时交互：

前端发起请求后，后端启动Celery任务，同时返回唯一的任务ID给前端，前端用这个ID绑定WebSocket连接
Celery任务执行过程中，通过Channels定期向用户推送进度（比如“已处理30%数据”），让用户知道后台在干活
任务完成/失败时，通过Channels推送下载URL或者错误信息，体验比单纯返回URL友好得多

2. 优化临时文件的生命周期管理

随便把文件丢在目录里迟早会出问题，得给临时文件加一套管理规则：

用Django的FileSystemStorage指定专门的临时文件目录，给每个文件生成唯一文件名（比如UUID+用户ID），避免冲突
给临时文件设置过期时间（比如24小时），用Celery定时任务定期清理过期文件，防止磁盘被占满
如果是敏感数据，给下载URL加签名验证，只有生成文件的用户能访问，而且URL过期后自动失效

3. 优化序列化与文件生成的性能

大数据序列化本身也可能拖慢速度，这些小技巧能帮你提速：

不要一次性把所有数据加载到内存，用Django的iterator(chunk_size=1000)分批查询数据库，边查边写文件，减少内存占用
用ujson替代Python默认的json模块，序列化速度能提升不少
如果数据不是实时更新的，可以考虑预生成文件（比如每天凌晨定时生成），用户请求时直接返回现成文件，服务器压力会小很多

简单代码示例参考

Celery异步任务（核心逻辑）

from celery import shared_task
from django.core.files.storage import default_storage
import ujson
from channels.layers import get_channel_layer
from asgiref.sync import async_to_sync
from myapp.models import MyModel
from myapp.serializers import MyModelSerializer

@shared_task(bind=True)
def generate_download_file(self, user_id, filter_params):
    # 分批获取数据
    queryset = MyModel.objects.filter(**filter_params).iterator(chunk_size=1000)
    total_count = MyModel.objects.filter(**filter_params).count()
    # 生成唯一文件路径
    file_path = f"temp_downloads/{user_id}_{self.request.id}.json"

    # 边查边写入文件
    with default_storage.open(file_path, 'w') as f:
        f.write('[')
        is_first = True
        processed_count = 0
        
        for obj in queryset:
            if not is_first:
                f.write(',')
            # 序列化单条数据并写入
            ujson.dump(MyModelSerializer(obj).data, f)
            is_first = False
            processed_count += 1
            
            # 每处理1000条推送一次进度
            if processed_count % 1000 == 0:
                progress = int((processed_count / total_count) * 100)
                async_to_sync(get_channel_layer().send)(
                    f"user_{user_id}",
                    {
                        "type": "download.progress",
                        "progress": progress,
                        "task_id": self.request.id
                    }
                )
        f.write(']')

    # 任务完成，推送下载链接
    download_url = default_storage.url(file_path)
    async_to_sync(get_channel_layer().send)(
        f"user_{user_id}",
        {
            "type": "download.complete",
            "download_url": download_url,
            "task_id": self.request.id
        }
    )
    return download_url

Channels WebSocket消费者

from channels.generic.websocket import AsyncWebsocketConsumer
import json

class DownloadProgressConsumer(AsyncWebsocketConsumer):
    async def connect(self):
        self.user_id = str(self.scope['user'].id)
        self.group_name = f"user_{self.user_id}"

        # 加入用户专属分组
        await self.channel_layer.group_add(
            self.group_name,
            self.channel_name
        )
        await self.accept()

    async def disconnect(self, close_code):
        # 离开分组
        await self.channel_layer.group_discard(
            self.group_name,
            self.channel_name
        )

    # 处理进度推送
    async def download_progress(self, event):
        await self.send(text_data=json.dumps({
            'action': 'progress',
            'task_id': event['task_id'],
            'progress': event['progress']
        }))

    # 处理完成推送
    async def download_complete(self, event):
        await self.send(text_data=json.dumps({
            'action': 'complete',
            'task_id': event['task_id'],
            'download_url': event['download_url']
        }))

这样调整后，整个流程会更健壮，用户能看到实时进度，临时文件也不会混乱，出错了也能及时给用户反馈。

内容的提问来源于stack exchange，提问作者David Pekker