如何使用Java从Workupload、Google Drive等文件托管平台下载文件—

如何使用Java从Workupload、Google Drive等文件托管平台下载文件——解决无法获取直接下载链接的问题

阿华AIGC实验室

2026-4-27

解决方案

你遇到的核心问题有两个：一是代码没处理HTTP重定向，二是这类平台会验证请求是否来自真实浏览器（拒绝无标识的爬虫请求）。下面给你分步解决的方案：

1. 修复代码：处理重定向+模拟浏览器请求

URL.openStream()默认不自动跟进HTTP重定向（比如3xx跳转），而且没有携带浏览器标识，平台会直接拒绝或者引导到无效链接。改用HttpURLConnection可以解决这两个问题：

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.net.HttpURLConnection;
import java.net.URL;
import java.nio.channels.Channels;
import java.nio.channels.ReadableByteChannel;

public class FileDownloader {
    public static void downloadFile(String fileUrl, File dataFile) {
        if (!dataFile.exists()) {
            HttpURLConnection conn = null;
            try {
                URL targetUrl = new URL(fileUrl);
                conn = (HttpURLConnection) targetUrl.openConnection();
                
                // 开启自动重定向（显式设置更稳妥，避免默认配置差异）
                conn.setInstanceFollowRedirects(true);
                // 模拟Firefox浏览器的请求头，让平台认为是真实用户访问
                conn.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:115.0) Gecko/20100101 Firefox/115.0");
                
                // 可选：打印最终跳转后的真实下载链接，方便调试
                System.out.println("真实下载链接：" + conn.getURL());
                
                ReadableByteChannel byteChannel = Channels.newChannel(conn.getInputStream());
                try (FileOutputStream fos = new FileOutputStream(dataFile)) {
                    fos.getChannel().transferFrom(byteChannel, 0, Long.MAX_VALUE);
                    System.out.println("文件下载完成！");
                }
            } catch (IOException e) {
                e.printStackTrace();
            } finally {
                if (conn != null) {
                    conn.disconnect();
                }
            }
        }
    }
}

2. 更简洁的Java 11+方案：用内置HttpClient

如果你的项目用Java 11或更高版本，推荐用官方的HttpClient，它对重定向的处理更智能，代码也更简洁：

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URI;
import java.net.http.HttpClient;
import java.net.http.HttpRequest;
import java.net.http.HttpResponse;

public class ModernDownloader {
    public static void downloadFile(String fileUrl, File dataFile) {
        if (!dataFile.exists()) {
            HttpClient client = HttpClient.newBuilder()
                    .followRedirects(HttpClient.Redirect.NORMAL) // 自动处理所有合法重定向
                    .build();
            
            HttpRequest request = HttpRequest.newBuilder()
                    .uri(URI.create(fileUrl))
                    .header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:115.0) Gecko/20100101 Firefox/115.0")
                    .build();
            
            try {
                HttpResponse<InputStream> response = client.send(request, HttpResponse.BodyHandlers.ofInputStream());
                try (FileOutputStream fos = new FileOutputStream(dataFile);
                     InputStream in = response.body()) {
                    in.transferTo(fos); // Java 9+支持的便捷方法
                    System.out.println("文件下载完成！");
                }
            } catch (IOException | InterruptedException e) {
                e.printStackTrace();
            }
        }
    }
}

3. 关于直接下载链接的注意事项

从开发者工具拿到的链接大多是临时有效的，这类平台会给下载链接加时效或会话验证：

Workupload：需要先访问网页链接，服务器会生成带会话Cookie的临时下载链接。如果要自动化获取，得先模拟访问网页，保存Cookie后再请求下载链接。
Google Drive：公开文件可以直接构造下载链接，比如把https://drive.google.com/file/d/FILE_ID/view改成https://drive.google.com/uc?export=download&id=FILE_ID，但大文件可能需要处理验证页面（需要携带Cookie或请求参数）。