如何使用Edge浏览器结合Selenium绕过Cloudflare以实现YouTube音频下载？

阿华AIGC实验室

2026-4-14

看起来你现在面临两个核心问题：一是pytubefix无法处理YouTube Music的链接，二是用Selenium+Edge访问在线下载器时被Cloudflare的反爬机制拦截了。我来一步步给你拆解解决思路：

一、先搞懂你加的那个Edge配置参数

你用到的--disable-blink-features=AutomationControlled其实是用来关闭浏览器的自动化控制标记的——默认情况下，Selenium启动的浏览器会在navigator.webdriver这个JS属性里暴露自己是自动化工具，Cloudflare就是靠这个快速识别机器人的。这个参数能把这个属性隐藏掉，确实是反指纹的基础操作，但光靠这一个还不够。

二、强化Selenium的反检测能力（绕过Cloudflare）

Cloudflare的检测不止看navigator.webdriver，还会检查浏览器的其他指纹特征（比如窗口大小、渲染参数、行为模式等）。你可以给Edge添加更多配置，进一步伪装成真实用户：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.edge.options import Options
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time

options = Options()
# 核心：隐藏自动化控制标记，避免被Cloudflare直接识别
options.add_argument("--disable-blink-features=AutomationControlled")
# 禁用浏览器扩展，减少特殊指纹特征
options.add_argument("--disable-extensions")
# 关闭沙箱模式，避免暴露自动化环境
options.add_argument("--no-sandbox")
# 启动时最大化窗口，模拟真实用户的使用习惯
options.add_argument("--start-maximized")
# 禁用GPU渲染，统一浏览器渲染特征
options.add_argument("--disable-gpu")
# 伪装成真实Edge浏览器的User-Agent（可以从自己的Edge浏览器中复制真实UA）
user_agent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36 Edg/125.0.0.0"
options.add_argument(f"user-agent={user_agent}")
# 禁用密码自动保存和表单填充，减少差异化特征
options.add_experimental_option("prefs", {
    "credentials_enable_service": False,
    "profile.password_manager_enabled": False
})

# 初始化Edge驱动
driver = webdriver.Edge(options=options)
# 模拟用户打开页面后的等待时间
time.sleep(2)
driver.get('https://yt1ss.pro/en199/youtube-to-mp3')

# 待下载的YouTube Music链接
url = 'https://music.youtube.com/watch?v=OwONpOi6RYE'

# 模拟真实用户的操作：点击输入框→等待→粘贴链接
input_box = driver.find_element(By.XPATH, '//*[@id="txt-url"]')
input_box.click()
time.sleep(0.5)
input_box.send_keys(url)

# 点击提交按钮
submit_btn = driver.find_element(By.XPATH, '//*[@id="btn-submit"]')
submit_btn.click()

# 用显式等待替代implicitly_wait，更稳定且符合用户行为
# 等待下载选项加载完成（最长等10秒）
WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.XPATH, '//*[@id="mp4"]/table/tbody/tr[2]/td[3]/button'))
)
# 点击转换/下载按钮
driver.find_element(By.XPATH, '//*[@id="mp4"]/table/tbody/tr[2]/td[3]/button').click()

# 等待最终下载链接可点击
WebDriverWait(driver, 10).until(
    EC.element_to_be_clickable((By.XPATH, '//*[@id="A_downloadUrl"]'))
)
driver.find_element(By.XPATH, '//*[@id="A_downloadUrl"]').click()

另外，关于你提到的cloudscraper：它是一个专门绕过Cloudflare的HTTP请求库，不需要依赖Selenium。你可以用它直接向在线下载器发送请求、获取真实下载链接，再用普通的HTTP库下载，这样能完全避开浏览器指纹检测。大致思路是：先获取页面的必要参数（比如CSRF Token），再构造提交视频链接的请求，最后从返回结果里解析出下载地址（具体参数需要根据在线下载器的实际接口调整）。

三、解决YouTube Music链接无法下载的问题

你遇到的pytubefix.exceptions.VideoUnavailable错误，大概率是因为pytubefix对YouTube Music的页面结构支持不足，或者该视频有特殊版权限制。试试这两个方案：

转换链接格式：YouTube Music的视频ID和普通YouTube通用，把链接中的music.youtube.com替换成youtube.com，再传给pytubefix试试，很多情况下能直接解决问题。
换用更强大的工具：比如yt-dlp，它对YouTube生态的所有链接（包括YouTube Music）支持更全面，还自带反爬机制。安装后可以这样使用：

import yt_dlp

# 配置下载参数：下载最佳音质音频，转成MP3格式
ydl_opts = {
    'format': 'bestaudio/best',
    'postprocessors': [{
        'key': 'FFmpegExtractAudio',
        'preferredcodec': 'mp3',
        'preferredquality': '192',
    }],
}
with yt_dlp.YoutubeDL(ydl_opts) as ydl:
    ydl.download(['https://music.youtube.com/watch?v=OwONpOi6RYE'])