如何用BeautifulSoup从指定div元素中提取a标签的href属性？

如何用BeautifulSoup从指定div元素中提取a标签的href属性？

阿华AIGC实验室

2026-5-9

如何从BeautifulSoup获取的div元素列表中提取a标签的href属性？

别担心，这一步其实很容易实现！你已经成功拿到了目标div元素的列表，接下来只需要遍历这些div，找到里面的<a>标签，再提取它的href属性就可以了。

分步实现代码

首先提醒下：最好不要用list作为变量名哦，因为它是Python的内置类型，容易引发混淆，我们把变量改成div_list会更规范：

# 先修正变量名（可选但推荐）
div_list = soup.find_all('div', attrs={'class':'icl-u-lg-hide'})

# 遍历每个div元素
for div in div_list:
    # 找到当前div下的第一个a标签
    a_tag = div.find('a')
    # 确保a标签存在的情况下提取href
    if a_tag:
        # 用get()方法安全获取属性，避免标签不存在时报错
        href_value = a_tag.get('href')
        print(href_value)
        # 如果需要收集所有href，可以添加到列表里
        # href_list.append(href_value)

更简洁的列表推导式写法

如果你确认每个目标div里都包含且仅包含一个<a>标签，或者想快速收集所有有效的href，可以用列表推导式：

div_list = soup.find_all('div', attrs={'class':'icl-u-lg-hide'})
href_list = [div.find('a').get('href') for div in div_list if div.find('a')]
# 现在href_list里就是所有提取到的链接了
print(href_list)

为什么用`get('href')`而不是直接`a_tag['href']`？

用get()方法会更安全：如果某个div里意外没有<a>标签，或者<a>标签没有href属性，get()会返回None而不会直接抛出错误，让你的代码更健壮。

内容的提问来源于stack exchange，提问作者borisvanax

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠