如何用Python/BeautifulSoup编写替换HTML标签并保留属性的函数？

如何用Python/BeautifulSoup编写替换HTML标签并保留属性的函数？

阿华AIGC实验室

2026-5-20

嘿，这个问题我之前做项目时也碰到过——要替换HTML标签还得保留所有属性，确实有点坑。不过用BeautifulSoup完全能搞定，而且方法还挺直接的，我给你捋捋：

用BeautifulSoup实现标签替换（保留属性）

核心思路其实很简单：创建新的目标标签，把原标签的所有属性原封不动复制过去，再把原标签的子节点转移到新标签里，最后替换掉原标签就行。

具体代码示例

比如我们要把所有<div>标签替换成<section>，同时完整保留class、id、data-*这类属性：

from bs4 import BeautifulSoup

def replace_html_tags(soup, original_tag, target_tag):
    # 遍历所有需要替换的标签
    for tag in soup.find_all(original_tag):
        # 创建新的目标标签
        new_tag_element = soup.new_tag(target_tag)
        # 复制原标签的全部属性
        new_tag_element.attrs = tag.attrs.copy()
        # 把原标签的子节点（文本、嵌套标签等）全部移到新标签中
        for child_node in tag.contents:
            new_tag_element.append(child_node)
        # 用新标签替换掉原标签
        tag.replace_with(new_tag_element)

# 测试一下
test_html = """
<div class="content-wrapper" id="page-main" data-theme="dark">
    <p>这是一段测试内容</p>
    <div class="sidebar">侧边栏内容</div>
</div>
"""
soup = BeautifulSoup(test_html, 'html.parser')
replace_html_tags(soup, 'div', 'section')
print(soup.prettify())

运行这段代码后，所有<div>都会变成<section>，原有的class、id、data-theme属性一个都不会丢，子节点也完全保留。

一些实用细节

如果需要对属性做额外修改（比如给新标签加个额外的class），可以在复制属性后单独处理：new_tag_element['class'].append('added-class')
要是你的HTML结构比较复杂，建议用lxml作为解析器（把html.parser换成lxml），速度更快，对畸形HTML的兼容性也更好。

有没有替代工具？

其实BeautifulSoup已经足够健壮了，毕竟是Python生态里处理HTML解析的老牌工具。如果你的需求更复杂（比如批量替换多种标签、处理XML文档），可以考虑：

lxml：和BeautifulSoup配合使用就行，不用改核心逻辑，只是解析器换一下，处理大文档更高效。
PyQuery：语法和jQuery几乎一致，熟悉前端的话上手很快，比如替换标签可以这么写：pq('div').replaceWith(lambda i: pq(f'<{target_tag}>').attr(pq(this).attr()))，不过学习成本比BeautifulSoup高一点。

总的来说，用BeautifulSoup写个自定义函数是最直接、易维护的方案，完全能满足你的需求。

内容的提问来源于stack exchange，提问作者Robert Townley

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠