Python中feedparser的published_parsed与updated

Python中feedparser的published_parsed与updated_parsed区别及使用咨询

阿华AIGC实验室

2026-5-15

关于feedparser中published_parsed和updated_parsed的使用问题

首先得先搞清楚这两个字段的由来——它们其实对应不同的Feed规范：

RSS规范里通常用published（对应published_parsed）来表示内容的首次发布时间；
Atom规范则更常用updated（对应updated_parsed）来标记内容的最后更新时间。
但很多Feed源并不完全严格遵循规范，有的只提供其中一个字段，所以做fallback处理是完全必要的。

你的代码能正常运行，但其实有优化空间。直接用try-except会捕获所有异常（比如item本身是None、或者其他意外错误），可能会导致不符合预期的返回。更稳妥的写法是用getattr来精准检查属性是否存在：

def get_publishing_date(item):
    return getattr(item, 'published_parsed', item.updated_parsed)

这个写法只会在item没有published_parsed属性时才返回updated_parsed，不会误吞其他异常，安全性更高。

很遗憾，feedparser本身并没有提供一个统一的字段来直接获取“发布/更新时间”。它的设计是尽量保留原Feed的字段结构，同时做一些基础的解析规范化，但这种跨规范的字段统一逻辑，还是需要开发者自己来实现fallback。

内容的提问来源于stack exchange，提问作者mircealungu

模型自由，工具不限，最新支持 DeepSeek-V4 系列与 GLM-5.1，受邀下单叠加9.5折

7×24在线专属智能伙伴

创作无限可能，一键生成电影级 AI 视频

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠