
本文详解在 python 中将数据库返回的 `yyyy-mm-dd hh:mm:ss` 类型字符串(如 `'2024-01-26 00:39:24'`)安全、准确地解析并格式化为符合 xml sitemap `
在构建 Python 网站地图(sitemap.xml)时,
2024-01-26T00:39:24+03:30 或 2024-01-26T00:39:24Z。
而 MySQL 的 TIMESTAMP() 函数默认返回形如 '2024-01-26 00:39:24' 的无时区字符串——它不包含时区信息,也不能直接调用 .isoformat() 方法。因此,需先解析为带时区的 datetime 对象,再标准化输出。
✅ 推荐方案:使用 dateutil.parser(最健壮)
from dateutil import parser import datetime # 假设这是从数据库 fetchone() 得到的时间字符串 db_timestamp = "2024-01-26 00:39:24" # 步骤 1:解析字符串为 naive datetime(无时区) dt_naive = parser.parse(db_timestamp) # 步骤 2:赋予本地时区(自动检测系统时区),并去掉微秒 dt_local = dt_naive.astimezone().replace(microsecond=0) # 步骤 3:生成 ISO 8601 字符串(含本地时区偏移) iso_lastmod = dt_local.isoformat() print(iso_lastmod) # 输出示例:2024-01-26T00:39:24+03:30
⚠️ 注意:parser.parse() 默认将无时区字符串解释为本地时间(非 UTC),这通常符合大多数 Web 应用场景(如 CMS 内容更新时间按服务器本地时间记录)。若数据库实际存储的是 UTC 时间,请改用:dt_utc = dt_naive.replace(tzinfo=datetime.timezone.utc) iso_lastmod = dt_utc.astimezone().replace(microsecond=0).isoformat()
? 替代方案(纯标准库,需已知格式)
若确定输入格式恒定且无需容错,可用 datetime.strptime():
from datetime import datetime import time s = "2024-01-26 00:39:24" dt = datetime.strptime(s, "%Y-%m-%d %H:%M:%S") dt_local = dt.astimezone().replace(microsecond=0) print(dt_local.isoformat()) # 同样输出 ISO 8601 带时区格式
但该方式对格式错误零容忍(如多空格、毫秒、不同分隔符会直接抛 ValueError),生产环境建议优先使用 dateutil.parser。
✅ 最佳实践建议
- ✅ 安装依赖:pip install python-dateutil
- ✅ 在 sitemap 生成逻辑中统一封装转换函数:
def to_iso8601(timestamp_str: str) -> str: return parser.parse(timestamp_str).astimezone().replace(microsecond=0).isoformat() - ✅ 若需强制 UTC(如部署在多时区服务器),显式指定时区:
from datetime import timezone dt_utc = parser.parse(timestamp_str).replace(tzinfo=timezone.utc) return dt_utc.isoformat().replace("+00:00", "Z") # 输出如:2024-01-26T00:39:24Z - ❌ 避免手动拼接字符串(如 "T" 和 "+"),易出错且不兼容夏令时。
正确转换后,你即可将结果安全写入 sitemap XML:
https://example.com/page 2024-01-26T00:39:24+03:30
符合 Google sitemap 规范 与 W3C 日期时间标准。










