使用pdfmake通过JSON结构生成语义化PDF,定义标题、段落、列表和表格等内容节点,配合样式与元数据设置,确保文档结构清晰、可访问性强,优于纯坐标绘图方式。

要通过JavaScript生成符合语义的PDF文档,关键在于结构化内容与样式分离,同时确保输出的PDF具备清晰的层级和可读性。虽然浏览器环境不原生支持PDF创建,但借助成熟的库可以实现语义化输出。
选择合适的PDF生成库
目前最常用且支持语义化内容的库是 jsPDF 配合 html2canvas 或 pdfmake。其中:
- jsPDF + html2canvas:适合将已有HTML结构转换为PDF,保留标题、段落、列表等语义标签的视觉表现。
- pdfmake:更推荐用于语义化生成,它使用JSON结构描述内容,天然支持标题、文本、表格、列表等语义节点。
{
content: [
{ text: '第一章 引言', style: 'header' },
{ text: '这是介绍性段落,说明文档目的。', style: 'paragraph' },
{ ul: ['项目背景', '目标用户', '技术选型'] },
{ text: '数据对比表', style: 'subheader' },
{ table: { headers: ['指标', '数值'], body: [['响应时间', '200ms'], ['成功率', '99.8%']] } }
],
styles: {
header: { fontSize: 18, bold: true, margin: [0, 10, 0, 10] },
subheader: { fontSize: 14, bold: true, margin: [0, 10, 5, 5] },
paragraph: { fontSize: 10, margin: [0, 5, 0, 10] }
}
}
保持内容语义结构
无论使用哪种工具,都要避免仅用位置偏移绘制文本。应模拟标准文档结构:
- 用标题层级(h1-h6 对应不同级别)组织章节
- 段落使用块级文本而非连续drawText调用
- 列表使用有序或无序结构,而非手动加“•”符号
- 表格应保持行列关系,支持屏幕阅读器识别
嵌入元数据提升可访问性
语义不仅体现在内容排列,还包括文档元信息。在生成PDF时添加:
立即学习“Java免费学习笔记(深入)”;
- 标题(title)、作者(author)、关键词(keywords)
- 语言声明(如Lang = "zh-CN"),帮助辅助技术正确朗读
- 书签(pdfmake支持tocItem)实现导航目录
基本上就这些。重点是把PDF当成“可读文档”而非“图片快照”来生成,优先使用结构化API,避免纯坐标绘图。这样产出的PDF才真正符合语义化原则,便于检索、阅读和长期维护。










