答案是使用JavaScript实现Markdown解析器,通过正则匹配标题、粗体、斜体、列表和段落,依次替换为对应HTML标签,最终输出HTML字符串。

实现一个简单的 Markdown 解析器,核心是将 Markdown 语法转换为对应的 HTML 标签。虽然完整的解析器很复杂,但用 JavaScript 可以轻松实现基础功能,比如标题、粗体、斜体、列表等。
1. 基本思路与结构
Markdown 是纯文本格式,通过特定符号表示格式。我们的目标是读取这些符号,并替换成 HTML 标签。
基本流程如下:
- 接收一段 Markdown 文本
- 逐行或通过正则表达式匹配语法模式
- 替换为对应的 HTML 标签
- 输出最终的 HTML 字符串
2. 处理常见语法
下面是一些常用语法的处理方式和对应正则表达式示例。
立即学习“Java免费学习笔记(深入)”;
标题(#)
使用正则匹配以 1-6 个 # 开头的内容:
text = text.replace(/^#{1,6}\s+(.+)$/gm, (match, content) => {
const level = match.trim().split(' ')[0].length;
return `${content} `;
});
粗体(text)和斜体(text)
注意顺序:先处理粗体,再处理斜体,避免嵌套干扰:
text = text.replace(/\*\*(.+?)\*\*/g, '$1'); text = text.replace(/\*(.+?)\*/g, '$1');
无序列表(- 或 *)
将每行以 - 或 * 开头的内容转为 li,并包裹在 ul 中:
const listItems = []; let inList = false;text = text.replace(/^[-*]\s+(.+)$/gm, (match, content) => { if (!inList) { inList = true; return
; } else { return\n
- ${content}
; } });${content} // 结束列表 if (inList) { text += '\n'; }
段落(普通文本行)
非空且未被其他规则匹配的行,用 p 标签包裹:
text = text.replace(/^(?!<[hu]).+$/gm, (line) => {
if (line.trim() && !line.startsWith('<')) {
return `${line}
`;
}
return line;
});
3. 完整简化版实现
把上述逻辑整合成一个函数:
function markdownToHtml(markdown) {
let html = markdown;
// 标题
html = html.replace(/^#{1,6}\s+(.+)$/gm, (match, content) => {
const level = match.trim().split(' ')[0].length;
return ${content} ;
});
// 粗体
html = html.replace(/**(.+?)**/g, '$1');
// 斜体
html = html.replace(/*(.+?)*/g, '$1');
// 列表(简单处理)
const lines = html.split('\n');
const result = [];
let inList = false;
for (let line of lines) {
if (/^[-]\s+(.+)$/.test(line)) {
const content = line.replace(/^[-]\s+/, '');
if (!inList) {
result.push('
- ');
inList = true;
}
result.push(
- ${content}
);
} else {
if (inList) {
result.push('${line}
);
} else {
result.push('');
}
}
}if (inList) { result.push(''); }
return result.join('\n'); }
4. 使用示例
测试一下:
const md = ` # 我的标题 这是**粗体**和*斜体*。 - 第一项 - 第二项 普通段落。 `;console.log(markdownToHtml(md)); // 输出 HTML 内容
基本上就这些。这个解析器适合学习和简单场景。如果需要支持链接、代码块、引用等更复杂语法,建议基于状态机或 AST 的方式重构,或者使用现成库如 marked 或 showdown。










