用C++实现最简CPU模拟器需三要素:寄存器数组、指令解码器、执行循环;结构体CPU含8个32位寄存器、字地址PC和4KB内存,step()完成取指→解码→执行→PC自增;指令编码统一4字节,操作码占高8位,寄存器/立即数占低24位;通过封装寄存器访问函数防越界;手动填入MOV/ADD机器码并单步验证R0结果即可确认链路打通。

怎么用 C++ 实现一个能跑加法指令的 CPU 核心
能跑最简指令(比如 ADD R0, R1, R2)的 CPU 模拟器,核心就三件事:寄存器数组、指令解码器、执行循环。不需要 MMU、中断、流水线——先让 PC 动起来,R0 算出结果,就算成功。
关键不是“全功能”,而是把取指 → 解码 → 执行 → 更新 PC 这条链路打通。下面这个结构体就是最小可行状态机:
struct CPU {
uint32_t regs[8] = {}; // R0–R7,统一用 uint32_t 避免符号扩展干扰
uint32_t pc = 0; // 当前指令地址,从 0 开始
uint32_t memory[1024] = {}; // 简单内存,4KB,按字寻址
void step() {
uint32_t inst = memory[pc]; // 取指(假设小端、指令字长 4 字节)
uint8_t op = (inst >> 24) & 0xFF;
uint8_t rd = (inst >> 16) & 0xFF;
uint8_t rs = (inst >> 8) & 0xFF;
uint8_t rt = inst & 0xFF;
if (op == 0x01) { // ADD 指令:0x01 rd rs rt
regs[rd] = regs[rs] + regs[rt];
}
pc++; // 顺序执行,无跳转
}
};
注意:pc 是字地址(不是字节地址),所以 memory[pc] 直接取指令;如果改用字节地址,就得 memory[pc / 4],但容易出错,初学建议统一用字地址模型。
指令编码怎么设计才不容易混淆
手写指令集时,别一上来就搞 RISC-V 那种字段对齐。简单模拟器用「操作码在高字节 + 三寄存器编号」就够用,例如:
立即学习“C++免费学习笔记(深入)”;
-
0x01 r0 r1 r2→ADD R0, R1, R2 -
0x02 r0 imm→MOV R0, #imm(这里imm占 1 字节,范围 0–255) -
0x03 r0 r1→CMP R0, R1(只设标志位,不存结果)
所有指令固定 4 字节长度,靠高位操作码区分类型,低位按需分配。这样解码时不用判断变长,(inst >> 24) 总是操作码,(inst & 0xFF) 总是最后一个字段——写错位移或掩码是新手最高频错误,宁可牺牲密度也要保确定性。
避免用负数 immediate 或符号扩展:初版先只支持无符号立即数,等加法、跳转都稳了再加 SIGN_EXTEND 逻辑。
寄存器状态机怎么防止意外覆盖和越界
寄存器不是裸数组,要加访问控制。直接暴露 regs[8] 容易因索引错写成 regs[10] 导致静默内存破坏。推荐封装成带检查的访问函数:
uint32_t get_reg(int idx) {
if (idx < 0 || idx >= 8) {
throw std::runtime_error("register index out of range: " + std::to_string(idx));
}
return regs[idx];
}
void set_reg(int idx, uint32_t val) {
if (idx < 0 || idx >= 8) {
throw std::runtime_error("register index out of range: " + std::to_string(idx));
}
regs[idx] = val;
}
实际运行时可以关掉检查(用宏开关),但开发阶段必须开。另外,PC 和 SP(栈指针)建议单独声明为成员变量,不塞进 regs[],避免误当通用寄存器用。比如你写了 ADD PC, R1, R2,模拟器不会报错,但真实行为完全失控。
怎么验证 CPU 真的在“执行”而不是空转
最简单的验证方式:写一段 3 行机器码,手动填进 memory[],然后单步调用 step(),打印寄存器变化。
例如这段代码想实现 R0 = 10 + 20:
cpu.memory[0] = 0x0200000A; // MOV R0, #10 → op=0x02, rd=0, imm=10
cpu.memory[1] = 0x02010014; // MOV R1, #20 → op=0x02, rd=1, imm=20
cpu.memory[2] = 0x01000001; // ADD R0, R0, R1 → op=0x01, rd=0, rs=0, rt=1
cpu.pc = 0;
cpu.step(); printf("R0=%u\n", cpu.regs[0]); // → 10
cpu.step(); printf("R1=%u\n", cpu.regs[1]); // → 20
cpu.step(); printf("R0=%u\n", cpu.regs[0]); // → 30
如果第三步输出不是 30,立刻检查:指令字节序是否反了?pc 是不是没自增?ADD 的寄存器字段是不是取错了位?这类验证比写测试框架更直接有效——CPU 模拟器的 bug 几乎都卡在位操作和地址映射上,而不是算法逻辑。
真正难的不是加法,是让 JMP 能跳、BEQ 能判零、内存读写不出错。这些全得靠同样粒度的手动验证推进,别指望一上来就载入 ELF 文件运行。











