PHP中json_encode中文乱码或转义的解决方法包括:一、源文件保存为UTF-8无BOM;二、对ISO-8859-1数据用utf8_encode()转换;三、使用JSON_UNESCAPED_UNICODE选项;四、用mb_convert_encoding()统一转码;五、设置header('Content-Type: application/json; charset=utf-8')。

如果您在使用 PHP 的 json_encode() 函数处理包含中文的数组或对象时,输出结果中中文显示为 Unicode 转义序列(如 \u4f60\u597d)或直接出现乱码,则可能是由于字符编码不一致或未正确声明 UTF-8 编码所致。以下是解决此问题的步骤:
一、确保源文件保存为 UTF-8 无 BOM 格式
PHP 脚本文件本身的编码必须为 UTF-8 无 BOM,否则 json_encode() 在解析字符串时可能因字节流异常导致转义错误或输出不可见字符。
1、用支持编码设置的编辑器(如 VS Code、Notepad++、PhpStorm)打开 PHP 文件。
2、在编辑器中查找“编码”或 “Encoding” 选项。
立即学习“PHP免费学习笔记(深入)”;
3、将文件编码显式更改为 UTF-8 无 BOM(UTF-8 without BOM)。
4、保存文件并重新运行 json_encode() 测试输出。
二、对输入数据执行 utf8_encode()(仅适用于 ISO-8859-1 源数据)
若原始中文字符串来自非 UTF-8 编码环境(例如旧系统返回的 GBK 或 ISO-8859-1 字节流),需先转换为 UTF-8 再传入 json_encode();但该方法仅适用于已知源编码为 ISO-8859-1 的场景,不可盲目套用。
1、检查原始字符串编码:使用 mb_detect_encoding($str, ['UTF-8', 'GBK', 'ISO-8859-1'], true) 判断。
2、若检测结果为 ISO-8859-1,且确认数据实际含中文,则调用 $utf8_str = utf8_encode($str)。
3、将 $utf8_str 放入待编码数组中,再执行 json_encode()。
三、使用 JSON_UNESCAPED_UNICODE 选项
json_encode() 默认会将非 ASCII 字符(包括中文)转义为 \uXXXX 形式,启用该标志可强制保留原始 UTF-8 字节,使中文以明文形式出现在 JSON 字符串中。
1、构造待编码的数据,例如 $data = ['name' => '张三', 'city' => '上海']。
2、调用 json_encode($data, JSON_UNESCAPED_UNICODE)。
3、确认输出为 {"name":"张三","city":"上海"},而非 {"name":"\u5f20\u4e09","city":"\u4e0a\u6d77"}。
四、统一使用 mb_convert_encoding() 强制转码
当不确定输入字符串编码或存在混合编码时,可借助 mb_convert_encoding() 统一转为目标编码 UTF-8,避免 json_encode() 因编码识别失败而报错或静默截断。
1、获取原始字符串 $str。
2、执行 $safe_utf8 = mb_convert_encoding($str, 'UTF-8', 'UTF-8, GBK, BIG5, ISO-8859-1')。
3、将 $safe_utf8 赋值给数组字段,再传入 json_encode()。
4、注意末尾参数中列出多种常见编码,mb_convert_encoding 会按顺序尝试识别并转换,优先匹配靠前的编码。
五、设置 PHP 输出和 HTTP 头为 UTF-8
即使 json_encode() 输出正确,若响应头未声明 UTF-8,浏览器或客户端仍可能按默认编码(如 GBK)解析 JSON 字符串,造成显示乱码。
1、在输出 JSON 前添加 header('Content-Type: application/json; charset=utf-8')。
2、确保该 header 在任何输出(包括空格、BOM、echo)之前调用。
3、若使用框架或模板引擎,检查其是否覆盖了 Content-Type 设置,必要时强制重置。










