直接存中文会乱码,因sessionStorage只认UTF-8字节流而JS字符串为UTF-16,需用encodeURIComponent(JSON.stringify(value))存、decodeURIComponent()配合JSON.parse()读取。

直接用 sessionStorage.setItem() 存中文,读出来是乱码,不是浏览器 bug,而是你没处理编码——sessionStorage 只认 UTF-8 字节流,但原生 API 不自动编码,中文字符会以平台默认编码(如 GBK)被错误解释。
为什么直接存中文会乱码
Chrome、Firefox 等现代浏览器的 sessionStorage 底层按 UTF-8 存储,但 JavaScript 字符串本身是 UTF-16。当你传入中文字符串,比如 "你好",如果未显式编码就塞进去,某些旧版 WebView 或特定环境(如 Electron 早期版本)可能把 UTF-16 码元误当作 Latin-1 处理,导致取值时出现 "ä½ å¥½" 这类乱码。
更常见的情况是:你存了中文,读出来看似正常,但后续传给后端或拼接 URL 时出错——因为没统一编码逻辑,隐性问题更难排查。
用 encodeURIComponent + JSON.stringify 组合存取
这是最稳妥、兼容性最好(IE9+)、且不依赖第三方库的做法。核心思路:把任意 JS 值(含中文、对象、数组)先序列化为字符串,再用 encodeURIComponent() 转义成纯 ASCII 安全字符串,存入 sessionStorage;读取时反向解码 + JSON.parse() 还原。
立即学习“前端免费学习笔记(深入)”;
-
encodeURIComponent()保证所有非 ASCII 字符(包括中文、emoji、特殊符号)都转为%xx格式,彻底避开编码歧义 - 必须配合
JSON.stringify(),否则无法安全存储对象/数组;单纯对字符串用encodeURIComponent()也行,但扩展性差 - 不要用
encodeURI()—— 它不编码/ ? : @ & = + $ , #,在存复杂结构时会破坏 JSON 格式
const setSessionItem = (key, value) => {
try {
const encoded = encodeURIComponent(JSON.stringify(value));
sessionStorage.setItem(key, encoded);
} catch (e) {
console.error('sessionStorage set failed:', e);
}
};
const getSessionItem = (key) => {
try {
const item = sessionStorage.getItem(key);
if (!item) return null;
return JSON.parse(decodeURIComponent(item));
} catch (e) {
console.error('sessionStorage get failed:', e);
return null;
}
};
// 使用示例
setSessionItem('user', { name: '张三', city: '深圳' });
console.log(getSessionItem('user')); // { name: '张三', city: '深圳' }
遇到 decodeURIComponent 报错怎么办
典型错误:URIError: malformed URI sequence,说明存进去的内容被截断、损坏,或压根没用 encodeURIComponent 编码过。
- 检查是否混用了未编码的原始
setItem()—— 比如某次手动调用sessionStorage.setItem('x', '中文'),后续又用decodeURIComponent()去读,必然报错 - 确认没有跨域 iframe 或沙盒环境干扰:部分嵌入场景下
sessionStorage被禁用或隔离,写入静默失败 - 避免在
storage事件回调里直接调用decodeURIComponent():事件中的newValue是原始字符串,若之前没编码,这里解码就会崩 - 临时兜底:读取时加
try/catch,对失败项返回null或原始字符串(不推荐长期用)
不推荐的“捷径”及其风险
有人试过用 escape()(已废弃)、btoa(unescape(encodeURIComponent()))、甚至 Base64 编码,这些都多余且易出错。
-
escape()对 Unicode 支持极差,escape('你好')输出'%u4F60%u597D',而unescape()在现代浏览器中已被移除 - Base64 并不解决编码问题,只是二进制转码;若原始字符串编码不一致,Base64 后仍是乱码
- 依赖
TextEncoder/TextDecoder:虽然更底层,但 IE 完全不支持,且要额外处理Uint8Array,增加复杂度,没必要
真正需要关注的是:你是否统一了所有写入路径的编码方式。一个项目里混用原生存、encodeURIComponent 存、JSON.stringify 直存,比编码本身更容易引发乱码。










