PHP中处理全角日期字符串需先转半角:可用str_replace映射替换、preg_replace_callback正则回调、mb_convert_kana日文兼容转换、自定义Unicode映射表遍历,或iconv编码转换辅助清洗,再统一格式化为ISO标准后解析。

如果您在PHP中接收到包含全角字符的日期字符串,例如“2023年12月25日”,则无法直接使用strtotime或DateTime类进行解析。以下是实现全角字符日期字符串转半角后再处理的多种方法:
一、使用str_replace逐个替换全角数字和符号
该方法通过预定义全角字符与对应半角字符的映射关系,利用str_replace批量替换,适用于已知固定格式且全角字符种类有限的场景。
1、定义全角数字及常用中文标点到半角的映射数组,包括“0”到“9”、“年”、“月”、“日”、“-”、“:”等。
2、调用str_replace,以全角字符数组为搜索项,半角字符数组为替换项,对原始字符串执行一次性替换。
立即学习“PHP免费学习笔记(深入)”;
3、替换完成后,使用trim去除首尾空白,并将“年”“月”“日”统一替换为“-”,构造标准ISO格式如“2023-12-25”。
4、调用DateTime::createFromFormat或strtotime解析标准化后的字符串。
二、使用正则表达式匹配并回调替换
该方法利用preg_replace_callback匹配所有Unicode全角数字(U+FF10–U+FF19)及常见全角标点,通过回调函数动态转换为对应半角ASCII字符,灵活性高且无需穷举映射表。
1、编写正则模式/[0-9\uFF21-\uFF3A\uFF41-\uFF5A\uFF0D\uFF1A\uFF0F\uFF0E]/u,覆盖全角数字、英文字母、短横线、冒号、斜杠、句点。
2、定义回调函数,对每个匹配到的字符获取其Unicode码点,减去全角与半角之间的固定偏移量65248(即0xFF10 - 0x30),再chr()转为ASCII字符。
3、对原始日期字符串执行preg_replace_callback,得到半角化结果。
4、进一步用str_replace将“年”“月”“日”分别替换为“-”“-”“”,并确保分隔符数量合规,避免多连横线。
三、使用mb_convert_kana进行日文环境兼容转换
该方法依赖PHP的mbstring扩展,调用mb_convert_kana函数,指定选项“as”可将全角数字、字母、空格、标点统一转为半角,特别适合混合日文/中文输入场景,但需注意其对中文“年月日”的处理需额外干预。
1、确认php.ini中已启用extension=mbstring,且mb_internal_encoding设置为UTF-8。
2、对原始字符串调用mb_convert_kana($str, 'as', 'UTF-8'),完成基础半角化。
3、单独处理残留的中文时间单位:使用str_replace将“年”→“-”、“月”→“-”、“日”→“”,并过滤多余空格。
4、验证结果是否符合date_create()可识别格式,若含“时”“分”“秒”,同步替换“时”→“:”、“分”→“:”、“秒”→“”。
四、构建自定义全角到半角映射表并循环遍历
该方法通过建立完整Unicode全角字符(U+FF01–U+FF5E)到半角(U+0021–U+007E)的映射表,逐字符判断并替换,确保覆盖全部ASCII可打印字符范围,鲁棒性强。
1、初始化空字符串$result,使用mb_strlen($str, 'UTF-8')获取字符数,进入for循环遍历每个字符。
2、用mb_substr($str, $i, 1, 'UTF-8')提取单个字符,调用mb_ord()获取其Unicode码点。
3、判断码点是否位于全角ASCII区间(65281–65374),若是,则减去65248得到对应半角码点,再用mb_chr()生成新字符;否则保留原字符。
4、拼接所有处理后字符,得到半角化字符串,再执行中文单位替换与格式规整。
五、使用iconv进行编码层面强制转换
该方法尝试利用iconv的//IGNORE与//TRANSLIT选项,在编码转换过程中触发字符近似映射,虽非专为全半角设计,但在部分系统环境下可辅助清除不可见全角控制符,需配合后续清洗步骤。
1、先用iconv('UTF-8', 'ASCII//IGNORE', $str)剥离非ASCII字符,观察是否残留关键日期信息。
2、若失败,则改用iconv('UTF-8', 'ASCII//TRANSLIT', $str),依赖系统locale支持,可能将“2”转为“2”,但结果不稳定。
3、对iconv输出结果再次应用str_replace处理“年月日”等中文单位,补全分隔结构。
4、使用DateTime::createFromFormat('Y-m-d', $cleaned)显式指定格式解析,避免strtotime因空格或异常字符失败。











