PHP接收POST XML数据需用file_get_contents('php://input')读取原始流,因$_POST不解析XML;解析时注意UTF-8编码、BOM、命名空间和CDATA处理,推荐DOMDocument配合SimpleXML或XPath提取。

PHP怎么接收POST过来的XML原始数据
PHP默认不会自动解析XML格式的请求体,$_POST 为空,必须手动读取原始输入流。常见于第三方接口(如微信支付回调、银行网关通知)推送的XML数据。
关键点:不能依赖 $_POST,要从 php://input 读取;且需确保 Content-Type 是 text/xml 或 application/xml(否则部分Nginx/PHP-FPM配置会截断)。
-
file_get_contents('php://input')是最稳妥方式,适用于所有POST XML场景 - 避免用
$HTTP_RAW_POST_DATA(PHP 5.6+ 已废弃,7.0+ 移除) - 若用 cURL 测试,记得加头:
-H "Content-Type: text/xml"
$xmlString = file_get_contents('php://input');
if (empty($xmlString)) {
http_response_code(400);
exit('No XML data received');
}
simplexml_load_string() 解析失败的常见原因
这是最常用的XML转对象方法,但极易因编码、命名空间或格式错误而返回 false,且不报错——只静默失败。
- XML字符串必须是UTF-8编码,含BOM会导致解析失败(可用
trim($xmlString, "\xEF\xBB\xBF")去BOM) - 含命名空间(如
)时,simplexml_load_string()默认忽略前缀,需用->children('soap', true)显式访问 - 根节点含属性(如
)时,属性需用->attributes()单独取,不能当子元素访问 - 空标签(
)会被转成空对象,不是空字符串,判空要用!isset($node->{''})或强制转字符串再 trim
把SimpleXMLElement转成普通数组的可靠写法
SimpleXML对象不能直接 json_encode 或 print_r 出完整结构,必须递归转换。PHP自带的 json_decode(json_encode($obj), true) 虽快但有坑:
立即学习“PHP免费学习笔记(深入)”;
- 丢失XML属性(如
中的- abc
id会消失) - 同名多节点(如多个
)会被覆盖为单个,除非手动包裹成数组 - 数字索引标签(如
val0>)在 json_encode 后键名会丢失
更稳的方式是手写递归函数,显式处理属性和子节点:
function xml_to_array($xmlObject) {
$array = [];
foreach ($xmlObject->children() as $key => $value) {
$children = $value->children();
$attrs = $value->attributes();
if (count($children) === 0 && count($attrs) === 0) {
$array[$key] = (string)$value;
} else {
$array[$key] = [
'_value' => (string)$value,
'_attrs' => array_map('strval', (array)$attrs),
'_children' => xml_to_array($value)
];
}
}
return $array;
}
遇到CDATA内容被忽略或转义怎么办
SimpleXML 默认会把 当作普通文本节点,但有时会意外丢掉或变成空字符串,尤其在嵌套或混合文本节点时。
- 确保XML字符串本身未被PHP其他函数(如
htmlspecialchars)提前转义过 - 用
libxml_disable_entity_loader(false)(PHP 8.0+ 已移除该函数,无需调用) - 更可靠做法:先用
DOMDocument加载,它对 CDATA 支持更完整,再转 SimpleXML
$dom = new DOMDocument(); $dom->loadXML($xmlString); $xmlObj = simplexml_import_dom($dom); $array = xml_to_array($xmlObj);实际项目中,XML结构越复杂(多层嵌套、混合CDATA、动态命名空间),越建议用
DOMDocument + XPath 定位取值,而不是强求一步转数组。很多“解析失败”问题,根源不在解析逻辑,而在没看清原始XML的真实结构。











