短链接还原本质是手动追踪HTTP重定向。需用HEAD请求获取Location头,禁用自动跳转,递归解析直至200状态或达最大跳转次数,注意处理相对URL、meta刷新、JS跳转及反爬限制。

短链接不能“解码”——它本质上不是加密或编码,而是服务端的 301 或 302 重定向。所谓“手动还原”,其实是模拟一次 HTTP 请求,拿到响应头里的 Location 字段。
为什么 file_get_contents() 拿不到跳转目标?
PHP 默认的 file_get_contents() 和 curl_init()(未配置)都不会自动跟随重定向,返回的是跳转响应本身(HTTP 状态码 301/302),而不是最终页面内容。你看到空内容、404 或短链服务商的中间页,大概率是卡在这一步。
实操建议:
- 用
curl并开启CURLOPT_FOLLOWLOCATION,但注意:某些主机禁用该选项(如部分共享虚拟主机) - 手动解析
Location响应头更可控,也绕过open_basedir或allow_url_fopen限制 - 务必设置超时(
CURLOPT_TIMEOUT)、User-Agent(防被拦截)和最大跳转次数(防死循环)
纯 PHP 手动追踪跳转(无 curl 扩展?用 stream_context_create())
如果服务器没开 curl,也能用原生 file_get_contents() 配合自定义 context 实现——关键是禁用自动跳转,再手动读取并复用 Location 头。
立即学习“PHP免费学习笔记(深入)”;
示例逻辑:
- 发起 HEAD 请求(比 GET 更轻,多数短链服务支持)
- 检查响应状态码是否为
301、302、307、308 - 从
$http_response_header中提取Location:行 - 递归处理,直到状态码变为
200或达到最大跳转次数(如 5 次)
$url = 'https://t.co/abc123';
$max_redirects = 5;
$redirect_count = 0;
while ($redirect_count < $max_redirects) {
$context = stream_context_create([
'http' => [
'method' => 'HEAD',
'header' => "User-Agent: Mozilla/5.0 (X11; Linux x86_64)\r\n",
'timeout' => 5,
'ignore_errors' => true,
'max_redirects' => 0, // 关键:禁用自动跳转
]
]);
$content = @file_get_contents($url, false, $context);
if ($content === false) break;
$location = null;
foreach ($http_response_header as $h) {
if (stripos($h, 'Location:') === 0) {
$location = trim(substr($h, 9));
break;
}
}
if (!$location || !preg_match('/^https?:\/\//', $location)) break;
$url = $location;
$redirect_count++;
}
echo $url;
常见短链服务的特殊处理点
不是所有短链都老老实实返回标准 Location。有些会:
- 返回
200+ 页面内含(如早期百度短链),需解析 HTML 提取content属性 - 返回 JS 跳转:
window.location.href = "...",需正则匹配(不推荐,易误判) - 要求带 Referer 或特定 Cookie(如微博短链),否则返回 403 或跳回首页
- 对高频请求限速或返回验证码(如 is.gd、tinyurl 的某些接口)
所以,单纯靠一次 HEAD 就想 100% 还原所有短链,不现实。真实场景中,先试 Location,失败再降级到 GET + HTML 解析,并加随机延时。
最常被忽略的是跳转链中的相对 URL(如 Location: /path?x=1)——必须用 http_build_url() 或手动拼接 base host,否则下一轮请求会 404。











