抖音短链需通过JS跳转,服务端请求仅获含JS的HTML而无法执行跳转;PHP可用正则提取JS中的URL并解码校验,但遇混淆或反爬时应调用Puppeteer等浏览器环境解析。

抖音短链接为什么不能直接用 file_get_contents 或 cURL 获取跳转目标?
因为抖音的短链(如 https://v.douyin.com/iSxYabc/)本质是前端 JS 跳转,服务端返回的 HTML 中不包含真实 URL,而是内嵌一段 JS 执行 window.location.href 或 location.replace()。直接发 HTTP 请求只会拿到含跳转逻辑的 HTML,不会触发 JS 重定向。
用 PHP 模拟浏览器行为提取真实跳转地址的可行方案
核心思路:获取响应头中的 Location(适用于 301/302),或解析 HTML 中的 JS 跳转逻辑(适用于 200 + JS)。抖音目前主要用后者,需提取 JS 字符串里的 URL。
- 先用
cURL获取页面 HTML,务必设置CURLOPT_FOLLOWLOCATION => false,否则 cURL 会自动跟随跳转,拿不到原始 HTML - 用正则匹配 JS 中的跳转目标,常见模式:
location\.href\s*=\s*["']([^"']+)["']或window\.location\.replace\(["']([^"']+)["']\) - 注意 URL 可能被编码(如
%3A%2F%2F),需用urldecode()解码后再filter_var(..., FILTER_VALIDATE_URL)校验 - 部分页面会混淆跳转逻辑(如拼接字符串、base64、setTimeout 延迟),此时需更复杂的 JS 解析,PHP 原生不推荐硬解,应改用带 JS 执行能力的工具(见下一条)
$shortUrl = 'https://v.douyin.com/iSxYabc/';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $shortUrl);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false); // 关键:禁用自动跳转
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (iPhone; CPU iPhone OS 16_0 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/15E148 MicroMessenger/8.0.46(0x18002e37) NetType/WIFI Language/zh_CN');
$html = curl_exec($ch);
curl_close($ch);
// 提取 location.href = "xxx"
if (preg_match('/location\.href\s*=\s*["\']([^"\']+)["\']/i', $html, $matches)) {
$realUrl = urldecode($matches[1]);
if (filter_var($realUrl, FILTER_VALIDATE_URL)) {
echo $realUrl;
}
}
更可靠的方法:调用 Puppeteer / Playwright 的 HTTP API(PHP 调用)
当遇到动态生成、混淆、防爬验证(如验证码、滑块)时,纯 PHP 正则基本失效。此时应交由真正浏览器环境处理。
- 本地起一个 Puppeteer 服务(如
browserless/chromeDocker 镜像),暴露 HTTP 接口 - PHP 用
file_get_contents或cURLPOST 到http://localhost:3000/execute,传入脚本:await page.goto("https://v.douyin.com/xxx/", { waitUntil: "networkidle0" }); return page.url(); - 注意:抖音可能检测非真实用户行为,
USERAGENT、accept-language、禁用headless(或使用--no-sandbox)都影响成功率 - 不要在生产环境裸跑无沙箱 Chrome,优先选 browserless、Rendertron 等封装服务
还原分享链接中的关键参数(如 modal_id、share_source、share_uid)
抖音分享页 URL(如 https://www.douyin.com/video/73xxxx?modal_id=73xxxx&share_source=copy_link)中,modal_id 是视频唯一 ID,share_source 表示分享渠道,这些参数通常保留在最终跳转后的 URL query string 中。
立即学习“PHP免费学习笔记(深入)”;
- 先还原出完整 URL(见上文),再用
parse_url()+parse_str()提取 query 参数 -
modal_id一般对应视频 ID,可直接用于调用抖音开放平台接口(如有权限) -
share_uid和share_user_id不一定稳定存在,部分分享链路会抹除,不可依赖 - 注意:URL 中可能含多个
?(如?from=xxx?modal_id=...),需先清理非法 query 分隔符再解析
$parsed = parse_url($realUrl); parse_str($parsed['query'] ?? '', $queryParams); $videoId = $queryParams['modal_id'] ?? null; $shareSource = $queryParams['share_source'] ?? 'unknown';抖音短链还原不是单纯的 HTTP 跳转问题,它混合了前端路由、反爬策略和动态渲染。正则能应付简单场景,但一旦页面结构变化或加入轻量混淆,就容易失效。真正稳定的方案,得接受「用浏览器跑 JS」这个事实——PHP 本身不执行 JS,别试图在服务端完全模拟。











