最简可行写法需设 CURLOPT_RETURNTRANSFER => true,否则 curl_exec() 仅返回 true/false 而不返回响应体;默认输出到屏幕,设该选项才返字符串。

PHP 用 cURL 拿远程文件内容,最简可行写法
直接用 curl_exec() 拿不到响应体?大概率是没设 CURLOPT_RETURNTRANSFER => true。默认它把结果直接输出到屏幕,curl_exec() 只返回 true 或 false。
function fetch_remote_content($url) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 关键:不输出,返字符串
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); // 自动跳转(如 302)
curl_setopt($ch, CURLOPT_TIMEOUT, 10); // 避免卡死
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36');
$content = curl_exec($ch);
$http_code = curl_getinfo($ch, CURLINFO_HTTP_CODE);
curl_close($ch);
return $http_code === 200 ? $content : false;
}
- 没设
CURLOPT_RETURNTRANSFER→ 返回true,但你看不见内容 -
CURLOPT_FOLLOWLOCATION在某些 PHP 环境(如 open_basedir 或 safe_mode)会被禁用,报错“Unable to follow redirects”,此时得手动解析Location头 - 别硬塞
file_get_contents($url)—— 它依赖allow_url_fopen=On,而很多生产环境已关掉
模拟浏览器行为,绕过基础反爬(User-Agent / Referer / Cookie)
很多接口会检查 User-Agent,甚至拒收空 Referer。cURL 能精准控制这些头,比 file_get_contents 灵活得多。
- 加
CURLOPT_REFERER:有些资源只允许从特定页面发起请求 - 带 Cookie:用
CURLOPT_COOKIE传字符串,或CURLOPT_COOKIEFILE+CURLOPT_COOKIEJAR维持会话 - 禁用 SSL 校验(仅测试):
CURLOPT_SSL_VERIFYPEER => false和CURLOPT_SSL_VERIFYHOST => false,线上千万别开
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'); curl_setopt($ch, CURLOPT_REFERER, 'https://example.com/'); curl_setopt($ch, CURLOPT_COOKIE, 'sessionid=abc123; theme=dark');
下载远程文件到本地磁盘,别用内存硬扛
想保存图片、PDF 这类二进制文件?别把整个文件读进变量再 file_put_contents —— 大文件容易 OOM。直接用 CURLOPT_FILE 流式写入。
- 先
fopen(..., 'w')打开目标文件句柄 - 设
CURLOPT_FILE为该句柄,cURL 自动把响应体写进去 - 记得
fclose(),否则文件可能不完整 - 若需进度反馈,加
CURLOPT_PROGRESSFUNCTION回调
$fp = fopen('/tmp/downloaded.pdf', 'w');
curl_setopt($ch, CURLOPT_FILE, $fp);
curl_exec($ch);
fclose($fp);
常见失败原因和快速排查点
返回空、超时、403、cURL 错误码?别急着重写逻辑,先看这几项:
立即学习“PHP免费学习笔记(深入)”;
-
curl_error($ch)—— 拿到具体错误,比如 “Could not resolve host” 或 “SSL certificate problem” -
curl_getinfo($ch)返回数组,重点关注http_code、redirect_url、size_download - 远程 URL 是 HTTP 还是 HTTPS?部分服务器对 TLS 版本敏感(如只支持 TLS 1.2+),可加
CURLOPT_SSLVERSION => CURL_SSLVERSION_TLSv1_2 - 对方是否做了 IP 限频?加
sleep(1)再试一次,看是不是被临时封了
真正难的不是怎么发请求,而是判断对方到底在拦什么:是头不对?Cookie 过期?还是 JS 渲染后才加载内容?cURL 解决不了后者。










