0

0

爬虫下载附件失败怎么办?

霞舞

霞舞

发布时间:2024-11-04 18:09:40

|

1108人浏览过

|

来源于php中文网

原创

爬虫下载附件失败怎么办?

爬虫下载附件遇到问题,无法下载附件

使用提供的代码爬取目标网站附件时,可能会遇到下载失败的问题。

问题原因

提供的代码在下载附件时使用了 requests.get 函数,该函数默认不会自动处理文件重定向。而目标网站的附件链接通常会重定向到实际的文件下载地址。因此,使用 requests.get 函数获取的响应并不是实际的文件内容。

SlidesAI
SlidesAI

使用SlidesAI的AI在几秒钟内创建演示文稿幻灯片

下载

解决方案

要解决这个问题,可以更改代码中下载附件的代码如下:

def download(fileName, url, path):
    """下载附件"""
    try:
        print('下载中,请耐心等待...')
        # 使用 `requests.head` 函数获取重定向后的文件下载地址
        res = requests.head(url, allow_redirects=True)
        # 将 `Location` 头中的重定向地址作为文件的实际下载地址
        url = res.headers['Location']
        # 使用 `requests.get` 函数获取文件内容
        r = requests.get(url)
        with open(path + fileName, "wb") as File:
            File.write(r.content)
        print(fileName, '下载Ok')
    except:
        print(fileName, '下载失败')

这样,代码将能够自动处理附件链接的重定向,并成功下载附件。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

78

2026.01.09

c++框架学习教程汇总
c++框架学习教程汇总

本专题整合了c++框架学习教程汇总,阅读专题下面的文章了解更多详细内容。

46

2026.01.09

学python好用的网站推荐
学python好用的网站推荐

本专题整合了python学习教程汇总,阅读专题下面的文章了解更多详细内容。

119

2026.01.09

学python网站汇总
学python网站汇总

本专题整合了学python网站汇总,阅读专题下面的文章了解更多详细内容。

11

2026.01.09

python学习网站
python学习网站

本专题整合了python学习相关推荐汇总,阅读专题下面的文章了解更多详细内容。

14

2026.01.09

俄罗斯手机浏览器地址汇总
俄罗斯手机浏览器地址汇总

汇总俄罗斯Yandex手机浏览器官方网址入口,涵盖国际版与俄语版,适配移动端访问,一键直达搜索、地图、新闻等核心服务。

71

2026.01.09

漫蛙稳定版地址大全
漫蛙稳定版地址大全

漫蛙稳定版地址大全汇总最新可用入口,包含漫蛙manwa漫画防走失官网链接,确保用户随时畅读海量正版漫画资源,建议收藏备用,避免因域名变动无法访问。

353

2026.01.09

php学习网站大全
php学习网站大全

精选多个优质PHP入门学习网站,涵盖教程、实战与文档,适合零基础到进阶开发者,助你高效掌握PHP编程。

42

2026.01.09

php网站搭建教程大全
php网站搭建教程大全

本合集专为零基础用户打造,涵盖PHP网站搭建全流程,从环境配置到实战开发,免费、易懂、系统化,助你快速入门建站!

12

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号