• python3爬虫初探(四)之文件保存


      接着上面的写,抓取到网址之后,我们要把图片保存到本地,这里有几种方法都是可以的。

      #-----urllib.request.urlretrieve-----

      

    import urllib.request
    
    imgurl = 'http://img.ivsky.com/img/tupian/t/201411/01/xiaohuangren_tupian-007.jpg'#前面获取网址中的一个。
    urllib.request.urlretrieve(imgurl, 'F:\Techonolgoy\Python\file\s.jpg')
    #这里urlretrieve有两个参数,第一个是图片网址;第二个是文件路径,注意'是\'。如果不指定路径(s.jpg)即默认保存在当前文件夹下(.py所在文件夹)

      #------open.write------

    import requests

    imgurl = 'http://img.ivsky.com/img/tupian/t/201411/01/xiaohuangren_tupian-007.jpg'
    f = open('s.jpg', 'wb')#这里open的两个参数,前者同样是路径,后者是文件的打开模式,这里选择'wb'代表以二进制的格式写入
    imgdata = requests.get(imgurl).content#这里需要获取图片的二进制源码
    f.write(imgdata)#写入二进制源码到文件
    f.close()#关闭文件,如果没有这一步,则文件不能成功保存到本地。

      #------with open-------------

      相比open来说,with有一个优点就是不用close(),其写入后自动关闭。

    import requests
    
    imgurl = 'http://img.ivsky.com/img/tupian/t/201411/01/xiaohuangren_tupian-007.jpg'
    imgdata = requests.get(imgurl).content
    with open('s.jpg', 'wb') as f:
    	f.write(imgdata)
    

      

  • 相关阅读:
    Linux常用命令
    全文搜索服务器solr
    非关系型数据库之redis
    springMVC流程
    浅谈spring框架的控制反转和依赖注入
    Java基础之数组
    Java基础之方法
    跨域访问接口,传递参数
    Centos 6无法使用yum
    内网穿透工具:钉钉HTTP内网穿透使用与讲解
  • 原文地址:https://www.cnblogs.com/buzhizhitong/p/5616248.html
Copyright © 2020-2023  润新知