• django 配合 正则 爬取图片


    1.首先安装 django 

      我这里采用的是 pycharm 安装

      打开 pycharm编辑器  file->settings ->project:mysite ->Project Interpreter

      双击 pip 

      

    即可安装完成。

    第二种方式是 在命令行中  pip install Django

    如果出现如上图所示,表示我们已经安装成功了,只是我们要把这个目录加在环境变量里

    初始化程序 

      cmd>django-admin startproject mysite

      

    程序目录

    各文件作用:
    • settings.py--配置文件

    • urls.py--路由由控制

    • wsgi.py--用那种wsgi方式(wsgi或者uwsgi)

    • templates--html模板

    • manage.py--主程序,启动程序

    注意:不要轻易更改项目的名称,涉及的地方太多。
    还有其他目录:

    app--项目里的一个扩展,可以有多个,如前台和后台

      

    创建app目录

    cmd> python manage.py startapp blog

    app目录--项目里的一个扩展,可以有多个,如前台和后台

    --models.py,对数据库进行操作

    --views.py,视图,函数

    --tests.py,测试用

    --admin.py,后台管理程序  http://127.0.0.1:8000/admin/

    接下来我们要在urls.py里定义路由控制

    from django.conf.urls import url
    from django.contrib import admin
    from blog import views #导入视图控制器

    urlpatterns = [
    url(r'^admin/', admin.site.urls),
    url(r"^cur_time",views.cur_time),
    url(r"^userInfo", views.userInfo),
    url(r"^showTeachers", views.showTeachers) #我们重点关注这个
    ]

    views.py页面

    from django.shortcuts import render,HttpResponse
    
    from django.contrib.staticfiles.urls import staticfiles_urlpatterns   #设置静态资源所需 请查看本博客相关页面
    from django.contrib import staticfiles   #设置静态资源所需 请查看本博客相关页面
    
    # Create your views here.def showTeachers(request):
        import urllib.request
        import re
    
        response = urllib.request.urlopen("http://www.miaov.com/index.php/about/index") #请求页面
        page = response.read()
        page = page.decode('utf-8')   #设置字符集
    
        imageList = re.findall("http://att.miaov.com/pic/.*d", page)  #查找所有图片
        teachers = re.findall("<h3>(.*)</h3>", page)                    #查找所有姓名
        levels = re.findall('<div class="text">(.*)</div>', page)      #查找所有级别
    
        j = 0
        for i in imageList:
            imgUrl = i
            urllib.request.urlretrieve(imgUrl, 'E:/mysite/static/images/%d.jpg' % j) # 先把图片下载到本地
            j += 1
    
        teachersList = []
        for i in range(0, len(imageList)):  #组装数据
            teachersList.append({'img': '/static/images/%d.jpg' % i, 'name': teachers[i], 'level': levels[i]})
    
        return render(request, "showTeachers.html",{"teachersList":teachersList})  # render视图

    在templates 中创建 

    showTeachers.html
    内容如下
    <!DOCTYPE html>
    <html lang="en">
    <head>
        <meta charset="UTF-8">
        <title>show teachers</title>
    </head>
    <body>
    <table border="1" style="text-align: center">
        <tr>
            <td>img</td>
            <td>name</td>
            <td>level</td>
        </tr>
        {% for item in teachersList %}
            <tr>
                <td><img style=" 50%" src="{{ item.img }}" alt=""></td>
                <td>{{ item.name }}</td>
                <td>{{ item.level }}</td>
            </tr>
        {% endfor %}
    
    </table>
    </body>
    </html>

    启动项目

  • 相关阅读:
    对万网主机全部使用独立Ip的猜疑
    对windows8在PC上的前景不看好
    漂浮广告代码3
    <!DOCTYPE> 标签一点点问题
    wordpress模板中用到的条件判断语句例1
    不错的漂浮广告代码2
    autoRST Automated TCP RST Exploit
    菜单项说明以提示弹出
    JIRA安装和破解
    谈组装对象以及对象生存期管理
  • 原文地址:https://www.cnblogs.com/vsmart/p/7845322.html
Copyright © 2020-2023  润新知