• Django 聚合与查询集API实现侧边栏


    本文从Django官方文档总结而来,将聚合的主要用法和查询集的常见方法做一归纳。

    聚合

    1. 聚合的产生来源于django数据库查询,通常我们使用django查询来完成增删查改,但是有时候需要更复杂的方法才能完成对数据的提取、筛选、更改,所以需要一组对象聚合来完成这种操作。模型举例如下:

    from django.db import models
    
    class Author(models.Model):
        name = models.CharField(max_length=100)
        age = models.IntegerField()
    
    class Publisher(models.Model):
        name = models.CharField(max_length=300)
        num_awards = models.IntegerField()
    
    class Book(models.Model):
        name = models.CharField(max_length=300)
        pages = models.IntegerField()
        price = models.DecimalField(max_digits=10, decimal_places=2)
        rating = models.FloatField()
        authors = models.ManyToManyField(Author)
        publisher = models.ForeignKey(Publisher)
        pubdate = models.DateField()
    
    class Store(models.Model):
        name = models.CharField(max_length=300)
        books = models.ManyToManyField(Book)
        registered_users = models.PositiveIntegerField()
    View Code

     根据给出的模型,先引入三个例子:

    # Total number of books.
    >>> Book.objects.count()
    2452
    
    # Total number of books with publisher=BaloneyPress
    >>> Book.objects.filter(publisher__name='BaloneyPress').count()
    73
    >>> from django.db.models import Avg
    >>> Book.objects.all().aggregate(Avg('price'))
    {'price__avg': 34.35}

    注意几个点: .all() 和 .filter()    和  .count() 和 .aggregate() 为方法,前两者是返回新的查询集的方法(括号里面有参数),后两者是不返回查询集的方法 。 publisher 显然为字段名, name为字段查找,两者之间以双下划线连接 :__       price也是字段名,Avg 为聚合函数,用来求平均值。 以上提及的方法字段查找聚合函数将在查询集API中介绍。那么,我们先介绍聚合。

    2.django提供了两种生成聚合的方法

    1)从整个查询集生成统计值,主要用法:aggregate(*args, **kwargs)

     aggregate()QuerySet 的一个终止子句,也就是说aggregate返回一个字典,包含根据QuerySet 计算得到的聚合值(平均数、和等等)。aggregate() 的每个参数指定返回的字典中将要包含的值。eg:

    Book.objects.all()  # 返回所有图书的集合
    >>> from django.db.models import Avg # 引入用来求平均值的聚合函数 Avg >>> Book.objects.all().aggregate(Avg('price')) # 要计算所有书的平均价格,通过在查询集后面附加aggregate()子句实现 {'price__avg': 34.35} # 返回的是字典 >>> Book.objects.aggregate(Avg('price')) # all()在这里多余,可以省掉 {'price__avg': 34.35} # 返回的字典中,键为聚合值的标识符,由字段和聚合函数的名称自动生成 ,值为计算出来的聚合值


    >>> Book.objects.aggregate(average_price=Avg('price'))
    {'average_price': 34.35} # 为聚合值更换名称,提供参数average_price

    >>> from django.db.models import Avg, Max, Min # 生成了不止一个聚合
    >>> Book.objects.aggregate(Avg('price'), Max('price'), Min('price'))
    {
    'price__avg': 34.35, 'price__max': Decimal('81.20'), 'price__min': Decimal('12.99')}

    2)为查询集的每一项成聚合,主要用法:annotate(*args, **kwargs)

    这种方法为每一个对象都生成一个独立的汇总值比如,如果你在检索一列图书,你可能想知道每一本书有多少作者参与。每本书和作者是多对多的关系。我们想要汇总QuerySet.中每本书里的这种关系。逐个对象的汇总结果可以由annotate()子句生成。annotate()子句被指定之后,QuerySet中的每个对象都会被注上特定的值。这些注解的语法都和aggregate()子句所使用的相同。annotate()的每个参数都描述了将要被计算的聚合。

    # Build an annotated queryset
    >>> from django.db.models import Count
    >>> q = Book.objects.annotate(Count('authors')) # 和aggregate语法相同,不同的是annotate返回的q是各个对象,可用q[0],q[1]等取出对象
    # Interrogate the first object in the queryset
    >>> q[0]  # 返回的是第一个Book对象
    <Book: The Definitive Guide to Django>
    >>> q[0].authors__count   # 编写第一本书的作者数目为2, authors为Book模型中的字段名,count为字段查询,所以用双下划线连接
    2
    # Interrogate the second object in the queryset
    >>> q[1]  # 返回的是第二个Book对象
    <Book: Practical Django Projects>
    >>> q[1].authors__count
    1
    
    >>> q = Book.objects.annotate(num_authors=Count('authors'))  # 提供了自定义的num_authors别名代替了authors__count
    >>> q[0].num_authors
    2
    >>> q[1].num_authors
    1

    与 aggregate() 不同的是, annotate() 不是一个终止子句。annotate()子句的返回结果是一个查询集 (QuerySet);这个 QuerySet可以用任何QuerySet方法进行修改,包括 filter()order_by()。发现aggregate 和 annotate用法的区别了吗,再次举例如下(在聚合函数中指定聚合字段时,Django 允许你使用同样的 双下划线 表示关联关系,):

    >>> from django.db.models import Max, Min
    >>> Store.objects.annotate(min_price=Min('books__price'), max_price=Max('books__price'))
    # 查找每个商店提供的图书的价格范围
    >>> Store.objects.aggregate(min_price=Min('books__price'), max_price=Max('books__price')) # 查找所有书店中最便宜的书和最贵的书的价格
    >>> Store.objects.aggregate(youngest_age=Min('books__authors__age'))
    # 利用双下划线延伸关系链,查找所有书店中的所有作者的最小年龄

    3. 聚合和其他查询子句

    filter() 和 exclude()

    >>> from django.db.models import Count, Avg
    >>> Book.objects.filter(name__startswith="Django").annotate(num_authors=Count('authors'))
    # 使用annotate() 子句时,过滤器有限制注解对象的作用。例如,得到每本以 "Django" 为书名开头的图书作者的总数
    >>> Book.objects.filter(name__startswith="Django").aggregate(Avg('price')) # 使用aggregate()子句时,过滤器有限制聚合对象的作用。例如,算出所有以 "Django" 为书名开头的图书平均价格

    >>> Book.objects.annotate(num_authors=Count('authors')).filter(num_authors__gt=1)
    # 得到不止一个作者的图书

    注意以上annotate() 和 filter()子句的顺序,顺序不同查询结果也会不同(后者筛选的出版商为前者的子集。):

    >>> Publisher.objects.annotate(num_books=Count('book')).filter(book__rating__gt=3.0)
    # 返回了至少出版了一本好书(评分大于 3 分)的出版商, 在这些出版商中包含出版商所发行的所有图书!(这些出版商中每个出版商只要发行过一本>3的书就算)
    >>> Publisher.objects.filter(book__rating__gt=3.0).annotate(num_books=Count('book'))
    # 返回了至少出版了一本好书(评分大于 3 分)的出版商, 在这些出版商中只含有发行过好书的出版商!(这些出版商中每个出版商发行的所有书评分都必须>3)

    order_by()

    >>> Book.objects.annotate(num_authors=Count('authors')).order_by('num_authors') # 根据每本书的作者数量多少进行排序

    values()

    >>> Author.objects.annotate(average_rating=Avg('book__rating'))
    # 返回所有作者及他所著图书的平均评分
    >>> Author.objects.values('name').annotate(average_rating=Avg('book__rating'))
    # 作者先按名称分组,意味着若两位作者同名则查询结果被合并!,两者均分被算为一个

    >>> Author.objects.annotate(average_rating=Avg('book__rating')).values('name', 'average_rating')

    # 这段代码交换了value和average顺序,将给每个作者添加一个唯一的字段,但只有作者名称和average_rating 注解会返回在输出结果中
    
    

    4.查询集(QuerySet)API 查询

    本质上,可以创建、过滤、切片和传递查询集而不用真实操作数据库。在你对查询集做求值之前,不会发生任何实际的数据库操作。可以通过迭代、切片、序列化/缓存、repr()、len()、list()、bool()

    1)返回新的查询集方法

    filter(): 返回一个新的QuerySet,包含与给定的查询参数匹配的对象。

    exclude():返回一个新的QuerySet,它包含不满足给定的查找参数的对象。

    annotate(*args, **kwargs): 使用提供的查询表达式Annotate查询集中的每个对象。
    order_by(*fields):  默认情况下,QuerySet 根据模型Meta 类的ordering 选项排序。你可以使用order_by 方法给每个QuerySet 指定特定的排序。
    ...

    QuerySet API参考

    tricks: 利用聚合解决博客中增加点击排行和站长推荐侧边栏的方法:

    views.py:

     # 点击排行
      click_list = Article.objects.all().order_by('-click_count')
    
     # 站长推荐
      command_list = Article.objects.filter(is_recommend__isnull=False)

    base.html:

        <div  class="bd bd-news">
         <ul>
           {% for article in article_comment_list %}
           <li><a href="/" target="_blank">{{ article.title }}</a></li>
           {% endfor %}
         </ul>
       </div>
    <div class="bd bd-news"> <ul> {% for article in command_list %} <li><a href="/" target="_blank">{{ article.title }}</a></li> {% endfor %} </ul>
    </div>

    final:

  • 相关阅读:
    【程序员日记】快乐的一周嘛(第7期)(财富、快乐、技术)
    zCloud使用技巧:如何使用性能下钻功能分析SQL性能问题
    仅用半小时,从Python爬取到BI可视化,告诉你深圳房价有多贵
    团队一致性的PHP开发环境之Docker
    团队一致性的PHP开发环境之Docker
    团队一致性的PHP开发环境之Docker
    qcow2快照原理
    qcow2快照原理
    qcow2快照原理
    qcow2快照原理
  • 原文地址:https://www.cnblogs.com/king-lps/p/7345298.html
Copyright © 2020-2023  润新知