什么是ORM?
MVC框架中重要的一部分就是ORM,实现了数据模型与数据库的解耦,即数据模型不需要依赖于特定的数据库,通过简单的配置就可以轻松更换数据库。
ORM是对象关系映射的简称,主要任务是:
- 根据对象的类型生成表结构
- 将对象、列表操作,转换成SQL语句(或其他数据库的语句)
- 将SQL查询到的结果转换为对象、列表
- 类名对应 ------> 数据库中的表名
- 类属性对应 -----> 数据库里的字段
- 类实例对应 -------> 数据库表里的一行数据
ORM的优势:
- ORM使得我们的通用数据库交互变得简单易行,而且完全不用考虑该死的SQL语句。快速开发,由此而来。
- 可以避免一些新手程序猿写sql语句带来的性能问题。
- 如果数据库迁移,只需要更换Django的数据库引擎即可。
ORM的缺点:
- 性能有所牺牲,不过现在的各种ORM框架都在尝试各种方法,比如缓存,延迟加载登来减轻这个问题。效果很显著。
- 对于个别复杂查询,ORM仍然力不从心,为了解决这个问题,ORM一般也支持写raw sql。
- 通过QuerySet的query属性查询对应操作的sql语句
数据库的配置
1.默认支持
Django默认支持sqlite,mysql, oracle,postgresql数据库。默认使用sqlite的数据库,默认自带sqlite的数据库驱动 , 引擎名称:django.db.backends.sqlite3。
2.mysql驱动程序
- MySQLdb(mysql python)【python2中的驱动】
- mysqlclient
- MySQL
- PyMySQL(纯python的mysql驱动程序)【python3中的驱动】
3.创建数据库
配置前必须先创建数据库
create database Django_books charset utf8; #创建支持中文的数据库
4.更改项目中settings.py的数据库设置
DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': 'Django_Books', #你的数据库名称 'USER': 'root', #你的数据库用户名 'PASSWORD': '123456', #你的数据库密码 'HOST': 'localhost', #你的数据库主机,留空默认为localhost 'PORT': '3306', #你的数据库端口 } }
5.配置驱动
Django默认导入的驱动是MySQLdb,MySQLdb对python3的支持有很大问题,所以要换成PyMySQL:在项目名文件夹下的__init__.py中:
import pymysql pymysql.install_as_MySQLdb() # 告诉Django使用pymysql驱动程序
扩展:查看ORM操作执行的原生sql语句,在settings.py中增加:
LOGGING = { 'version': 1, 'disable_existing_loggers': False, 'handlers': { 'console':{ 'level':'DEBUG', 'class':'logging.StreamHandler', }, }, 'loggers': { 'django.db.backends': { 'handlers': ['console'], 'propagate': True, 'level':'DEBUG', }, } }
表(模型)的创建
示例:作者、书籍和出版社之间的关系
from django.db import models class Book(models.Model): name = models.CharField(max_length=20) price = models.IntegerField() pub_data = models.DateField() author = models.ManyToManyField("Author") publish = models.ForeignKey("Publish",on_delete=models.CASCADE) class Author(models.Model): name = models.CharField(max_length=32) sex = models.BooleanField(max_length=1,choices=((0,"男"),(1,"女"),)) phone = models.CharField(max_length=11) class Publish(models.Model): name = models.CharField(max_length=30) address = models.CharField("地址",max_length=150)
1.每个数据模型(类)都是django.db.models.Model的子类,它的父类Model包含了所有必要的和数据库交互的方法。
2.每个类就相当于单个数据表,属性名就是字段名
字段类型介绍
AutoField 自增列 = int(11) 如果没有的话,默认会生成一个名称为 id 的列,如果要显示的自定义一个自增列,必须将给列设置为主键 primary_key=True。 CharField 字符串字段 必须有 max_length 参数 BooleanField 布尔类型=tinyint(1) 不能为空,Blank=True ComaSeparatedIntegerField 用逗号分割的数字=varchar 继承CharField,所以必须 max_lenght 参数 DateField 日期类型 date 对于参数,auto_now = True 则每次更新都会更新这个时间;auto_now_add 则只是第一次创建添加,之后的更新不再改变。 DateTimeField 日期类型 datetime 同DateField的参数 Decimal 十进制小数类型 = decimal 必须指定整数位max_digits和小数位decimal_places EmailField 字符串类型(正则表达式邮箱) =varchar 对字符串进行正则表达式 FloatField 浮点类型 = double IntegerField 整形 BigIntegerField 长整形 不同的整型类型integer_field_ranges = { 'SmallIntegerField': (-32768, 32767), 'IntegerField': (-2147483648, 2147483647), 'BigIntegerField': (-9223372036854775808, 9223372036854775807), 'PositiveSmallIntegerField': (0, 32767), 'PositiveIntegerField': (0, 2147483647), } IPAddressField 字符串类型(ip4正则表达式)(已弃用,用13、) GenericIPAddressField 字符串类型(ip4和ip6是可选的)参数protocol可以是:both、ipv4、ipv6 验证时,会根据设置报错 NullBooleanField 允许为空的布尔类型 PositiveIntegerFiel 正Integer PositiveSmallIntegerField 正smallInteger SlugField 减号、下划线、字母、数字 TextField 字符串=longtext TimeField 时间 HH:MM[:ss[.uuuuuu]] URLField 字符串,地址正则表达式 BinaryField 二进制 ImageField 图片 FilePathField 文件
3.字段参数介绍
null 是否可以为空 default 默认值 primary_key 主键 choices: 一个用来选择值的2维元组。第一个值是实际存储的值,第二个用来方便进行选择。如:SEX_CHOICES= (( ‘F’,'Female’),(‘M’,'Male’),) gender = models.CharField(max_length=2,choices = SEX_CHOICES) db_column 列名 db_index 索引(db_index=True) unique 唯一索引(unique=True) unique_for_date 只对日期索引 unique_for_month 只对月份索引 unique_for_year 只对年做索引 blank django的 Admin 中添加数据时是否可允许空值 editable 如果为假,admin模式下将不能改写。缺省为真 verbose_name Admin中字段的显示名称 validator_list 有效性检查。非有效产生 django.core.validators.ValidationError 错误
4.模型之间的关系(表与表之间)
有三种关系:一对一,一对多,多对多
一对一:实质就是在主外键的关系基础上,给外键加了一个UNIQUE=True的属性;OneToOne("UserGroup")
一对多:就是主外键关系;ForeignKeyField("UserGroup",to_field="gid",default=1,on_delete=models.CASCADE)
多对多:ORM会为我们自动创建第三张表(当然我们也可以自己创建第三张表:两个foreign key);ManyToManyField("UserGroup")
参数:“UserGroup” 关联的另一张表的表名;
to_field="gid" 可省略。另外一张表的字段,默认是主键;
on_delete=models.... 外键对应的表数据删除时,该如何操作。此字段必填,否则报错;
on_delete可选的值: CASCADE: 级联删除。即将关联该条数据的本表数据删除 PROTECT: 阻止上面的删除操作,弹出ProtectedError异常 SET_NULL: 将外键字段设为null,只有当字段设置了null=True时,方可使用该值。 SET_DEFAULT: 将外键字段设为默认值。只有当字段设置了default参数时,方可使用。 DO_NOTHING: 什么也不做。 SET(): 设置为一个传递给SET()的值或者一个回调函数的返回值。注意大小写。 SET()用法示例: from django.conf import settings from django.contrib.auth import get_user_model from django.db import models def get_sentinel_user(): return get_user_model().objects.get_or_create(username='deleted')[0] class MyModel(models.Model): user = models.ForeignKey( settings.AUTH_USER_MODEL, on_delete=models.SET(get_sentinel_user), )
5.建好表后,在命令行执行一下两条语句生成映射文件并提交数据库执行建表
python manage.py makemigrations 在应用文件夹内生成映射文件(000开头的py文件) python manage.py migrate 提交数据库执行建表
6.修改数据表
如果要修改数据模型,重新执行第5步操作,可能会出现如下问题:
如果新增字段没有默认值,或者原来表中设置了字段不能为空,这里提供两个选择,1是设置一个默认值,2是退出修改。选择1后,只要输入默认值即可。
表的操作
一.增添
增添表记录
单表: create()方法: Book.objects.create(name="Python基础",price=100) 或 Book.objects.create(**{"name":"Python基础","price":"100"}) save()方法: b = Book(name="Python基础",price=100) # 创建对象 b.save() # 将对象存数据库 或 b = Book() b.name="Python基础" b.price=100 b.save() 有外键时: Book.objects.create(name="",price="",pub_date="",publish_id=2) # 外键关联表的id 或 objcet = Publish.objects.get(); Book.objects.create(name="",price="",pub_date="",publish=object) # 外键=对象
增添多对多之间的关联关系
情景1:使用ManyToMany自动创建第三张表 add()方法:【调用add的主体必须是单个model对象】 例如:为已有的一本书增添作者 author_obj = Author.objects.filter(name="alex") book_obj = Book.objects.get(id=2) book_obj.author.add(*author_obj) 这里的author指的是Author表。添加一个列表* 添加一个字典** 或: book_obj = Book.objects.filter(name="Python") author_obj = Author.object.get(id=1) author_obj.book_set.add(*book_obj) 这里的book指的是Book表。 注意两种方式 _set 的区别,源于models.py中建表的author字段 情景2:自己手动创建的第三张表BookToAuthor models.BookToAuthor.objects.create(author_id=1,Book_id=2)
二.删除
删除表记录
Book.objects.filter(name="Python").delete() # 看上去删除了一条消息,实际上还删除了book_author表中的数据, 这是django默认的级联删除
删除多对多之间的关联关系
clear()和remove()方法 【调用这两种方法的主体必须是单个对象】 remove()方法: remove方法用来删除某个对象和某些对象的关联关系 为已有的一本书删除某个作者 author_obj = Author.objects.filter(name="alex") book_obj = Book.objects.get(name="Python") book_obj.author.remove(*author_obj) remove(3) 意思是删除id=3的作者与本书的关系 或: book_obj = Book.objects.filter(name="Python") author_obj = Author.object.get(name="Python") author_obj.book_set.remove(*book_obj) clear()方法: clear方法用来删除某个对象和所有对象的关联关系 book_obj.author.remove(*author_obj) 删除作者alex和Python书之间的关联 book_obj.author.clear() 删除Python和所有作者的关联 author_obj[0].book_set.clear() 删除作者alex和所有书的关联 注意:当clear()方法和remove()应用在ForeignKey上时,必需null=True才能用
三.修改
修改表数据
update()方法: Book.objects.filter(author="yuan").update(price=100) save()方法: b = Book.objects.get(author="oldboy") b.price = 200 b.save() 需要注意: 1.update()是QuerySet对象的方法,而save()是model对象的方法。即update可以一次性修改多条记录的数据,并返回一个整型数值,表示受影响的记录条数。而save一次只能修改一条记录 2.save() 方法会将所有属性重新设定一遍,效率低。而update只更改指定的属性,所以修改数据推荐用update
如果要修改多对多表之间的关系:
set()方法
四.查询
1.查询API:
查询API: filter(**kwargs) 它包含了与所给筛选条件相匹配的对象 all() 查询所有结果 get(**kwargs) 返回与所给筛选条件相匹配的对象,返回结果有且只有一个,如果符合筛选条件的对象超过一个或者没有都会抛出错误。 下面的方法都是对查询的结果再进行处理:比如 objects.filter.values() values(*field) 返回一个ValueQuerySet——一个特殊的QuerySet,运行后得到的并不是一系列model的实例化对象,而是一个可迭代的字典序列 values_list(*field) 它与values()非常相似,它返回的是一个元组序列,values返回的是一个字典序列 exclude(**kwargs) 它包含了与所给筛选条件不匹配的对象 order_by(*field) 对查询结果排序,例如order_by("price")按照价格从小到大排序,order_by("-price")从大到小排序 reverse() 对查询结果反向排序 distinct() 从返回结果中剔除重复纪录 count() 返回数据库中匹配查询(QuerySet)的对象数量。 first() 返回第一条记录 last() 返回最后一条记录 exists() 如果QuerySet包含数据,就返回True,否则返回False。不会保存在缓存里。
扩展查询:有时候Django的查询API不能方便地设置查询条件,提供了另外的扩展查询方法extra()
extra(select=None, where=None, params=None, tables=None,order_by=None, select_params=None) extra可以指定一个或多个参数,都不是必需的,但要至少使用一个。 参数详解: 1.select和select_params select这个参数内可以直接写SQL查询语句或者函数,select_params用来给select中的语句传值 例: v = models.Publish.objects.all().extra(select={ 'n':"select count(1) from app01_book WHERE id=%s or id=%s", 'm':"select count(1) from app01_author WHERE id=%s or id=%s", },select_params=(1,2,3,4)) 这里取到了所有Publish表中的数据,同时还取到了以下两个SQL语句中的东西。 for i in v: print(i.n,i.m,i.id) 2.where和params where用来直接写查询条件,parems给where中传值 例: models.Book.objects.extra(where=['parice=%s'], params=['99']) models.Book.objects.extra(where=["'parice=100' OR name='Python'","id=1" ]) 3.tables用来查询整张表 例: models.Author.objects.extra(tables=["app01_book"]) <=> select * from app01_book,app01_author models.Book.objects.extra(tables=["app01_author"],where=["app01_book.id = app01_author.id"]) <=> select * from app01_book,app01_author where app01_book.id = app01_author.id 4.order_by用来排序 综合示例1: models.Author.objects.extra( select={"newid":"select count(1) from app01_book where id>%s"}, select_params=[1,], where=["args>%s"], params=[18,], order_by=["-ages"], ) <=> select app01_author.id, (select count(1) from app01_book where id>1) as newid from app01_author,app01_book where app01_author.age > 18 order by app01_author.age desc 综合示例2: models.Article.objects.all().filter(user=current_user).extra(select={"filter_create_date":"strftime(‘%%Y/%%m‘,create_time)"}).values_list("filter_create_date") #查出当前用户的所有文章的create_time,并且只取出年份和月份
单表模糊查询:(双下划线)
万能的 __双下划线 __gt 大于 __gte 大于等于 __lt 小于 __lte 小于等于 __icontains="p" 含有p且不区分大小写 __contains="p" 含有p且区分大小写 __exat="aaa" 相当于 like "aaa" __iexat="aaa" 相当于忽略大小写 like "aaa" _in=[10,20,33,50] 获取id等于10,20,33,50的数据 __exclude(id_in=[]) 不等于10 20 33 50的 __range=[1,2] 在范围内的 __startswith 以...开头 __istartswith 不以...开头 __endswith 以...结尾 __iendswith 不以...结尾 __year 日期字段的年份 __month 日期字段的月份 __day 日期字段的日 __isnull=True/False filter(price__gt=100) 筛选价格大于100的 filter(id__gt=1,id__lt=10) id大于1小于10
2.多表关联查询:(多对多和一对多没有区别)
1.查多条记录(__ 双下划线) 找到Python这本书的出版社名称 Book.objects.filter(name="Python").values("publish__name") 通过外键[publish是Book表的外键] Publish.objects.filter(book__name="Python").values("name") 通过对象[book是Publish关联的表名] 2.(只能查单条记录,不常用) 正向查询(通过书查出版社) Book.objects.get(name="").publish --> 出版社对象 print(publish.属性) 反向查询(通过出版社找书) Publish.objects.get(name="").book_set.all() -->所有的书籍对象 注意:book_set 是模型对象中反向查询的语法,book是表名,全部小写 调用 _set 的主体必须是单个对象!!
3.Queryset的惰性机制
所谓惰性机制,models查询语句只是返回了一个Queryset对象,并不会马上执行SQL,而是使用查询结果的时候才执行。
例如:person_set = Person.objects.filter(first_name="Dave")这句话并没有运行数据库查询,当遍历Queryset、if queryset或者在模板渲染的时候使用的时候才会执行数据库查询操作
Qureyset的特点:可迭代、可切片、有缓存。
※ Queryset是有缓存的
当遍历Queryset时,匹配的记录会从数据库获取,然后转换成Django的model。这些model会保存在Queryset内置的缓存中,如果再次遍历或者使用这个Queryset时,不需要重复的查询。
而如果处理成千上万的记录时,一次性装入内存是非常浪费的。要避免产生Queryset缓存,可以使用iterator()方法来获取数据,处理完数据就将其丢弃。
objs = Book.objects.all().iterator() for obj in objs: print(obj.name)
迭代器不能重复遍历,意味着可能会造成额外的重复查询。而缓存是用于减少对数据库的查询。所以使用时要考虑需求。
4.聚合查询的分组查询
from django.db.models import Avg,Min,Sum,Max,Count
聚合查询:aggregate(*args,**kwargs):
aggregate()是Queryset的一个终止子句,通过对Queryset进行计算,返回一个聚合值的字典。从整个查询集上生成聚合值。
aggregate()子句的参数描述了我们想要计算的聚合值,如平均Avg,求和Sum等
例如:
Book.objects.all().aggregate(Avg('price')) # 计算所有在售书的平均价钱 {'price__avg': 34.35} Book.objects.aggregate(average_price=Avg('price')) # 自定义标识符(键) {'average_price': 34.35} Book.objects.aggregate(Avg('price'), Max('price'), Min('price')) # 同时输出多个聚合值 {'price__avg': 34.35, 'price__max': Decimal('81.20'), 'price__min': Decimal('12.99')}
分组查询: annotate(*args,**kwargs):
分组查询常常和聚合查询一起。它可以为查询集的每一项生成聚合。
# 查询每个作者出书的总价格,按照作者分组 Book.objects.all().values("authors__name").annotate(Sum("price")) [{'authors__name':'alex','price_sum':'140'},{'authors__name':'alvin','price_sum':'160'}] # 查询各个出版社最便宜的书的价格 Book.objects.all().values("pulisher__name").annotate(Min("price")) [{'publisher__name':'清华大学出版社','price_min':'70'},{'publisher__name':'中国机械出版社','price_min':'90'}]
5.F查询和Q查询
from django.db.models import F,Q
F查询:就是用来更新获取原来值的功能
models.Author.objects.all().update(age=F("age")+1) # 将Author表里所有人的年龄+1 models.Book.objects.all().update(price=F("price")+10) # 将所有书的价格涨10元
Q查询:用于构造复杂的查询条件,如 与、或、非。
查询条件我们可以使用filter()方法,在filter()里面的两个条件之间是and的关系,如果是或的关系,则只能使用Q查询
Book.objects.filter(Q(id=1)) # 查询条件为id=1 Book.objects.filter(Q(price=99) | ~Q(name="Python")) # 查询价格=99 或 名称不等于Python的书 Book.objects.filter(Q(name="Go"),price=99) # Q查询可以和关键字查询组合使用,但必须要将Q放到前面