一、关系型数据库与非关系型数据库
1.关系型数据库的特点:
1)数据以表格的形式出现
2)每行为各种记录名称
3)每列为记录名称所对应的数据域
4)许多的行和列组成一张表单
5)若干的表单组成数据库
2.关系型数据库的优势:
2.1 复杂的查询:可以使用SQL语句方便地在一个表以及多个表之间做非常复杂的数据查询。
2.2 事务支持:使得对于安全性能很高的数据访问要求得以实现。
3.非关系型数据库的优势:
3.1 性能:NOSQL是基于键值对的,可以想象成表中的主键和值的对应关系,而且不需要经过SQL层的解析,所以性能非常高。
3.2 可扩展性:同样也是因为基于键值对,数据之间没有耦合性,所以非常容易水平扩展。
问题:三种传统数据库之间的区别?
答:三者之间是根据数据之间的联系而去别的,层次性数据库是树形结构、网状型数据库是链接指针结构、关系型数据库是二维表结构。
二、事务(ACID)
事务(transaction)是作为单个逻辑工作单元执行的一系列操作,这些操作作为一个整体一起向系统提交,要么都执行,要么都不执行。事务是一个不可分割的工作逻辑单元。
事务必须具备以下四个属性,简称ACID属性:
原子性(atomicity):事务是一个完整的操作。事物的各部操作是不可分的(原子的);要么都执行,要么都不执行,不会结束在中间某个环节;事务在执行过程中发生错误,会被回滚(Rollback)到事务开始前的状态,就像这个事务从来没有执行过一样。
一致性(consistency):在事务开始和完成时,数据库中的数据都必须保持一致的状态;数据的完整性约束没有被破坏。
隔离性(isolation):对数据进行修改的所有并发事务是彼此隔离的,这表明事务必须是独立的,它不应以任何形式依赖于或影响其他事务;隔离性通过锁就可以实现;
永久性(durability):事务完成后,它对数据库的修改是永久的,并不会被回滚;事务日志能够保持事务的永久性。
事务的隔离级别(由低到高):
读取未提交内容(又称为脏读 read uncommitted):指所有事务都可以看到其他未提交事务的执行结果。可能有脏读、不可重复读和幻读问题。
读取已提交内容(read commited):一个事务只能看见已经提交的事务所做的改变。可以避免脏读,可能有不可重复读和幻读问题。
可重复读(repeatable read):是MySQL的默认事务隔离级别,它确保同一事务的多个实例在并发读取数据时,会看到同样的数据行。可以避免脏读和不可重复读,可能会有幻读问题。
可串行化(serializable):是最高的隔离级别,它通过在每个读的数据行上加上共享锁,所有事务都一个接一个地串行化执行,使之不可能相互冲突,从而解决幻读问题。可以避免脏读、不可重复读、幻读。
并发事务带来的问题:
1.更新丢失:两个事务T1和T2读入了同一数据并修改,T2提交的结果覆盖了T1提交的结果,导致T1的修改被丢失。
2.脏读:事务T1修改了某一数据,并将其写回磁盘,事务T2读取同一数据后,T1由于某种原因被撤销,这时T1已修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致,则T2读到的数据就为“脏”数据,即不正确的数据。
3.不可重复读:是指在一个事务内,多次读同一数据。在这个事务还没有结束时,另外一个事务也访问了该同一数据。那么,在第一个事务中的两次读数据之间,由于第二个事务的修改,那么第一个事务两次读到的数据可能是不一样的。这就发生了在一个事务内两次相同的查询读到的数据是不一样的,因此称为是不可重复读。
4.幻读:例如:目前工资为5000的员工有10人,事务A读取所有工资为5000的人数为10人。此时,事务B插入了一条工资也为5000的记录。这时,事务A再次读取工资为5000的员工,记录为11人。此时就产生了幻读。
不可重复读和幻读的区别?
不可重复读的重点是修改:同样的条件,你读取过的数据,再次读取出来发现值不一样了;
幻读的重点在于新增或删除:同样的条件,第1次和第2次读出来的记录数不一样;
MVCC(多版本并发控制机制):InnoDB的MVCC,是通过在每行记录后面保存两个隐藏的列来实现的。分别保存了行的创建时间和行的删除时间(这里存储的并不是实际的时间值,而是系统版本号)。每开始一个新的事务,系统版本号都会自动递增。事务开始时刻的系统版本号会作为事务的ID,用来和查询到的每行记录的版本号进行比较,使用MVCC后可重复读隔离级别下不会出现幻读现象。
MySQL事务控制语句
begin或start transaction:显式地开启一个事务;
commit:提交事务,并使以对数据库进行的所有修改称为永久性的;
rollback:回滚会结束用户的事务,并撤销正在进行的所有未提交的修改;
数据库怎么保证数据的一致性?
事务,悲观锁,乐观锁。
三、存储引擎
存储引擎是数据库底层软件组织,数据库管理系统(DBMS)使用数据引擎进行创建、查询、更新和删除数据。
1.InnoDB(聚集索引方式)
innodb底层存储结构为B+树,树的每个节点对应innodb的一个page,page的大小是固定的,一般设为16K.其中非叶子节点只有键值,叶子节点包含完整数据。
使用场景:1)经常更新的表,是和处理多重并发的更新请求;
2)支持事务安全表(ACID),支持行锁和外键;
3)可以通过bin-log日志等恢复
innodb如果没有设置主键,就会自动生成一个6字节的主键(用户不可见)。
2.MyISAM(非聚簇索引方式)
MyISAM在5.1之前是MySQL的默认存储引擎,它强调的是性能,但是它不支持事务、也不支持行锁和外键,支持表锁;当插入或更新数据时,需要锁住整个表,效率便会低一些。只缓存索引,不缓存真实数据。MyISAM读取数据时速度很快,而且不占用大量的内存和存储资源。
MyISAM允许没有主键的存在,是一种静态索引结构。
问题:MySQL中MyISAM与InnoDB的区别?
答:MySQL数据库中,最常用的两种引擎是innodb和myisam。InnoDB是目前MySQL的默认存储引擎。
1)事务方面:MyISAM强调的是性能,查询速度比InnoDB类型更快,但是不支持事务。InnoDB提供事务支持。
2)外键:MyISAM不支持外键,InnoDB支持外键。
3)锁:MyISAM只支持表级锁,InnoDB支持行级锁和表级锁,默认为行级锁,行锁大幅度提高了多用户并发操作的性能。innodb比较适合于插入和更新操作比较多的情况,而myisam则适合于频繁查询的情况。另外,innodb表的行锁也不是绝对的,如果在执行一个SQL语句时,MySQL不能确定要扫描的范围,innodb同样会锁全表,例如:update table set num=1 where name like "%aaa%"。
4)全文索引:MyISAM支持全文索引,Innodb不支持全文索引。innodb从MySQL5.6之后提供全文索引的支持。
5)表主键:myisam允许没有主键的表存在;innodb:如果没有设定主键,就会自动生成一个6字节的主键(用户不可见)。
6)表的具体行数:myisam:select count(*) from table,myisam只要简单的读出保存好的行数。因为myisam内置了一个计数器,count(*)时它直接从计数器中读。
innodb:不保存表的具体行数,也就是说,执行select count(*) from table 时,innodb要扫描一遍整个表来计算有多少行。