首先推荐一个简单的Mybatis原理视频教程,可以作为入门教程进行学习:点我 (该教程讲解的是如何手写简易版Mybatis)
执行流程的理解
理解Mybatis的简单流程后自己手写一个,可以解决百分之70的面试问题和开发中遇到的困惑,此乃重中之重
假如我们要自己设计一个半自动的仿Mybatis框架,有哪些环节是必不可少的呢?思考再三,必然有以下环节:
- 相关配置文件加载(XML类型,接口类型则可以省略)
- 接口代理(JDK 动态代理)
- 针对XML或者接口进行解析 ==》即把
不可直接执行的SQL
处理为携带参数,返回值明确的数据结构 - JDBC模块执行,并返回对应的返回值类型
如果仅考虑这三点的话,其实实现一个简单的ORM框架就很容易了,再附加一些反射和正则表达式等等就可以搞定了.
那如果去参考Mybatis,我们来看看它的几个环节是如何设计的:
其实大致思路一样,需要一个数据结构去存储全部的变量,通过接口代理的方式调用Sqlsession里面内置的方法,不同的是真正的执行者又加了一层,是 Executor
,再通过原始JDBC返回数据给调用者,当然,真正的Mybatis包含了众多的设计模式以及数据源,缓存,动态SQL,数据库事务,延迟加载处理等等
为了验证mybatis的执行流程,采用了两种方式去调用接口,如下所示:
public static void main(String[] args) throws IOException {
// 指定全局配置文件
String resource = "mybatis-config.xml";
// 读取配置文件
InputStream inputStream = Resources.getResourceAsStream(resource);
// 构建sqlSessionFactory
SqlSessionFactory sqlSessionFactory = new SqlSessionFactoryBuilder().build(inputStream);
SqlSession sqlSession = sqlSessionFactory.openSession();
// Mapper 编程方式
ScriptDirDao mapper = sqlSession.getMapper(ScriptDirDao.class);
System.out.println(mapper.selectOne(1));
// ibatis 编程方式 ---> 注意由于没有显式设置提交, 因此两个sql执行使用的是同一次sqlsession, 即默认触发了一级缓存
Object object = sqlSession.selectOne("com.mycode.mybatis.ScriptDirDao.selectOne", 1);
System.out.println(object);
}
ibatis编程方式实际就是通过 namespace+方法名定位具体的接口方法,然后传递参数并执行
正常使用方式就是基于上述的基本流程做了一层自动的返回值映射,接口方法的匹配
这里有个小点需要强调下,真正的执行者是Executor
,我们每次在使用以下代码:
// 构建sqlSessionFactory
SqlSessionFactory sqlSessionFactory = new SqlSessionFactoryBuilder().build(inputStream);
SqlSession sqlSession = sqlSessionFactory.openSession();
// Mapper 编程方式
ScriptDirDao mapper = sqlSession.getMapper(ScriptDirDao.class);
System.out.println(mapper.selectOne(1));
通过查看源码也可以看到,SqlSession接口的默认实现类是DefaultSqlSession
public class DefaultSqlSession implements SqlSession {
private final Configuration configuration;
private final Executor executor; // 执行者
private final boolean autoCommit;
private boolean dirty;
private List<Cursor<?>> cursorList;
.......
}
而方法真正的执行,如selectList方法:
@Override
public <E> List<E> selectList(String statement, Object parameter, RowBounds rowBounds) {
try {
MappedStatement ms = configuration.getMappedStatement(statement);
return executor.query(ms, wrapCollection(parameter), rowBounds, Executor.NO_RESULT_HANDLER);
} catch (Exception e) {
throw ExceptionFactory.wrapException("Error querying database. Cause: " + e, e);
} finally {
ErrorContext.instance().reset();
}
}
深度分析文章参考
源码分析Mybatis MapperProxy初始化之Mapper对象的扫描与构建 (作者:掘金- 中间件兴趣圈)
源码分析Mybatis MappedStatement的创建流程(作者:掘金- 中间件兴趣圈)
Mybatis执行SQL的4大基础组件详解(作者:掘金- 中间件兴趣圈)
源码解析MyBatis Sharding-Jdbc SQL语句执行流程详解(作者:掘金- 中间件兴趣圈)
mybatis 一级二级缓存原理及使用建议(美团技术团队-官方博客)
面试题集锦
Myabtis的细节使用和执行原理其实都很好理解,对于源码感兴趣的可以深挖,但大多时候建议点到为止即可
还是着眼当下 面向面试要点进行针对性学习(不包括一些简单的使用问题)
#{}和${}的区别是什么?
#{} 是预编译处理,${}是字符串替换。Mybatis 在处理#{}时,会将 sql 中的#{}替换为?号,调用 PreparedStatement 的
set 方法来赋值;
Mybatis 在处理时,就是把时,就是把{}替换成变量的值。
使用#{}可以有效的防止 SQL 注入,提高系统安全性
PS:mybatis执行的本质还是SQL,因此回归本质可以简单理解为一个对于PreparedStatement ,一个对应 Statement
通常一个 Xml 映射文件,都会写一个 Dao 接口与之对应,请问,这个 Dao 接口的工作原理是什么?Dao 接口里的方法,参数不同时,方法能重载吗?(id是否可以相同)
Dao 接口即 Mapper 接口,接口的全限名,就是映射文件中的 namespace 的值;接口的方法名,就是映射文件中 Mapper 的 Statement 的 id 值;接口方法内的参数,就是传递给 sql 的参数
实现原理:
Mapper接口的工作原理是JDK动态代理,mybatis会对每一个mapper代理生成一个mapperProxy对象,代理对象会拦截接口方法,转而自动对应到sqlsession上,最终由Executor
执行
参数不同,方法不可重载
,为什么?
上文说到mybatis有一个环节是解析XML文件或者解析接口,它会去构建一个叫做 MapperStatement 对象去存储mapper的相关信息,每一个dao接口方法在执行的时候到底是如何定位找到对应的MapperStatement 的呢?
源码逻辑图:
// 这个 mappedStatements 即
protected final Map<String, MappedStatement> mappedStatements = new StrictMap<MappedStatement>("Mapped Statements collection");
// Key即 XML文件中配置的
<mapper namespace="com.mycode.mybatis.ScriptDirDao">
<select id="selectOne" resultMap="BaseResultMap">
namespace + id ===》 全限名(NameSpace)+方法名
Mybatis是如何将sql执行结果封装为目标对象并返回的?都有哪些映射形式?
第一种是使用 标签,逐一定义数据库列名和对象属性名之间的映射关系
第二种是使用 sql 列的别名功能,将列的别名书写为对象属性名,有了列名与属性名的映射关系后,Mybatis 通过反射创建对象,同时使用反射给对象的属性逐一赋值并返回,那些找不到映射关系的属性,是无法完成赋值的
Mybatis 是否支持延迟加载?如果支持,它的实现原理是什么?
Mybatis 仅支持 association 关联对象和 collection 关联集合对象的延迟加载,association 指的就是一对一,collection 指的就是一对多查询,在 Mybatis配置文件中,可以配置是否启用延迟加载 lazyLoadingEnabled=true|false
它的原理是,使用 CGLIB 创建目标对象的代理对象,当调用目标方法时,进入拦截器方法,比如调用 a.getB().getName(),拦截器 invoke()方法发现 a.getB()是null 值,那么就会单独发送事先保存好的查询关联 B 对象的 sql,把 B 查询上来,然后调用 a.setB(b),于是 a 的对象 b 属性就有值了,接着完成 a.getB().getName()法的调用,这就是延迟加载的基本原理
Mybatis 的一级、二级缓存
一级缓存: 基于 PerpetualCache 的 HashMap 本地缓存,其存储作用域为Session,当 Session flush 或 close 之后,该 Session 中的所有 Cache 就将清空,默认打开一级缓存,无法关闭
二级缓存与一级缓存其机制相同,默认也是采用 PerpetualCache,HashMap存储,不同在于其存储作用域为 Mapper(Namespace),并且可自定义存储源,如 Ehcache。默认不打开二级缓存,要开启二级缓存,使用二级缓存属性类需要实现 Serializable 序列化接口(可用来保存对象的状态),可在它的映射文件中配置
对于缓存数据更新机制,当某一个作用域(一级缓存 Session/二级缓存Namespaces)的进行了 C/U/D 操作后,默认该作用域下所有 select 中的缓存将被 clear
简述 Mybatis 的插件运行原理,以及如何编写一个插件
Mybatis 仅可以编写针对 ParameterHandler、ResultSetHandler、StatementHandler、Executor 这 4 种接口的插件,Mybatis 使用 JDK 的动态代理,为需要拦截的接口生成代理对象以实现接口方法拦截功能,每当执行这 4 种接口对象的方法时,就会进入拦截方法,具体就是 InvocationHandler 的 invoke()方法,当然,只会拦截那些你指定需要拦截的方法
编写插件:实现 Mybatis 的 Interceptor 接口并复写 intercept()方法,然后在给插件编写注解,指定要拦截哪一个接口的哪些方法即可,需要在配置文件中配置你编写的插件
Mybatis 的插件实际在执行的流程留下了一些固定的环节,允许你自行做一些处理,我们自己利用接口扫描,在代码执行的某个阶段去调用目标方法,也可以实现这种类似插件的做法
Demo:SpringBoot代码生成器 包含自定义接口拦截,实现了类似的插件效果
以下问题来源于掘金文章【面试官之你说我听】-MyBatis常见面试题(作者:Ccww)
数据库链接中断如何处理
数据库的访问底层是通过tcp实现的,当链接中断是程序是无法得知,导致程序一直会停顿一段时间在这,最终会导致用户体验不好,因此面对数据库连接中断的异常,该怎么设置mybatis呢?
connection操作底层是一个循环处理操作,因此可以进行时间有关的参数:
- max_idle_time : 表明最大的空闲时间,超过这个时间socket就会关闭
- connect_timeout : 表明链接的超时时间
在开发过程中,经常遇到插入重复的现象,这种情况该如何解决呢?
插入的过程一般都是分两步的:先判断是否存在记录,没有存在则插入否则不插入。如果存在并发操作,那么同时进行了第一步,然后大家都发现没有记录,然后都插入了数据从而造成数据的重复
分布式环境中通过Redis分布式锁解决即可,多线程环节下用普通的Lock锁解决即可
事务执行过程中宕机的应对处理方式
数据库插入百万级数据的时候,还没操作完,但是把服务器重启了,数据库会继续执行吗? 还是直接回滚了?
不会自动继续执行,不会自动直接回滚 ,但可以依据事务日志进行回滚或者进行执行。
事务开启时,事务中的操作,都会先写入存储引擎的日志缓冲中,在事务提交之前,这些缓冲的日志都需要提前刷新到磁盘上持久化 ,两种类型:
在事务执行的过程中,除了记录redo log,还会记录一定量的undo log。
- redo log :按语句的执行顺序,依次交替的记录在一起
- undo log: 主要为事务的回滚服务。undo log记录了数据在每个操作前的状态,如果事务执行过程中需要回滚,就可以根据undo log进行回滚操作
Mybatis都有哪些Executor执行器?它们之间的区别是什么?
Mybatis有三种基本的Executor执行器,SimpleExecutor、ReuseExecutor、BatchExecutor。
- **SimpleExecutor:**每执行一次update或select,就开启一个Statement对象,用完立刻关闭Statement对象。
- **ReuseExecutor:**执行update或select,以sql作为key查找Statement对象,存在就使用,不存在就创建,用完后,不关闭Statement对象,而是放置于Map<String, Statement>内,供下一次使用。简言之,就是重复使用Statement对象。
- **BatchExecutor:**执行update(没有select,JDBC批处理不支持select),将所有sql都添加到批处理中(addBatch()),等待统一执行(executeBatch()),它缓存了多个Statement对象,每个Statement对象都是addBatch()完毕后,等待逐一执行executeBatch()批处理。与JDBC批处理相同。
作用范围:Executor的这些特点,都严格限制在SqlSession生命周期范围内
在Mybatis配置文件中,可以指定默认的ExecutorType执行器类型,也可以手动给DefaultSqlSessionFactory的创建SqlSession的方法传递ExecutorType类型参数
最后
Myabtis也有其缺点,重复代码实在太多,在这里推荐我的另一篇文章,SpringBoot & Mybatis代码生成器,解决百分之90的重复代码,数据库建好即可CRUD,所有XML都是手写,欢迎尝试一下
点击 ===》 SpringBoot代码生成器
集中感谢几位作者:
掘金-Ccww
掘金- 中间件兴趣圈
美团技术团队-官方博客