查数据大家都经常干,但是你知道从执行sql到看到结果,mysql背后都做了什么事情吗?
client/server 这种客户端到服务端的架构,大家一定都很熟悉,其实 mysql 也与之类似。
在真实环境中,数据库服务器进程和客户端进程可能运行在不同主机中,于是 mysql 采用 TCP 作为客户端和服务器之间的网络通信协议。
mysql 服务器在启动时会默认申请 3306 端口,然后网络上的其他进程就可以通过 ip地址 + 端口号 的方式与这个进程建立连接。
连接成功后,就可以进行交互操作了,这时候发送查询sql,然后服务器返回结果。流程如图:
每当有一个客户端进程连接到服务器进程时,服务器进程都会创建一个线程专门处理与这个客户端的交互。
客户端退出时会与服务器断开连接,但是服务器并不会立即把与这个客户端交互的线程销毁,而是缓存起来。
如果这时候有新的客户端再进行连接,就把这个缓存的线程分配给该客户端,为了不用频繁地创建和销毁线程,节省开销。
当建立连接后,客户端发送请求。对于服务器来说,接受到的请求只是一个文本消息,这个文本消息还需要进一步处理。
服务器收到的是文本形式的请求,接下来还要经过几个处理。
--查询缓存
mysql服务器程序会把刚处理过的查询请求和结果缓存起来,如果下次有同样请求,直接从缓存中查找结果。
这个缓存是可以在不同的客户端之间共享,比如客户端A发送了一个查询请求,客户端B也发了个一样的,那么就直接查询缓存中的数据。
要注意的是,虽然查询缓存有时候可以提升系统性能,但是也同样带来缓存相关的维护。所以从MySQL 5.7.20开始,就不推荐使用查询缓存了,而在 MySQL 8.0中直接将其删除了。
--语法解析
如果缓存没有命中,那么就要正式的查询,所以要解析客户端发过来的文本。
--查询优化
解析完成后服务器程序就可以获取到关键信息了,比如查询条件、表。
但是,由于我们写的sql语句执行起来效率可能不是很高,于是mysql就会对其进行一些优化。比如外连接转为内连接、简化表达式等等。
优化好后就可以真正的去执行了,谁去执行?就是这个存储引擎,mysql 服务器把数据的存储和提取都封装到了存储引擎的模块中。
“引擎”这个名字听起来很高大上对吧?但实际上之前一直被叫做“表处理器”,功能就是接收上层传下来的指令,然后对表中的数据进行读取或写入操作。
而关于引擎,网上一搜可以搜出很多种,但是不要担心,我们最常用的就是InnoDB和MyISAM,其中 InnoDB 是 mysql 默认存储引擎。