MySQL中的utf8mb4

本文主要是介绍MySQL中的utf8mb4，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

MySQL中utf8与utf8mb4

utf-8简介

简单介绍

UTF-8是Unicode的一种实现方式，也就是它的字节结构有特殊要求，所以我们说一个汉字的范围是0X4E00到0x9FA5，是指unicode值，至于放在utf-8的编码里去就是由三个字节来组织，所以可以看出unicode是给出一个字符的范围，定义了这个字是码值是多少，至于具体的实现方式可以有多种多样来实现。

UTF-8是一种变长字节编码方式。对于某一个字符的UTF-8编码，如果只有一个字节则其最高二进制位为0；如果是多字节，其第一个字节从最高位开始，连续的二进制位值为1的个数决定了其编码的位数，其余各字节均以10开头。UTF-8最多可用到6个字节。
如表：
1字节 0xxxxxxx
2字节 110xxxxx 10xxxxxx
3字节 1110xxxx 10xxxxxx 10xxxxxx
4字节 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
5字节 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
6字节 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

为什么MySQL中要utf8设计成3个字符

猜想：Unicode 委员会还做着 65535个字符足够全世界用了的美梦。Mysql 中的字符串长度算的是字符数而非字节数，而3个字节的utf-8就可以表示65535个字符了

3字节 1110xxxx 10xxxxxx 10xxxxxx 16个x （16位）值为65535

utf8mb4的出现

如果有utf8三个字节存储不下，那么就会存储不进数据库，5.5.3 版本以后才出现了utf8mb4来表示4个字节的字符。为了获取更好的兼容性，应该总是使用 utf8mb4 而非 utf8。对于 CHAR 类型数据，utf8mb4 会多消耗一些空间，根据 Mysql 官方建议，使用 VARCHAR 替代 CHAR。

在这里插入图片描述

这篇关于MySQL中的utf8mb4的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

MySql教程

MySQL中的utf8mb4

MySQL中utf8与utf8mb4

utf-8简介

为什么MySQL中要utf8设计成3个字符

utf8mb4的出现

前端开发

后端开发

移动端开发

数据库

服务器运维

人工智能

区块链

游戏开发

网站运营

大数据/云计算

软件工程

软件/开发工具使用

资讯