MySQL枚举类型如何定义⽐较好tinyint?enum?varchar?⽬录
前⾔
当项⽬中遇到⽐较多的枚举字段时怎么选择MySQL的类型呢?tinyint,varchar还是enum?据我观察⼤家还是⽤tinyint的⽐较多,少数也会直接⽤varchar。
说到枚举,这个类型真的是有点坑,写的时候⼜不想校验(尤其是枚举值⽐较多的时候),⼜想直接在表⾥可以显⽰出原字符(说到底还是懒)。tinyint可以校验插⼊的值为⾃⼰定义的数值且索引友好但是显⽰不友好,varvhar可以直接在表中显⽰字段值但对索引⼜不友好。
enum怎么用两种都不是最优选择,后来MySQL出现了enum类型,可以直接显⽰值且内部为数字索引。本来以为这个enum可以解放我们的双⼿了,但我调研了⼀下发现还是有⼀些⼤坑的,难怪很少有⼈⽤。
enum介绍
先来介绍⼀下enum类型吧。
ENUM 是⼀个字符串对象,其值通常选⾃⼀个允许值列表中,该列表在表创建时的列规格说明中被明确地列举。(建表的时候写到建表语句⾥)
虽然表⾯是字符串值,但其内部是数字索引,其索引值从1开始。
注意:下标并不是从 0 开始,⽽ 0 则具有其它的意义(空)
ENUM数据类型提供以下优点:
节省存储空间,MySQL ENUM使⽤数字索引(1,2,3,…)来表⽰字符串值。
可读查询和输出,数字将转换回查询结果中的相应字符
实践
下⾯我们来建个表试⼀下这个enum类型。
CREATE TABLE `test_enum` (
`id` INT ( 11 ) NOT NULL AUTO_INCREMENT COMMENT '主键ID',
`color` ENUM('red','yellow','blue') COMMENT '颜⾊',
PRIMARY KEY ( `id` )
)
ENGINE = INNODB AUTO_INCREMENT = 1 DEFAULT CHARSET = utf8mb4 COMMENT = '颜⾊表';
这是⼀个有red,blue,yellow三种颜⾊的颜⾊表。如果我们插⼊列表中的数据,是完全没问题的。
INSERT INTO test_enum(color) VALUES ('red'), ('yellow')
这个时候看⼀下确实使⽤的是数字索引:
SELECT color+0 FROM test_enum
但如果我们插⼊了⼀个不存在enum列表中值white,会怎么样呢?
INSERT INTO test_enum(color) VALUES ('red'), ('white')
这个时候MySQL会有个报错:
1265 - Data truncated for column 'color' at row 2, Time: 0.017000s
这是因为我们的MySQL开启了严格模式。如果关掉严格模式,或者使⽤⽐较古⽼的版本,仅仅是发出了⼀个警告⽽已。
但你以为关闭了严格模式就真的可以插⼊成功了吗?
Naive!
你只是插⼊了⼀个空字符串,对此MySQL 官⽅还是作出了⼀点的解释:
「如果在 ENUM 列中插⼊⽆效值(即,允许值列表中不存在的字符串),则会插⼊空字符串 ( '' ) 作为特殊错误值,这个空字符串可以通过此字符串具有数字值 0 来区分 正常 的空字符串 」
翻译⼀下:
就是说如果往 enum 列中插⼊了⽆效的值,可以被插⼊,但插⼊的是⼀个特殊的空字符串,⽽该空字符串的数值是 0。所以正常的enum索引从1开始,0就是留给这个空字符串的。
但是0和‘0’还是不⼀样的
INSERT INTO test_enum(color) VALUES (0)
这个时候会报错:
1265 - Data truncated for column 'color' at row 1, Time: 0.001000s
如果这样,就可以:
INSERT INTO test_enum(color) VALUES ('0')
所以enum类型对于php等弱语⾔类型的⽀持很差,弱语⾔类型打引号和不打引号的值可能是同⼀类型,但是对于mysql中enum类型的字段来说,那就不⼀定是⼀回事了。
这⾥可以看出来enum类型确实对枚举值进⾏了⼀个校验,但是如果我们这个字段需要新增⼀种颜⾊⽽表结构忘记改了,那么我们以为插⼊数据成功了,其实只是插⼊⼀个空,这点真是⼀个值得注意的坑。
如果使⽤数字作为ENUM枚举常量,这种双重性很容易导致混乱,例如ENUM(‘1’,’2’,’3’)。建议尽量避免这么做。
所以超级不推荐在mysql中设置某⼀字段类型为enum,但是存的值为数字,⽐如‘0’,‘1’,‘2’;
另外,对于enum的排序也是个问题,其不是按枚举值字母顺序排序的,⽽是按数字索引排序的,也就是按你定义的顺序排序的。这点也是需要特别注意的。
SELECT color FROM test_enum order by color
总结⼀下enum主要优点:
1、数据更紧凑,节省存储空间。因为 ENUM 列⼀般都是有限的值,⼀般不多余 5 个这样,这就⽐保存 true 或 false 节省空间多了。因为MySQL 会在创建或者修改表结构时将 enum 允许的值⾃动编码为数字,⽽这个数字⼀般的分配空间为 1~2 字节 ( byte ) ,具体取决于实现。
例如,将值为 yellow 的100万⾏插⼊表将需要 100 万字节的存储空间,⽽如果将实际字符串 yellow存储在 VARCHAR 列中则需要 600万字节。
2、更好的可读性,虽然在存储的是数字,但在输⼊和输出时使⽤的都是对应的字符值。
3、如果启⽤了严格的SQL模式,错误值会导致警告或错误,可在⼀定程度上过滤掉脏数据。
但是,他的缺点却更多:
1,在MySQL语句中可使⽤ENUM的索引值,也可以使⽤字符串,容易误⽤,尤其对于数字型枚举值。
2,更改enum枚举成员需要使⽤ALTER TABLE语句重建整个表,⼤部分情况下会进⾏全表扫描;对于⼀些列未来可能会改变的字符串,使⽤枚举不是⼀个好主意,除⾮能接受只在列表末尾添加元素。
3,如果启⽤了严格的 SQL 模式 ( sql_mode ) ,尝试插⼊⽆效的 ENUM 值会导致错误。如果关闭严格模式插⼊的数据仍然是错误的。
4,字符枚举值排序是按定义顺序排的⽽不是按字母顺序排的,如果想按字母顺序需要 ORDER BY CONCAT(col)。
5,ENUM类型不是SQL标准,属于MySQL,⽽其他DBMS不⼀定有原⽣的⽀持。
6,枚举值不能是表达式,即使是计算字符串值的表达式也是如此。
看了这么多缺点,我还是决定放弃使⽤enum了。
那么情况下可以使⽤enum呢?
1,你的enum值是固定不变的,⽐如扑克牌的花⾊等。
2,enum的值数量⼤于2个并少于10个。(我觉得超过10个就很难管理与使⽤了)
3,这个表不需要存储额外的关联信息。⽐如扑克牌花⾊想关联⿊⾊和红⾊那么就很难了。
最后的建议:
1. ⾮常不建议使⽤ENUM存数字,如果搭配弱类型语⾔,那简直就是给⾃⼰⿇烦。
2. 尽量不要⽤这个类型,除⾮你⾮常确定你的枚举成员不会改变,或者新增成员也只是在队尾新增,还有你没有转换数据库的需求;
3. 如果字段是字符串,并且长度固定,建议⽤char类型;如果不固定且没有搜索要求⽤varchar也没啥问题。
4. 如果是数值型,建议使⽤tinyint,只占1个字节,⽐较稳妥。就是这个字段备注要写清楚了,不然别⼈
看表全是数字⼀脸懵逼。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论