一、优先选择符合存储需要的蕞小的数据类型
因为列的字段越大,建立索引时所需要的空间也会越大,这样一页中所能存储的索引节点的数量也会越少,在遍历时所需要的IO次数也越多, 索引的性能也会越差。
处理方法
1、将字符串转换成数字类型存储,如:将IP地址转换成整形数据。
mysql提供了两个方法来处理ip地址:
inet_aton 把ip转为无符号整型(4-8位)
inet_ntoa 把整型的ip转为地址
插入数据前,先用inet_aton把ip地址转为整型,可以节省空间。显示数据时,使用inet_ntoa把整型的ip地址转为地址显示即可。
2、对于非负型的数据(如自增ID、整型IP)来说,要优先使用无符号整型来存储
因为:无符号相对于有符号可以多出一倍的存储空间
SIGNED INT -2147483648~2147483647
UNSIGNED INT 0~4294967295
VARCHAR(N)中的N代表的是字符数,而不是字节数
使用UTF8存储255个汉字 Varchar(255)=765个字节。过大的长度会消耗更多的内存
二、避免使用TEXT、BLOB数据类型,蕞常见的TEXT类型可以存储64k的数据
建议把BLOB或是TEXT列分离到单独的扩展表中
Mysql内存临时表不支持TEXT、BLOB这样的大数据类型,如果查询中包含这样的数据,在排序等操作时,不能使用内存临时表,必须使用磁盘临时表进行。
而且对于这种数据,Mysql还是要进行二次查询,会使sql性能变得很差,但是不是说一定不能使用这样的数据类型。
如果一定要使用,建议把BLOB或是TEXT列分离到单独的扩展表中,查询时一定不要使用select * 而只需要取出必要的列,不需要TEXT列的数据时不要对该列进行查询。
TEXT或BLOB类型只能使用前缀索引
因为MySQL对索引字段长度是有限制的,所以TEXT类型只能使用前缀索引,并且TEXT列上是不能有默认值的。
三、避免使用ENUM类型
1、修改ENUM值需要使用ALTER语句
2、ENUM类型的ORDER BY操作效率低,需要额外操作
3、禁止使用数值作为ENUM的枚举值
四、尽可能把所有列定义为NOT NULL
1、因为索引NULL列需要额外的空间来保存,所以要占用更多的空间;
2、进行比较和计算时要对NULL值做特别的处理
五、使用TIMESTAMP(4个字节)或DATETIME类型(8个字节)存储时间
TIMESTAMP 存储的时间范围 1970-01-01 00:00:01 ~ 2038-01-19-03:14:07。
TIMESTAMP 占用4字节和INT相同,但比INT可读性高
超出TIMESTAMP取值范围的使用DATETIME类型存储。
经常会有人用字符串存储日期型的数据(不正确的做法):
缺点1:无法用日期函数进行计算和比较
缺点2:用字符串存储日期要占用更多的空间
六、同财务相关的金额类数据必须使用decimal类型
1、非睛准浮点:float,double
2、睛准浮点:decimal
Decimal类型为睛准浮点数,在计算时不会丢失精度。占用空间由定义的宽度决定,每4个字节可以存储9位数字,并且小数点要占用一个字节。可用于存储比bigint更大的整型数据。