编码区别

在mysql中存在着各种utf8编码格式,如下(新建数据库时一般选用utf8_general_ci就可以):
utf8_bin:将字符串中的每一个字符用二进制数据存储,区分大小写(在二进制中 ,小写字母 和大写字母 不相等.即 a !=A)。
utf8_genera_ci:不区分大小写,ci为case insensitive的缩写(insensitive ; 中文解释: adj. 感觉迟钝的,对…没有感觉的),即大小写不敏感。
utf8_general_cs:区分大小写,cs为case sensitive的缩写(sensitive 中文解释:敏感事件;大小写敏感;注重大小写;全字拼写须符合),即大小写敏感
utf8_unicode_ci:不能完全支持组合的记号。

应用上的差别

  1. utf8_general_ci与utf8_unicode_ci

    一句话概况:utf8_unicode_ci比较准确,utf8_general_ci速度比较快。

  2. utf8_general_ci与utf8_bin

    用utf8_genera_ci没有区分大小写,导致这个字段的内容区分大小写时出问题:
    作为密码时就会出现不合理的方面;
    而验证码则一般不区分大小写,所以用这个就合理
    utf8_general_cs这个选项一般不用,所以使用utf8_bin区分大小写

修改编码

两种修改方案:

  1. 通过SQL(结构化查询语言(Structured Query Language))来修改
    alter table emp modify ename varchar(30) collate utf8_general_ci
  2. 直接通过设计表,点击需要修改字段,直接可修改utf8_general_ci为utf8_bin。

示例

CREATE TABLE `t_bin` (
`id` int(11) DEFAULT NULL,
`name` varchar(20) DEFAULT NULL,
UNIQUE KEY `uk_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

CREATE TABLE `t_ci` (
`id` int(11) DEFAULT NULL,
`name` varchar(20) DEFAULT NULL,
UNIQUE KEY `uk_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_general_ci;

CREATE TABLE `t_default` (
`id` int(11) DEFAULT NULL,
`name` varchar(20) DEFAULT NULL,
UNIQUE KEY `uk_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

执行以下语句:

insert into t_bin values (1, 'Alex');
insert into t_bin values (2, 'alex');

insert into t_ci values (1, 'Alex');
insert into t_ci values (2, 'alex');

insert into t_default values (1, 'Alex');
insert into t_default values (2, 'alex');

结果如下:

insert into t_bin values (1, 'Alex')
> Affected rows: 1
> 时间: 0.067s


insert into t_bin values (2, 'alex')
> Affected rows: 1
> 时间: 0.031s


insert into t_ci values (1, 'Alex')
> Affected rows: 1
> 时间: 0.098s


insert into t_ci values (2, 'alex')
> 1062 - Duplicate entry 'alex' for key 'uk_name'
> 时间: 0.024s
> 

分析:

编码为utf8_bin时,Alex和alex被认为是两个不同的值,区分大小写;
编码为utf8_general_ci时,即默认的编码时,Alex和alex被认为是相同的值,不区分大小写。
所以在选择编码的时候应该注意区分。
Logo

更多推荐