MySQL_编码utf8_bin和utf8_general_ci的区别
编码区别在mysql中存在着各种utf8编码格式,如下(新建数据库时一般选用utf8_general_ci就可以):**utf8_bin:**将字符串中的每一个字符用二进制数据存储,区分大小写(在二进制中 ,小写字母 和大写字母 不相等.即 a !=A)。**utf8_genera_ci:**不区分大小写,ci为case insensitive的缩写(insensitive ; 中文解释: ...
编码区别
在mysql中存在着各种utf8编码格式,如下(新建数据库时一般选用utf8_general_ci就可以):
utf8_bin:将字符串中的每一个字符用二进制数据存储,区分大小写(在二进制中 ,小写字母 和大写字母 不相等.即 a !=A)。
utf8_genera_ci:不区分大小写,ci为case insensitive的缩写(insensitive ; 中文解释: adj. 感觉迟钝的,对…没有感觉的),即大小写不敏感。
utf8_general_cs:区分大小写,cs为case sensitive的缩写(sensitive 中文解释:敏感事件;大小写敏感;注重大小写;全字拼写须符合),即大小写敏感
utf8_unicode_ci:不能完全支持组合的记号。
应用上的差别
-
utf8_general_ci与utf8_unicode_ci
一句话概况:utf8_unicode_ci比较准确,utf8_general_ci速度比较快。
-
utf8_general_ci与utf8_bin
用utf8_genera_ci没有区分大小写,导致这个字段的内容区分大小写时出问题:
作为密码时就会出现不合理的方面;
而验证码则一般不区分大小写,所以用这个就合理
utf8_general_cs这个选项一般不用,所以使用utf8_bin区分大小写
修改编码
两种修改方案:
- 通过SQL(结构化查询语言(Structured Query Language))来修改
alter table emp modify ename varchar(30) collate utf8_general_ci - 直接通过设计表,点击需要修改字段,直接可修改utf8_general_ci为utf8_bin。
示例
CREATE TABLE `t_bin` (
`id` int(11) DEFAULT NULL,
`name` varchar(20) DEFAULT NULL,
UNIQUE KEY `uk_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin;
CREATE TABLE `t_ci` (
`id` int(11) DEFAULT NULL,
`name` varchar(20) DEFAULT NULL,
UNIQUE KEY `uk_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_general_ci;
CREATE TABLE `t_default` (
`id` int(11) DEFAULT NULL,
`name` varchar(20) DEFAULT NULL,
UNIQUE KEY `uk_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
执行以下语句:
insert into t_bin values (1, 'Alex');
insert into t_bin values (2, 'alex');
insert into t_ci values (1, 'Alex');
insert into t_ci values (2, 'alex');
insert into t_default values (1, 'Alex');
insert into t_default values (2, 'alex');
结果如下:
insert into t_bin values (1, 'Alex')
> Affected rows: 1
> 时间: 0.067s
insert into t_bin values (2, 'alex')
> Affected rows: 1
> 时间: 0.031s
insert into t_ci values (1, 'Alex')
> Affected rows: 1
> 时间: 0.098s
insert into t_ci values (2, 'alex')
> 1062 - Duplicate entry 'alex' for key 'uk_name'
> 时间: 0.024s
>
分析:
编码为utf8_bin时,Alex和alex被认为是两个不同的值,区分大小写;
编码为utf8_general_ci时,即默认的编码时,Alex和alex被认为是相同的值,不区分大小写。
所以在选择编码的时候应该注意区分。
更多推荐
所有评论(0)