你可以将数据库想象为一个专门存储数据对象的容器——这些对象包括表、视图、触发器、存储过程等,而表是最基础、最核心的部分。在使用 MySQL 创建这些数据对象之前,首先需要完成一个关键步骤:创建数据库。

那么,在 MySQL 中创建数据库应该使用哪条语句?答案正是 CREATE DATABASE,其语法格式如下:
CREATE DATABASE [IF NOT EXISTS] <数据库名> [[DEFAULT] CHARACTER SET <字符集名>] [[DEFAULT] COLLATE <校对规则名>];
方括号 [ ] 内的内容为可选参数,每个部分的含义请继续阅读:
<数据库名>:用于指定新数据库的名称。MySQL 会将每个数据库在磁盘上以目录形式存储,因此数据库名必须符合操作系统的文件夹命名规则——此外,MySQL 内部不区分大小写,这一点可以稍微放宽要求。
IF NOT EXISTS:添加此选项后,MySQL 会在创建前进行检查:如果同名数据库已存在,则跳过创建操作,避免报错。若不添加,重复创建时则会直接抛出错误。
[DEFAULT] CHARACTER SET:指定数据库的默认字符集。字符集决定了 MySQL 如何存储字符串数据。
[DEFAULT] COLLATE:指定字符集的默认校对规则。校对规则决定了字符串的比较方式,即排序和字符分组时的规则。
这里有一个关键概念需要明确:字符集与校对规则之间存在一对多的关系——每个字符集至少对应一个校对规则。MySQL 目前支持 39 种字符集,近 200 种校对规则,足以满足大多数场景需求。
实例1:最简单的创建语句
假如你希望在 MySQL 中创建一个名为 test_db 的数据库,可以直接在命令行客户端输入以下命令:
mysql> CREATE DATABASE test_db;
Query OK, 1 row affected (0.00 sec)
完成。但如果你不小心重复执行同样的语句,系统会返回错误提示:
mysql> CREATE DATABASE test_db;
ERROR 1007 (HY000): Can't create database 'test_db'; database exists
MySQL 不允许创建两个同名的数据库。不过不用担心,添加 IF NOT EXISTS 即可避免这种尴尬:
mysql> CREATE DATABASE IF NOT EXISTS test_db;
Query OK, 1 row affected (0.12 sec)
这样即使数据库已存在,也不会报错,仅提示影响行数为 0。
实例2:创建时指定字符集和校对规则
有时你需要从一开始就明确指定字符集,以防止后续出现字符混乱问题。例如,创建一个名为 test_db_char 的数据库,指定字符集为 utf8,校对规则为 utf8_chinese_ci(简体中文,不区分大小写):
mysql> CREATE DATABASE IF NOT EXISTS test_db_char
-> DEFAULT CHARACTER SET utf8
-> DEFAULT COLLATE utf8_chinese_ci;
Query OK, 1 row affected (0.03 sec)
创建完成后,你可以使用 SHOW CREATE DATABASE 查看该数据库的定义声明:
mysql> SHOW CREATE DATABASE test_db_char\G
+--------------+-----------------------------------------------------+
| Database | Create Database |
+--------------+-----------------------------------------------------+
| test_db_char | CREATE DATABASE `test_db_char` /*!40100 DEFAULT CHARACTER SET utf8 */ |
+--------------+-----------------------------------------------------+
1 row in set (0.05 sec)
可以看到,指定的字符集 utf8 已被成功记录。为避免字符混乱,MySQL 有时需要在创建数据库时明确设置字符集。在中国大陆地区,常用的字符集主要有 utf8 和 gbk 两种:
- utf8 能够存储全球所有字符,适用于任何国家/地区,默认校对规则为
utf8_general_ci,处理中文时选择utf8_general_ci即可。 - gbk 仅能存储汉语相关的字符,不具备全球通用性,默认校对规则为
gbk_chinese_ci。
根据实际项目需求选择恰当的字符集,养成良好的习惯,可以为后续开发省去不少麻烦。
