Database Basic Knowledge Review

MySQL

Publish Date: 2021-08-29

Update Date: 2022-06-16

Word Count: 4.7k

一、数据库概念

1、基本概念

数据库：DataBase 简称 DB

概念：用于存储和管理数据的仓库

2、特点

持久化的存储数据。数据库本质是一个文件系统
方便存储和管理数据
使用了统一的方式操作数据库 — SQL

3、常用的数据库软件

MySQL：开源免费的数据库，小型的数据库
Oracle ：收费的大型数据库，Oracle 公司产品
DB2 ：IBM 公司的收费数据库产品，常用于银行系统
SQLServer ：Microsoft 公司收费的中型数据库，C#、.net 等语言常用
SyBass ：现在已经不用了，但是它提供了一个非常专业的数据建模的工具：PowerDesigner
SQLite：嵌入式的小型数据库，常用于手机端
常用数据库：MySQL、Oracle

web 应用中，使用最多的是 MySQL 数据库，原因如下：

开源、免费
功能足够强大，足以应付 web 开发（最高支持千万级别的并发访问）

二、SQL

1、简介

什么是 SQL ？

Structured Query Language：结构化查询语言
- 其实就是定义了操作所有关系型数据库的规则。每一种数据库操作的方式存在不一样的地方，称为 “方言”

2、SQL 通用用法

SQL 语句可以单行或多行书写，以分号结尾
可使用缩进和空格来增强语句的可读性
MySQL 数据库的 SQL 语句不区分大小写，关键字建议使用大写
3 种注释：
1. 单行注释：-- 注释内容 或 # 注释内容
2. 多行注释：/* 注释内容 */

3、SQL 分类

按照功能不同分为 4 类：

DDL (Data Definition Language) 数据定义语言
- 用来定义数据库对象：数据库、表、列等等。关键字：create、drop、alter 等等
DML (Data Manipulation Language) 数据操作语言
- 用来对数据库中的表的数据进行增删改。关键字：insert、delete、update 等等
DQL (Data Query Language) 数据查询语言
- 用来查询数据库中表的记录（数据）。关键字：select、where 等等
DCL (Data Control Language) 数据控制语言（了解）
- 用来定义数据库的访问权限和安全级别，及创建用户。关键字：GRANT、REVOKE 等等

4、DDL 操作数据库、表

操作数据库：CRUD

C（Create）：创建
- 创建数据库：create database 数据库名称;
- 创建数据库时判断是否已经存在：create database if not exists 数据库名称;
R（Retrieve）：查询
- 查询所有数据库名称：show databases;
- 查询某个数据库的字符集（数据库的创建语句）：show create database 数据库名称;
U（Update）：修改
- 修改数据库字符集：alter database 数据库名称 character set 字符集名称;
D（Delete）：删除
- 删除数据库：drop database 数据库名称;
- 判断数据库存在然后再删除：drop database if exists 数据库名称;
使用数据库：
- 查询当前正在使用的数据库名称：select database();
- 使用数据库：use 数据库名称

操作表

C（Create）：创建
- create table 表名(列名1 数据类型1, 列名2 数据类型2 ... 列名n 数据类型n);
- 复制表：create table 表名 like 被复制的表名
- 注意：最后一个列必须要加逗号
- 数据类型：
  - int：整数类型
  - double：小数类型
  - date：日期，只包含年月日 yyyy-MM-dd
  - datetime：日期，包含年月日时分秒 yyyy-MM-dd HH:mm:ss
  - timestamp：时间戳包含年月日时分秒 yyyy-MM-dd HH:mm:ss 如果不给这个字段赋值，或赋值为 null，则默认使用当前的系统时间，来自动赋值
  - varchar：字符串
    - name varchar(20)：姓名最大 20 个字符
R（Retrieve）：查询
- 查询某个数据库中所有表：show tables;
- 查看表结构：desc 表名;
U（Update）：修改
- 修改表名：alter table 旧表名 rename to 新表名;
- 修改表的字符集：alter table 表名 character set 字符集名称;
- 添加一列：alter table 表名 add 列名数据类型;
- 修改列名称、类型：
  - 改名称：alter table 表名 change 旧列名新列名新数据类型;
  - 改类型：alter table 表名 modify 列名新数据类型;
- 删除列：alter table 表名 drop 列名;
D（Delete）：删除
- drop table 表名;
- drop table if exists 表名;

5、DML 增删改表中数据

添加数据
- 注意：除了数据类型，其他类型都需要使用引号（单、双都可以）引起来
删除数据
- 注意：删除表的方式
  - delete from 表名：没有条件，则删除表中所有记录，效率太低，一条一条的删除记录，不推荐使用
  - truncate table 表名：删除表，然后再创建一个一模一样的空表，推荐使用，效率更高
修改数据

6、DQL 查询表中记录

（1）语法

select
- 字段列表
from
- 表名列表
where
- 条件列表
group by
- 分组字段
having
- 分组之后的条件
order by
- 排序
limit
- 分页限定

（2）基础查询

多字段查询
- select 字段1, 字段2, ... 字段n from 表名;
去除重复结果
- select distinct 字段列表 from 表名;
计算列：null 字段参于计算，结果都为 null
- 可以使用函数判断是否为 null，然后替换为其他数字：IFNULL(字段名, 替换的数字)，比如：IFNULL(‘course_score’, 0);
起别名
- as，as 可以省略

（3）条件查询

where 子句后面跟条件
运算符
- >、<、<=、>=、=、<>
- BETWEEN … AND
- IN （集合）
- LIKE
  - 模糊查询可借助常用正则表达式：锁定一位字符 _，匹配多位字符 %
- IS NULL
- and 或 &&
- or 或 ||
- not 或！

（4）排序查询

排序查询：

语法：order by 子句
- order by 排序字段排序方式
- 排序方式，升序（默认）：ASC 降序：DESC
- 如果有多个排序条件，则当前面的条件值一样时，才会判断第二条件

（5）聚合函数

聚合函数：将一列数据作为一个整体，进行纵向的计算

count：计算个数
- 一般选择非空的列：主键
max：计算最大值
min：计算最小值
sum：求和
avg：计算平均值

（6）分组查询

语法：group by 分组字段
注意：
- 分组之后查询的字段：分组字段、聚合函数
- where 和 having 的区别？
  - where 在分组之前进行限定，如果不满足条件，则不参与分组
  - having 在分组之后进行限定，如果不满足条件，就不会被查询出来
  - where 后不可以跟聚合函数，而 having 可以进行聚合函数的判断

（7）分页查询

语法：limit 开始的索引，每页查询的条数;
例如：每页显示 3 条记录
- 第一页：limit 0 3;
- 第二页：limit 3 3;
- …
- 公式：开始的索引 = （当前的页码 - 1）* 每一页显示的条数
limit 是一个 MySQL 的 “方言”

三、约束

1、概念

约束：对表中的数据进行限定，保证数据的正确性、有效性和完整性

2、分类

主键约束：primary key
非空约束：not null
唯一约束：unique
外键约束：foreign key

3、简介

非空约束

not null：值不能为 null
- 创建表时添加约束：create table 表名(name varchar(20) NOT NULL);
- 创建表之后删除非空约束：alter table 表名 midify name varchar(20);
- 创建表之后添加非空约束：alter table 表名 midify name varchar(20) NOT NULL;

唯一约束

unique，值不能重复
- 同上

主键约束

primary key
- 含义：非空且唯一
- 一张表只能有一个字段为主键
- 主键就是表中记录的唯一标识
创建表时添加create table 表名(id INT PRIMARY KEY);
创建完表后添加和删除主键约束同上
自动增长：
- 概念：如果某一列是数值类型，使用 auto_increment 可以完成值的自动增长
- 例如：创建表指定字段为主键且自增：create table 表名(id int primary key auto_increment);
- 创建表之后添加或删除自动增长同上

外键约束

foreign key
创建表时添加外键

create table 表名(
		....
  	外键列
  	constraint 外键名称 foreign key 外键列名称 references 主表名称(主表列名称)
);

比如员工表和部门表之间的关联：一个员工属于一个部门:

create table employee {
		# 员工 id
		id int primary key,
		name varchar(20),
		...
		# 外键
		dep_id int CONSTRAINT emp_dept_fk FOREIGN KEY (dep_id) REFERENCES department(id)
}

创建表后删除外键
- alter table 表名 drop foreign key 外键名
创建表后添加外键
- alter table 表名 add constraint 外键名 foreign key 外键列名 references 主表名称(主表列名称)

外键级联操作：
- 需要在添加外键的时候设置级联更新

create table employee {
		# 员工 id
		id int primary key,
		name varchar(20),
		...
		# 外键
		dep_id int CONSTRAINT emp_dept_fk FOREIGN KEY (dep_id) REFERENCES department(id) ON UPDATE CASCADE
}

创建表后设置级联更新，级联删除：
- 级联更新：alter table 表名 add constraint 外键名 foreign key 外键列名 references 主表名称(主表列名称) on update cascade
- 级联删除：alter table 表名 add constraint 外键名 foreign key 外键列名 references 主表名称(主表列名称) on delete cascade

四、数据库设计

1、多表关系

一对一
- 一对一实现，可以在任意一方添加外键指向另一方的主键
一对多
- 在多的一方建立外键，指向一的一方的主键
多对多
- 多对多关系实现需要借助第三张中间表
- 中间表至少包含两个字段，这两个字段作为第三张表的外键，分别指向两张表的主键（联合主键）

2、设计的范式

概念：设计数据库时，需要遵守一些规范

设计关系型数据库时，遵从不同的规范要求，设计出合理的关系型数据库，这些不同的规范要求被称为不同的范式，各种范式呈递次规范，越高的范式数据库冗余就越小。

注：要遵循后面的范式，必须先遵循前面的范式

目前关系型数据库有六种范式：

第一范式（1NF）
第二范式（2NF）
第三范式（3NF）
巴斯-科德范式（BCNF）
第四范式（4NF）
第五范式（5NF，又称为完美范式）

分类

第一范式（1NF）：每一列都是不可分割的原子数据项
第二范式（2NF）：在 1NF 的基础上，非码属性必须完全依赖于候选码（主码也称为候选码）（在 1NF 基础上消除非主属性对主码的部分函数依赖）
- 几个概念：
- 函数依赖：A –> B，如果通过 A 属性（属性组）的值，可以确定 B 属性的值，则称 B 依赖于 A
  - 如学号被姓名所依赖学号 –> 姓名，（学号，课程）–> 分数
- 完全函数依赖：A –> B，如果 A 是一个属性组，则 B 属性值的确定需要 A 属性组中所有的属性值
  - 例如：（学号，课程）–> 分数
- 部分函数依赖：A –> B，如果 A 是一个属性组，则 B 属性值的确定只需要依赖于 A 属性组中某一些属性的值
  - 例如：（学号，课程名称）–> 姓名
- 传递函数依赖：A –> B，B –> C，如果通过 A 属性（属性组）的值，可以确定唯一 B 属性的值，在通过 B 属性（属性组）的值可以确定唯一 C 属性的值，则称 C 传递函数依赖于 A
  - 例如：学号 –> 系名，系名 –> 系主任
- 码：如果在一张表中，一个属性或属性组，被其他所有属性所完全依赖，则称这个属性（属性组）为该表的码
  - 主属性：码属性组中的所有属性
  - 非主属性：除了主属性的其他属性
第三范式（3NF）：在 2NF 基础上，任何非主属性不依赖于其他非主属性（在 2NF 基础上消除传递依赖）

五、数据库的备份和还原

命令行：
- 语法：
  - 备份：mysqldump -u用户名 -p密码 > 保存的路径 最后会生成一个备份文件
  - 还原：
    1. 登录数据库
    2. 创建数据库：要求数据库名字和刚刚备份的数据库名字一样
    3. 使用数据库
    4. 执行文件。source 文件路径
图形化工具：

六、多表查询

查询语法：

select
- 列名列表
from
- 表名列表
where

比如：

select * from employee, department;

这样查询出来的结果是两张表记录数相乘 A * B，也称为笛卡尔积

如果我们想要对结果进行过滤，消除错误、冗余数据，就需要使用以下这些多表联查：

内连接查询
- 隐式内连接：使用 where 条件消除无用数据
- 显式内连接：使用 inner join on

隐式：

select e.name, d.name
from employee as e,    -- 员工表 
		 department as d   -- 部门表
where e.dept_id = d.id

显式：

select e.name, d.name
from employee as e
inner join department as d
on e.dept_id = d.id

外连接查询
- 左外连接：
  - 语法 select 字段列表 from 表1 left [outer] join 表2 on 条件;
  - 查询左表所有数据以及左表与右表的交集部分
- 右外连接
  - 语法 select 字段列表 from 表1 right [outer] join 表2 on 条件;
  - 查询右表所有数据以及左表与右表的交集部分
子查询（可以使用自联结替代）
- 查询中嵌套查询
- 子查询不同情况
  - 子查询结果是单行单列的
    - 子查询可以作为条件，使用运算符去判断，>、>=、<、<=、=
  - 子查询结果是多行单列的
    - 子查询可以作为条件，使用运算符 in 来判断
  - 子查询结果是多行多列的
    - 子查询可以作为一张虚拟表，参于多表连接查询

七、事务

1、事务的基本概念

事务的基本概念：

如果一个包含多个步骤的业务操作，被事务托管，那么这些操作要么同时成功，要么同时失败。

操作：

开启事务：start transaction;
提交：commit；
回滚：rollback；

经典的场景就是转账问题

例如：张三和李四账户上都各有 1000 块，张三给李四转 500，最后张三剩 500，李四有 1500

-- 0. 开启事务
start transaction;

-- 1. 判断账户余额是否足够
select 1 from account where name = '张三' and balance > 500;
-- 2. 张三 -500
update account set balance = balance - 500 where name = '张三';
-- 3. 李四 +500
update account set balance = balance + 500 where name = '李四';

-- 下面两个操纵需要我们二选一
-- 没有问题就提交
commit;

-- 出现问题就回滚
rollback;

注：在 MySQL 中事务默认自动提交

事务提交的两种方式：
- 自动提交
  - 一条 DML 语句，语句会自动提交一次事务
- 手动提交：先开启事务，在提交事务
修改事务的默认提交方式
- 查看事务的默认提交方式：select @@autocommit;
  - 1 代表自动提交
  - 0 代表手动提交
- 修改默认提交方式：set @@autocommit = 0;

MySQL 数据库默认自动提交，Oracle 数据库默认手动提交

2、事务的四大特征

原子性：是不可分割的最小操作单位，要么同时成功，要么同时失败
持久性：当事务提交或回滚后，数据库会持久化的保存数据
隔离性：多个事务之间。相互独立。
一致性：事务操作前后数据总量不变

3、事务的隔离级别

概念：

多个事务之间隔离的，即相互独立的。但是如果多个事务操作同一批数据则会引发一些问题，设置不同的隔离级别就可以解决这些问题。

存在问题：

脏读：一个事务读取到另一个事务中没有提交的数据
不可重复读（虚读）：在同一个事务中两次读取到的数据不一样
幻读：一个事务操作（DML）数据表中所有记录，另一个事务添加了一条数据，则第一条事务查询不到自己的修改（比如，系统管理员 A 将数据库中所有学生的成绩从具体分数改为 ABCDE 等级，但是系统管理员 B 就在这个时候插入了一条具体分数的记录，当系统管理员 A 改结束后发现还有一条记录没有改过来，就好像发生了幻觉一样，这就叫幻读。）
注：幻读很难通过命令行界面去复现，前两个都可以复现

隔离级别：

read uncommitted：读未提交
- 产生的问题：脏读、不可重复读、幻读
read committed：读已提交（Oracle 默认）
- 产生的问题：不可重复读、幻读
repeatable read：可重复读（MySQL 默认）
- 产生的问题：幻读
serializable：串行化
- 可以解决所有问题
- 串行化，其实就是锁定整张表，事务开启后锁定需要使用到的表，其他事务无法对这些表读或写。所以虽然安全，但是效率极低。

注意：隔离级别从小到大，安全性越来越高，但是效率也越来越低，所以我们需要设置一个合适的隔离级别，既保证相对安全，又保证效率。

数据库设置隔离级别：

查询隔离级别：select @@tx_isolation;
设置隔离级别：set global transaction isolation level 级别字符串;

八、DCL 管理数据库

1、用户管理

DBA ：数据库管理员

DCL：管理用户、授权

MySQL 有一个系统数据库叫做 mysql ，其中有一张表 user 管理所有数据库用户。

管理用户
- 添加用户：
  - create user '用户名'@'主机名' identified by '密码';
- 删除用户
  - drop user '用户名'@'主机名';
- 修改用户密码
  - update user set password = PASSWORD('新密码') where user = '用户名';
  - set password for '用户名'@'主机名' = PASSWORD('新密码');
  - 如果 root 用户密码忘记了：
    - cmd 执行 net stop mysql 停止 mysql 服务（需要管理员运行 cmd）
    - 使用无验证方式启动 mysql 服务：mysqld --skip-grant-tables，然后开启另一个 cmd 窗口，直接输入 mysql 登录服务器，然后修改密码，然后关闭两个 cmd
    - 使用任务管理器结束 mysql 服务
    - 最后再次启动服务，使用新密码登录
- 查询用户：
  - use mysql;
  - select * from user;
  - 注意查询出的字段 Host
    - 通配符 %：表示用户可以在任何主机登录数据库（不限制 ip）
    - localhost：仅限本机登录

2、权限管理

查询权限
- 查询某用户权限：show grants for '用户名'@'主机名';
授予权限
- 授予权限
- grant 权限列表 on 数据库名.表名 to '用户名'@'主机名'
撤销权限
- 撤销权限
- revoke 权限列表 on 数据库名.表名 from '用户名'@'主机名'

NaiveKyo

https://naivekyo.github.io/2021/08/29/database-basic-knowledge-review/

All articles in this blog are used except for special statements CC BY 4.0 reprint polocy. If reproduced, please indicate source NaiveKyo !

MySQL

Design Patterns Overview

设计模式概述

2021-08-31 Design Patterns

Design Patterns

Java JDBC Review

回顾 Java JDBC 相关知识

2021-08-29 Java

Java

Database Basic Knowledge Review

一、数据库概念

1、基本概念

2、特点

3、常用的数据库软件

二、SQL

1、简介

2、SQL 通用用法

3、SQL 分类

4、DDL 操作数据库、表

5、DML 增删改表中数据

6、DQL 查询表中记录

三、约束

1、概念

2、分类

3、简介

四、数据库设计

1、多表关系

2、设计的范式

五、数据库的备份和还原

六、多表查询

七、事务

1、事务的基本概念

2、事务的四大特征

3、事务的隔离级别

八、DCL 管理数据库

1、用户管理

2、权限管理

OvO