SQL 语法基础特性
# SQL 语法基础特性
本文针对关系型数据库的基本语法。限于篇幅,本文侧重说明用法,不会展开讲解特性、原理。
本文语法主要针对 Mysql,但大部分的语法对其他关系型数据库也适用。
# SQL 简介
# 数据库术语
数据库(database)
- 保存有组织的数据的容器(通常是一个文件或一组文件)。数据表(table)
- 某种特定类型数据的结构化清单。模式(schema)
- 关于数据库和表的布局及特性的信息。模式定义了数据在表中如何存储,包含存储什么样的数据,数据如何分解,各部分信息如何命名等信息。数据库和表都有模式。列(column)
- 表中的一个字段。所有表都是由一个或多个列组成的。行(row)
- 表中的一个记录。主键(primary key)
- 一列(或一组列),其值能够唯一标识表中每一行。
# SQL 语法
SQL(Structured Query Language),标准 SQL 由 ANSI 标准委员会管理,从而称为 ANSI SQL。各个 DBMS 都有自己的实现,如 PL/SQL、Transact-SQL 等。
# SQL 语法结构
SQL 语法结构包括:
子句
- 是语句和查询的组成成分。(在某些情况下,这些都是可选的。)表达式
- 可以产生任何标量值,或由列和行的数据库表谓词
- 给需要评估的 SQL 三值逻辑(3VL)(true/false/unknown)或布尔真值指定条件,并限制语句和查询的效果,或改变程序流程。查询
- 基于特定条件检索数据。这是 SQL 的一个重要组成部分。语句
- 可以持久地影响纲要和数据,也可以控制数据库事务、程序流程、连接、会话或诊断。
# SQL 语法要点
- SQL 语句不区分大小写,但是数据库表名、列名和值是否区分,依赖于具体的 DBMS 以及配置。
例如:SELECT
与 select
、Select
是相同的。
多条 SQL 语句必须以分号(
;
)分隔。处理 SQL 语句时,所有空格都被忽略。SQL 语句可以写成一行,也可以分写为多行。
-- 一行 SQL 语句
UPDATE user SET username='robot', password='robot' WHERE username = 'root';
-- 多行 SQL 语句
UPDATE user
SET username='robot', password='robot'
WHERE username = 'root';
- SQL 支持三种注释
## 注释1
-- 注释2
/* 注释3 */
# SQL 分类
# 数据定义语言(DDL)
数据定义语言(Data Definition Language,DDL)是 SQL 语言集中负责数据结构定义与数据库对象定义的语言。
DDL 的主要功能是定义数据库对象。
DDL 的核心指令是 CREATE
、ALTER
、DROP
。
# 数据操纵语言(DML)
数据操纵语言(Data Manipulation Language, DML)是用于数据库操作,对数据库其中的对象和数据运行访问工作的编程语句。
DML 的主要功能是 访问数据,因此其语法都是以读写数据库为主。
DML 的核心指令是 INSERT
、UPDATE
、DELETE
、SELECT
。这四个指令合称 CRUD(Create, Read, Update, Delete),即增删改查。
# 事务控制语言(TCL)
事务控制语言 (Transaction Control Language, TCL) 用于管理数据库中的事务。这些用于管理由 DML 语句所做的更改。它还允许将语句分组为逻辑事务。
TCL 的核心指令是 COMMIT
、ROLLBACK
。
# 数据控制语言(DCL)
数据控制语言 (Data Control Language, DCL) 是一种可对数据访问权进行控制的指令,它可以控制特定用户账户对数据表、查看表、预存程序、用户自定义函数等数据库对象的控制权。
DCL 的核心指令是 GRANT
、REVOKE
。
DCL 以控制用户的访问权限为主,因此其指令作法并不复杂,可利用 DCL 控制的权限有:CONNECT
、SELECT
、INSERT
、UPDATE
、DELETE
、EXECUTE
、USAGE
、REFERENCES
。
根据不同的 DBMS 以及不同的安全性实体,其支持的权限控制也有所不同。
(以下为 DML 语句用法)
# 增删改查(CRUD)
增删改查,又称为 CRUD
,是数据库基本操作中的基本操作。
# 插入数据
INSERT INTO
语句用于向表中插入新记录。
# 插入完整的行
INSERT INTO user
VALUES (10, 'root', 'root', 'xxxx@163.com');
# 插入行的一部分
INSERT INTO user(username, password, email)
VALUES ('admin', 'admin', 'xxxx@163.com');
# 插入查询出来的数据
INSERT INTO user(username)
SELECT name
FROM account;
# 更新数据
UPDATE
语句用于更新表中的记录。
UPDATE user
SET username='robot', password='robot'
WHERE username = 'root';
# 删除数据
DELETE
语句用于删除表中的记录。TRUNCATE TABLE
可以清空表,也就是删除所有行。
# 删除表中的指定数据
DELETE FROM user WHERE username = 'robot';
# 清空表中的数据
TRUNCATE TABLE user;
# 查询数据
SELECT
语句用于从数据库中查询数据。DISTINCT
用于返回唯一不同的值。它作用于所有列,也就是说所有列的值都相同才算相同。LIMIT
限制返回的行数。可以有两个参数,第一个参数为起始行,从 0 开始;第二个参数为返回的总行数。
ASC
:升序(默认)DESC
:降序
# 查询单列
SELECT prod_name FROM products;
# 查询多列
SELECT prod_id, prod_name, prod_price FROM products;
# 查询所有列
SELECT * FROM products;
# 查询不同的值
SELECT DISTINCT vend_id FROM products;
# 限制查询数量
-- 返回前 5 行
SELECT * FROM products LIMIT 5;
SELECT * FROM products LIMIT 0, 5;
-- 返回第 3 ~ 5 行
SELECT * FROM products LIMIT 2, 3;
# 过滤数据(WHERE)
子查询是嵌套在较大查询中的 SQL 查询。子查询也称为内部查询或内部选择,而包含子查询的语句也称为外部查询或外部选择。
子查询可以嵌套在
SELECT
,INSERT
,UPDATE
或DELETE
语句内或另一个子查询中。子查询通常会在另一个
SELECT
语句的WHERE
子句中添加。您可以使用比较运算符,如
>
,<
,或=
。比较运算符也可以是多行运算符,如IN
,ANY
或ALL
。子查询必须被圆括号
()
括起来。内部查询首先在其父查询之前执行,以便可以将内部查询的结果传递给外部查询。执行过程可以参考下图:
子查询的子查询
SELECT cust_name, cust_contact
FROM customers
WHERE cust_id IN (SELECT cust_id
FROM orders
WHERE order_num IN (SELECT order_num
FROM orderitems
WHERE prod_id = 'RGAN01'));
# WHERE 子句
在 SQL 语句中,数据根据 WHERE
子句中指定的搜索条件进行过滤。
WHERE
子句的基本格式如下:
SELECT ……(列名) FROM ……(表名) WHERE ……(子句条件)
WHERE
子句用于过滤记录,即缩小访问数据的范围。WHERE
后跟一个返回 true
或 false
的条件。
WHERE
可以与 SELECT
,UPDATE
和 DELETE
一起使用。
SELECT
语句中的 WHERE
子句
SELECT * FROM Customers
WHERE cust_name = 'Kids Place';
UPDATE
语句中的 WHERE
子句
UPDATE Customers
SET cust_name = 'Jack Jones'
WHERE cust_name = 'Kids Place';
DELETE
语句中的 WHERE
子句
DELETE FROM Customers
WHERE cust_name = 'Kids Place';
可以在 WHERE
子句中使用的操作符:
# 比较操作符
运算符 | 描述 |
---|---|
= | 等于 |
<> | 不等于。注释:在 SQL 的一些版本中,该操作符可被写成 != |
> | 大于 |
< | 小于 |
>= | 大于等于 |
<= | 小于等于 |
# 范围操作符
运算符 | 描述 |
---|---|
BETWEEN | 在某个范围内 |
IN | 指定针对某个列的多个可能值 |
IN
操作符在WHERE
子句中使用,作用是在指定的几个特定值中任选一个值。BETWEEN
操作符在WHERE
子句中使用,作用是选取介于某个范围内的值。
IN 示例
SELECT *
FROM products
WHERE vend_id IN ('DLL01', 'BRS01');
BETWEEN 示例
SELECT *
FROM products
WHERE prod_price BETWEEN 3 AND 5;
# 逻辑操作符
运算符 | 描述 |
---|---|
AND | 并且(与) |
OR | 或者(或) |
NOT | 否定(非) |
AND
、OR
、NOT
是用于对过滤条件的逻辑处理指令。
AND
优先级高于OR
,为了明确处理顺序,可以使用()
。AND
操作符表示左右条件都要满足。OR
操作符表示左右条件满足任意一个即可。NOT
操作符用于否定一个条件。
AND 示例
SELECT prod_id, prod_name, prod_price
FROM products
WHERE vend_id = 'DLL01' AND prod_price <= 4;
OR 示例
SELECT prod_id, prod_name, prod_price
FROM products
WHERE vend_id = 'DLL01' OR vend_id = 'BRS01';
NOT 示例
SELECT *
FROM products
WHERE prod_price NOT BETWEEN 3 AND 5;
# 通配符
运算符 | 描述 |
---|---|
LIKE | 搜索某种模式 |
% | 表示任意字符出现任意次数 |
_ | 表示任意字符出现一次 |
[] | 必须匹配指定位置的一个字符 |
LIKE
操作符在 WHERE
子句中使用,作用是确定字符串是否匹配模式。只有字段是文本值时才使用 LIKE
。
LIKE
支持以下通配符匹配选项:
%
表示任何字符出现任意次数。_
表示任何字符出现一次。[]
必须匹配指定位置的一个字符。
注意:不要滥用通配符,通配符位于开头处匹配会非常慢。
%
示例:
SELECT prod_id, prod_name, prod_price
FROM products
WHERE prod_name LIKE '%bean bag%';
_
示例:
SELECT prod_id, prod_name, prod_price
FROM products
WHERE prod_name LIKE '__ inch teddy bear';
# 排序(ORDER BY)
ORDER BY
用于对结果集进行排序。
ORDER BY
有两种排序模式:
ASC
:升序(默认)DESC
:降序
可以按多个列进行排序,并且为每个列指定不同的排序方式。
指定多个列的排序示例:
SELECT * FROM products
ORDER BY prod_price DESC, prod_name ASC;
# 数据定义(CREATE、ALTER、DROP)
DDL 的主要功能是定义数据库对象(如:数据库、数据表、视图、索引等)。
# 数据库(DATABASE)
# 创建数据库
CREATE DATABASE IF NOT EXISTS db_tutorial;
# 删除数据库
DROP DATABASE IF EXISTS db_tutorial;
# 选择数据库
USE db_tutorial;
# 数据表(TABLE)
# 删除数据表
DROP TABLE IF EXISTS user;
DROP TABLE IF EXISTS vip_user;
# 创建数据表
普通创建
CREATE TABLE user (
id INT(10) UNSIGNED NOT NULL COMMENT 'Id',
username VARCHAR(64) NOT NULL DEFAULT 'default' COMMENT '用户名',
password VARCHAR(64) NOT NULL DEFAULT 'default' COMMENT '密码',
email VARCHAR(64) NOT NULL DEFAULT 'default' COMMENT '邮箱'
) COMMENT ='用户表';
根据已有的表创建新表
CREATE TABLE vip_user AS
SELECT *
FROM user;
# 修改数据表
# 添加列
ALTER TABLE user
ADD age int(3);
# 删除列
ALTER TABLE user
DROP COLUMN age;
# 修改列
ALTER TABLE `user`
MODIFY COLUMN age tinyint;
# 视图(VIEW)
视图是基于 SQL 语句的结果集的可视化的表。视图是虚拟的表,本身不存储数据,也就不能对其进行索引操作。对视图的操作和对普通表的操作一样。
视图的作用:
- 简化复杂的 SQL 操作,比如复杂的连接。
- 只使用实际表的一部分数据。
- 通过只给用户访问视图的权限,保证数据的安全性。
- 更改数据格式和表示。
# 创建视图
CREATE VIEW top_10_user_view AS
SELECT id, username
FROM user
WHERE id < 10;
# 删除视图
DROP VIEW top_10_user_view;
# 索引(INDEX)
通过索引可以更加快速高效地查询数据。用户无法看到索引,它们只能被用来加速查询。
更新一个包含索引的表需要比更新一个没有索引的表花费更多的时间,这是由于索引本身也需要更新。因此,理想的做法是仅仅在常常被搜索的列(以及表)上面创建索引。
唯一索引:唯一索引表明此索引的每一个索引值只对应唯一的数据记录。
# 创建索引
CREATE INDEX idx_email
ON user(email);
# 创建唯一索引
CREATE UNIQUE INDEX uniq_username
ON user(username);
# 删除索引
ALTER TABLE user
DROP INDEX idx_email;
ALTER TABLE user
DROP INDEX uniq_username;
# 添加主键
ALTER TABLE user
ADD PRIMARY KEY (id);
# 删除主键
ALTER TABLE user
DROP PRIMARY KEY;
# 约束
SQL 约束用于规定表中的数据规则。
- 如果存在违反约束的数据行为,行为会被约束终止。
- 约束可以在创建表时规定(通过 CREATE TABLE 语句),或者在表创建之后规定(通过 ALTER TABLE 语句)。
- 约束类型
NOT NULL
- 指示某列不能存储 NULL 值。UNIQUE
- 保证某列的每行必须有唯一的值。PRIMARY KEY
- NOT NULL 和 UNIQUE 的结合。确保某列(或两个列多个列的结合)有唯一标识,有助于更容易更快速地找到表中的一个特定的记录。FOREIGN KEY
- 保证一个表中的数据匹配另一个表中的值的参照完整性。CHECK
- 保证列中的值符合指定的条件。DEFAULT
- 规定没有给列赋值时的默认值。
创建表时使用约束条件:
CREATE TABLE Users (
Id INT(10) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '自增Id',
Username VARCHAR(64) NOT NULL UNIQUE DEFAULT 'default' COMMENT '用户名',
Password VARCHAR(64) NOT NULL DEFAULT 'default' COMMENT '密码',
Email VARCHAR(64) NOT NULL DEFAULT 'default' COMMENT '邮箱地址',
Enabled TINYINT(4) DEFAULT NULL COMMENT '是否有效',
PRIMARY KEY (Id)
) ENGINE=InnoDB AUTO_INCREMENT=2 DEFAULT CHARSET=utf8mb4 COMMENT='用户表';
# 参考资料
- 《SQL 必知必会》 (opens new window)
- 『浅入深出』MySQL 中事务的实现 (opens new window)
- MySQL 的学习--触发器 (opens new window)
- 维基百科词条 - SQL (opens new window)
- https://www.sitesbay.com/sql/index (opens new window)
- SQL Subqueries (opens new window)
- Quick breakdown of the types of joins (opens new window)
- SQL UNION (opens new window)
- SQL database security (opens new window)
- Mysql 中的存储过程 (opens new window)