【MySQL】聚合查询与分组查询

我们先重建一个test库,在test库里新建一个people表(包含序列号,姓名,工资),再往表该表里新增六条数据:

mysql> drop database if exists test;
Query OK, 1 row affected (0.07 sec)

mysql> create database test;
Query OK, 1 row affected (0.00 sec)

mysql> use test;
Database changed
mysql> create table people(
    ->     id int primary key auto_increment,
    ->     name varchar(20),
    ->     careen varchar(20),
    ->     salary int
    -> );
Query OK, 0 rows affected (0.05 sec)

mysql> insert into people value(null,"张三","老师",3000);
Query OK, 1 row affected (0.01 sec)

mysql> insert into people value(null,"李四","老师",4000);
Query OK, 1 row affected (0.01 sec)

mysql> insert into people value(null,"王五","老师",5000);
Query OK, 1 row affected (0.01 sec)

mysql> insert into people value(null,"赵六","医生",60000);
Query OK, 1 row affected (0.00 sec)

mysql> insert into people value(null,"小七","医生",70000);
Query OK, 1 row affected (0.00 sec)

mysql> insert into people value(null,null,null,null);
Query OK, 1 row affected (0.00 sec)

mysql> select * from people;
+----+--------+--------+--------+
| id | name   | careen | salary |
+----+--------+--------+--------+
|  1 | 张三   | 老师   |   3000 |
|  2 | 李四   | 老师   |   4000 |
|  3 | 王五   | 老师   |   5000 |
|  4 | 赵六   | 医生   |  60000 |
|  5 | 小七   | 医生   |  70000 |
|  6 | NULL   | NULL   |   NULL |
+----+--------+--------+--------+
6 rows in set (0.00 sec)

接下来我们就针对该表进行聚合查询操作~

♫聚合查询

前面我们所用的基础的查询操作只能对每行进行独立的查询操作,而要是想要查询的结果是该列所有数据的平均值,最大或最小值,则需要使用聚合查询才能做到。聚合查询需要用到聚合函数,因此,要学会聚合查询,首先得先了解下MySQL中的聚合函数。

♪聚合函数

常见的聚合函数有以下几种:

函数 描述
COUNT([DISTINCT] expr)
返回查询到的数据的数量
AVG([DISTINCT] expr)
返回查询到的数据的总和,不是数字没有意义
SUM([DISTINCT] expr)
返回查询到的数据的平均值,不是数字没有意义
MAX([DISTINCT] expr)
返回查询到的数据的最大值,不是数字没有意义
MIN([DISTINCT] expr)
返回查询到的数据的最小值,不是数字没有意义

知道了聚合函数,接下来就可以使用这些聚合函数进行聚合查询操作了。

♪查询表的行数

查询表的行数需要用到聚合函数count():

语法:select count(*) from 表名;

mysql> select count(*) from people;
+----------+
| count(*) |
+----------+
|        6 |
+----------+
1 row in set (0.00 sec)

此外count(常量)也能查询表的行数:

语法:select count(常量) from 表名;

mysql> select count(1) from people;
+----------+
| count(1) |
+----------+
|        6 |
+----------+
1 row in set (0.00 sec)

注:

①.count(1)和count(*)的实现方式略有不同,count(1)是对表中的每一行都执行一次计数操作,而count(*)则是对整个表执行计数操作

②.查询表的行数包括全为NULL的行

♪查询表某一列的行数

单独查询表某一列有几行也是需要用到count():

语法:select count(列名/表达式) from 表名;

mysql> select count(name) from people;
+----------------+
| count(name) |
+----------------+
|              5 |
+----------------+
1 row in set, 5 warnings (0.00 sec)

注:查询某一列的行数不会包含NULL数据

♪查询表某一列数据的和

要想查询结果是某一列的数据和就需要用到聚合函数sum():

语法:select sum(列名/表达式) from 表名;

mysql> select sum(salary) from people;
+-------------+
| sum(salary) |
+-------------+
|      142000 |
+-------------+
1 row in set (0.00 sec)

注:只能查询数字列的和,不能求字符串/日期的和

♪查询表某一列数据的平均值

要查询某一列数据的平均值就需要用到聚合函数avg():

语法:select avg(列名/表达式) from 表名;

mysql> select avg(salary) from people;
+-------------+
| avg(salary) |
+-------------+
|  28400.0000 |
+-------------+
1 row in set (0.00 sec)

注:只能查询数字列的平均值

♪查询表某一列数据的最大值

要查询某一列数据的最大值就需要用到聚合函数max():

语法:select max(列名/表达式) from 表名;

mysql> select max(salary) from people;
+-------------+
| max(salary) |
+-------------+
|       70000 |
+-------------+
1 row in set (0.00 sec)

注:只能查询数字列的最大值

♪查询表某一列数据的最小值

要查询某一列数据的最小值就需要用到聚合函数min():

语法:select min(列名/表达式) from 表名;

mysql> select min(salary) from people;
+-------------+
| min(salary) |
+-------------+
|        3000 |
+-------------+
1 row in set (0.00 sec)

注:只能查询数字列的最小值

上面聚合查询的对象是所有人,要想查询的对象为同一职业的人,可以通过group by子句来实现。

♫分组查询

♪group by子句

select中使用 group by 子句可以对指定列进行分组查询。需要满足:使用group by 进行分组查询时,select 指定的字段必须是 分组依据字段 ,其他字段若想出现在 select 中则必须包含在聚合函
数中。

语法:select 列名,聚合函数,... from 表名 group by 列名;

-- 查询每种职业的最高薪资
mysql> select careen,max(salary) from people group by careen;
+--------+-------------+
| careen | max(salary) |
+--------+-------------+
| NULL   |        NULL |
| 医生   |       70000 |
| 老师   |        5000 |
+--------+-------------+
3 rows in set (0.01 sec)

如果是不带聚合函数的分组查询,查询结果为每个分组的第一条记录:

mysql> select * from people group by careen;
+----+--------+--------+--------+
| id | name   | careen | salary |
+----+--------+--------+--------+
|  6 | NULL   | NULL   |   NULL |
|  4 | 赵六   | 医生   |  60000 |
|  1 | 张三   | 老师   |   3000 |
+----+--------+--------+--------+
3 rows in set (0.01 sec)

分组查询还可以对分组前指定条件或对分组后指定条件:

♪分组前指定条件

对筛选出来的数据进行分组查询:

语法:select 列名,聚合函数,... from 表名 group by 列名 where 指定条件;

-- 取所有工资大于3000的人,对这类人按照对应职业进行分组查询
mysql> select careen,avg(salary) from people where salary>3000 group by careen;
+--------+-------------+
| careen | avg(salary) |
+--------+-------------+
| 医生   |  65000.0000 |
| 老师   |   4500.0000 |
+--------+-------------+
2 rows in set (0.02 sec)

♪分组后指定条件

对分组查询后的数据进行筛选:

语法:select 列名,聚合函数,... from 表名 group by 列名 having 指定条件;

-- -- 按照职业进行分组查询,取查询结果中平均工资大于5000的职业
mysql> select careen,avg(salary) from people group by careen having avg(salary)>5000;
+--------+-------------+
| careen | avg(salary) |
+--------+-------------+
| 医生   |  65000.0000 |
+--------+-------------+
1 row in set (0.00 sec)