mysql基础查询语法
⼀、mysql查询的五种⼦句
where⼦句(条件查询):按照“条件表达式”指定的条件进⾏查询。
group by⼦句(分组):按照“属性名”指定的字段进⾏分组。group by⼦句通常和count()、sum()等聚合函数⼀起使⽤。
having⼦句(筛选):有group by才能having⼦句,只有满⾜“条件表达式”中指定的条件的才能够输出。
order by⼦句(排序):按照“属性名”指定的字段进⾏排序。排序⽅式由“asc”和“desc”两个参数指出,默认是按照“asc”来排序,即升序。
limit(限制结果集)。
1、where——基础查询
where常⽤运算符:
运算符说明
⽐较运算符
<⼩于
<=⼩于或等于
=等于
!= 或<>不等于
>=⼤于等于
>⼤于
in在某集合内
between在某范围内
逻辑运算符
not 或!逻辑⾮
or 或||逻辑或
and
逻辑与
或&&
2、group by 分组
“Group By”从字⾯意义上理解就是根据“By”指定的规则对数据进⾏分组,所谓的分组就是将⼀个“数据集”划分成若⼲个“⼩区域”,然后针对若⼲个“⼩区域”进⾏数据处理。select类别, sum(数量) as数量之和
from A
groupby类别
注:group by语句中select指定的字段必须是“分组依据字段”,其他字段若想出现在select中则必须包含在聚合函数中。
mysql中五种常⽤的聚合函数:
(1)max(列名):求最⼤值。
(2)min(列名):求最⼩值。
(2)sum(列名):求和。
(4)avg(列名):求平均值。
(5)count(列名):统计记录的条数。
3、having
having⼦句可以让我们筛选成组后的各种数据,where⼦句在聚合前先筛选记录,也就是说作⽤在group by和having⼦句前。⽽having⼦句在聚合后对组记录进⾏筛选。
⽰例:
select类别, sum(数量) as数量之和from A
groupby类别
having sum(数量) >18
⽰例:Having和Where的联合使⽤⽅法
select类别, SUM(数量)from A
where数量>8
groupby类别
having SUM(数量) >10
where和having的区别:
作⽤的对象不同。WHERE ⼦句作⽤于表和视图,HAVING ⼦句作⽤于组。
W H E R E 在分组和聚集计算之前选取输⼊⾏(因此,它控制哪些⾏进⼊聚集计算),⽽H A V I N G 在分组和聚集之后选取分组的⾏。因此,W H E R E ⼦句不能包含聚集函数;因为试图⽤聚集函数判断那些⾏输⼊给聚集运算是没有意义的。相反,HAVING ⼦句总是包含聚集函数。(严格说来,你可以写不使⽤聚集的HAVING ⼦句,但这样做只是⽩费劲。同样的条件可以更有效地⽤于WHERE 阶段。)
在上⾯的例⼦中,我们可以在WHERE ⾥应⽤数量字段来限制,因为它不需要聚集。这样⽐在HAVING ⾥增加限制更加⾼效,因为我们避免了为那些未通过WHERE 检查的⾏进⾏分组和聚集计算。
综上所述:
having⼀般跟在group by之后,执⾏记录组选择的⼀部分来⼯作的。where则是执⾏所有数据来⼯作的。
再者having可以⽤聚合函数,如having sum(qty)>1000
例⼦:where + group by + having + 函数综合查询
练习表:
查询出两门及两门以上不及格者的平均成绩(注意是所有科⽬的平均成绩)
错误情况1:题意理解错误,理解成查出不及格科⽬的平均成绩。
错误情况2:count()不正确,SQL错误。
count(a),⽆论a是什么,都只是数⼀⾏;count时,每遇到⼀⾏,就数⼀个a,跟条件⽆关!
正解:count(score<60)达不到想要的结果,并不是条件的问题,⽽是⽆论count()⾥的表达式是什么都会数⼀⾏。s c o r e<60 返回1 或0;所以可以⽤sum(score<60)来计算不及格的科⽬数!
4、order by 排序
(1)order by price //默认升序排列
(2)order by price desc //降序排列
(3)order by price asc //升序排列,与默认⼀样
(4)order by rand() //随机排列,效率不⾼
5、limit
limit [offset,] N
offset 偏移量,可选,不写则相当于limit 0,N
N 取出条⽬
⽰例:取价格第4-6⾼的商品
select good_id,goods_name,goods_price from goods orderby good_price desc limit 3,3;
总结:
select⼦句顺序
⼦句说明是否必须使⽤
select要返回的列或表⽰式是
form从中检索数据的表仅在从表选择数据时使⽤
where⾏级过滤否
group by分组说明仅在按组计算聚集时使⽤
having组级过滤否
order by输出排序顺序否
limit要检索的⾏数否
⼆、mysql⼦查询
1、where型⼦查询(把内层查询结果当作外层查询的⽐较条件)
(1)查询id最⼤的⼀件商品(使⽤排序+分页实现)
SELECT goods_id,goods_name,shop_price FROM goods ORDERBY goods_id DESC LIMIT 1;
(2)查询id最⼤的⼀件商品(使⽤where⼦查询实现)
SELECT goods_id,goods_name,shop_price FROM goods WHERE goods_id = (SELECT MAX(goods_id) FROM goods);
(3)查询每个类别下id最⼤的商品(使⽤where⼦查询实现)
SELECT goods_id,goods_name,cat_id,shop_price FROM goods WHERE goods_id IN (SELECT MAX(goods_id) FROM goods GROUPBY cat_id);
2、from型⼦查询(把内层的查询结果当成临时表,供外层sql再次查询。查询结果集可以当成表看待。
临时表要使⽤⼀个别名。)
(1)查询每个类别下id最⼤的商品(使⽤from型⼦查询)
SELECT goods_id,goods_name,cat_id,shop_price FROM
(SELECT goods_id,goods_name,cat_id,shop_price FROM goods ORDERBY cat_id ASC,goods_id DESC) AS tmp
GROUPBY cat_id;
⼦查询查出的结果集看第⼆张图,可以看到每个类别的第⼀条的商品id都为该类别下的最⼤值。然后将这个结果集作为⼀张临时表,巧妙的使⽤group by 查询出每个类别下的第⼀条记录,即为每个类别下商品id最⼤。
3、exists型⼦查询(把外层sql的结果,拿到内层sql去测试,如果内层的sql成⽴,则该⾏取出。内层查询是exists后的查询。)
(1)从类别表中取出其类别下有商品的类别(如果该类别下没有商品,则不取出)[使⽤where⼦查询]
SELECT c.cat_id,c.cat_name FROM category c WHERE c.cat_id IN (SELECT g.cat_id FROM goods g GROUPBY g.cat_id);
(2)从类别表中取出其类别下有商品的类别(如果该类别下没有商品,则不取出)[使⽤exists⼦查询]
SELECT c.cat_id,c.cat_name FROM category c WHERE EXISTS (SELECT1FROM goods g WHERE g.cat_id = c.cat_id);
exists⼦查询,如果exists后的内层查询能查出数据,则表⽰存在;为空则不存在。
三、连接查询
学习连接查询,先了解下"笛卡尔积",看下百度给出的解释:
在数据库中,⼀张表就是⼀个集合,每⼀⾏就是集合中的⼀个元素。表之间作联合查询即是作笛卡尔乘积,⽐如A表有5条数据,B表有8条数据,如果不作条件筛选,那么两表查询就有5 X 8 = 40 条数据。
先看下⽤到的测试表基本信息:我们要实现的功能就是查询商品的时候,从类别表将商品类别名称关联查询出来。
⾏数:类别表14条,商品表4条。
结构:商品表和类别表都有⼀个cat_id
1、全相乘(不是全连接、连接查询),全相乘是作笛卡尔积
两表全相乘,就是直接从两张表⾥查询;从查询的截图看出,总共查出了4 X 14 = 56 条记录,这些记录是笛卡尔乘积的结果,即两两组合;
但我们要的是每个商品信息显⽰类别名称⽽已,这⾥却查出了56条记录,其中有52条记录都是⽆效的数据,全相乘的查询效率低。
SELECT goods_id,goods_name,cat_name FROM mingoods,category;
如果在两张表⾥有相同字段,做联合查询的时候,要区别表名,否则会报错误(模糊不清)。
SELECT goods_name,cat_id,cat_name FROM mingoods,category;
添加条件,使两表关联查询,这样查出来就是商品和类别⼀⼀对应了。虽然这⾥查出来4条记录,但是全相乘效率低,全相乘会在内存中⽣成⼀个⾮常⼤的数据(临时表),因为有很多不必要的数据。
如果⼀张表有10000条数据,另⼀张表有10000条数据,两表全相乘就是100W条数据,是⾮常消耗内存的。⽽且,全相乘不能好好的利⽤索引,因为全相乘⽣成⼀张临时表,临时表⾥是没有索引的,⼤⼤降低了查询效率。
ds_name,g.cat_id AS g_cat_id, c.cat_id AS c_cat_id, c.cat_name FROM mingoods g, category c WHERE g.cat_id = c.cat_id;
2、左连接查询left join ... on ...
语法:
select A.filed, [A.filed2, .... ,] B.filed, [,]from<left table>as A leftjoin<right table>as B on<expression>
假设有A、B两张表,左连接查询即A表在左不动,B表在右滑动,A表与B表通过⼀个关系来关联⾏,B表去匹配A表。
2.1、先来看看on后的条件恒为真的情况
ds_name,g.cat_id, c.cat_id ,c.cat_name FROM mingoods g LEFTJOIN category c ON1;
跟全相乘相⽐,从截图可以看出,总记录数仍然不变,还是4 X 14 = 56 条记录。但这次是商品表不动,类别表去匹配,因为每次都为真,所以将所有的记录都查出来了。左连接,其实就可以看成左表是主表,右表是从表。
2.2 、根据cat_id使两表关联⾏
ds_name,g.cat_id,c.cat_id,c.cat_name FROM mingoods g LEFTJOIN category c ON g.cat_id = c.cat_id;
使⽤左连接查询达到了同样的效果,但是不会有其它冗余数据,查询速度快,消耗内存⼩,⽽且使⽤了索引。左连接查询效率相⽐于全相乘的查询效率快了10+倍以上。
左连接时,mingoods表(左表)不动,category表(右表)根据条件去⼀条条匹配,虽说category表也是读取⼀⾏⾏记录,然后判断cat_id是否跟mingoods表的相同,但是,左连接使⽤了索引,cat_id建⽴了索引的话,查询速度⾮常快,所以整体效率相⽐于全相乘要快得多,全相乘没有使⽤索引。
2.3、查询出第四个类别下的商品,要求显⽰商品名称
ds_name,g.cat_id,c.cat_name,g.shop_price FROM goods g LEFTJOIN category c ON g.cat_id = c.cat_id WHERE g.cat_id =4;
2.4 、对于左连接查询,如果右表中没有满⾜条件的⾏,则默认填充NULL。
ds_name,g.cat_id AS g_cat_id, c.cat_id AS c_cat_id,c.cat_id FROM mingoods g LEFTJOIN mincategory c ON g.cat_id = c.cat_id;
3、右连接查询right join ... on ...
语法:
select A.field1,A.field2,..., B.field3,B.field4 from<left table> A rightjoin<right table> B on<expression>
右连接查询跟左连接查询类似,只是右连接是以右表为主表,会将右表所有数据查询出来,⽽左表则根据条件去匹配,如果左表没有满⾜条件的⾏,则左边默认显
⽰NULL。左右连接是可以互换的。
ds_name,g.cat_id AS g_cat_id, c.cat_id AS c_cat_id,c.cat_name FROM mingoods g RIGHTJOIN mincategory c ON g.cat_id = c.cat_id;
4、内连接查询inner join ... on ...
语法:
select A.field1,A.field2,.., B.field3, B.field4 from<left table> A inner join<right table> B on<expression>
内连接查询,就是取左连接和右连接的交集,如果两边不能匹配条件,则都不取出。
ds_name,g.cat_id, c.*from mingoods g INNER JOIN mincategory c ON g.cat_id = c.cat_id;
5、全连接查询full join ... on ...
语法:
select ... from<left table>full join<right table>on<expression>
全连接会将两个表的所有数据查询出来,不满⾜条件的为NULL。
全连接查询跟全相乘查询的区别在于,如果某个项不匹配,全相乘不会查出来,全连接会查出来,⽽连接的另⼀边则为NULL。
6、联合查询union
语法:
select A.field1 as f1, A.field2 as f2 from<table1> A union (select B.field3 as f1, field4 as f2 from<table2> B)
union是求两个查询的并集。union合并的是结果集,不区分来⾃于哪⼀张表,所以可以合并多张表查询出来的数据。
6.1、将两张表的数据合并查询出来
SELECT id, content, user FROM comment UNION (SELECT id, msg AS content, user FROM feedback);
6.2、union查询,列名不⼀致时,以第⼀条sql语句的列名对齐
SELECT id, content, user FROM comment UNION (SELECT id, msg, user FROM feedback);
6.3、使⽤union查询会将重复的⾏过滤掉
SELECT content,user FROM comment UNION (SELECT msg, user FROM feedback);
6.4、使⽤union all查询所有,重复的⾏不会被过滤
SELECT content,user FROM comment UNION ALL (SELECT msg, user FROM feedback);
6.5、union查询,如果列数不相等,会报列数不相等错误
6.6、union 后的结果集还可以再做筛选
SELECT id,content,user FROM comment UNION ALL (SELECT id, msg, user FROM feedback) ORDERBY id DESC;
union查询时,order by放在内层sql中是不起作⽤的;因为union查出来的结果集再排序,内层的排序就没有意义了;因此,内层的order by排序,在执⾏期间,被mysql的代码分析器给优化掉了。
(SELECT id,content,user FROM comment ORDERBY id DESC) UNION ALL (SELECT id, msg, user FROM feedback ORDERBY id DESC);
order by 如果和limit⼀起使⽤,就显得有意义了,就不会被优化掉。
( SELECT goods_name,cat_id,shop_price FROM goods WHERE cat_id =3ORDERBY shop_price DESC LIMIT 3 )
UNION
( SELECT goods_name,cat_id,shop_price FROM goods WHERE cat_id =4ORDERBY shop_price DESC LIMIT 2 );
6.7、练习
SELECT name, SUM(money) FROM ( ( SELECT*FROM A ) UNION ALL ( SELECT*FROM B ) ) tmp GROUPBY name;
连接查询总结:
1、在数据库中,⼀张表就是⼀个集合,每⼀⾏就是集合中的⼀个元素。连接查询即是作笛卡尔积,⽐如A表有1W条数据,B表有1W条数据,那么两表查询就有1W X 1W = 100W 条数据
2、如果在两张表⾥有相同字段,做联合查询的时候,要区别表名,否则会报错误(ambiguous 模糊不清)
3、全相乘效率低,全相乘会在内存中⽣成⼀个⾮常⼤的数据(临时表),因为有很多不必要的数据。
如果⼀张表有10000条数据,另⼀张表有10000条数据,两表全相乘就是100W条数据,是⾮常消耗内存的。
⽽且,全相乘不能好好的利⽤索引,因为全相乘⽣成⼀张临时表,临时表⾥是没有索引的,⼤⼤降低了查询效率。
4、左连接查询时,以左表为主表,会将左表所有数据查询出来;左表不动,右表根据条件去⼀条条匹配,如果没有满⾜条件的记录,则右边返回NULL。
右连接查询值,以右表为主表,会将右表所有数据查询出来,右表不动,左表则根据条件去匹配,如果左表没有满⾜条件的⾏,则左边返回NULL。
左右连接是可以互换的:A left join B == B right join A (都是以A为主表) 。
左右连接既然可以互换,出于移植兼容性⽅⾯的考虑,尽量使⽤左连接。
5、连接查询时,虽说也是读取⼀⾏⾏记录,然后判断是否满⾜条件,但是,连接查询使⽤了索引,条件列建⽴了索引的话,查询速度⾮常快,所以整体效率相⽐于全相乘要快得多,全相乘是没有使⽤索引的。
使⽤连接查询,查询速度快,消耗内存⼩,⽽且使⽤了索引。连接查询效率相⽐于全相乘的查询效率快了10+倍以上。
6、内连接查询,就是取左连接和右连接的交集,如果两边不能匹配条件,则都不取出。
7、MySql可以⽤union(联合查询)来查出左连接和右连接的并集。
union查询会过滤重复的⾏,union all 不会过滤重复的⾏。
union查询时,union之间的sql列数必须相等,列名以第⼀条sql的列为准;列类型可以不⼀样,但没太⼤意义。
union查询时,order by放在内层sql中是不起作⽤的;因为union查出来的结果集再排序,内层的排序就没有意义了;因此,内层的order by排序,在执⾏期间,被mysql的代码分析器给优化掉了。
但是,order by 如果和limit⼀起使⽤,就显得有意义了,会影响最终结果集,就不会被优化掉。order by会根据最终是否会影响结果集⽽选择性的优化。
注:union和union all的区别,union会去掉重复的记录,在结果集合并后悔对新产⽣的结果集进⾏排序运算,效率稍低,union all直接合并结果集,如果确定没有重复记录,建议使⽤union all。
8、LEFT JOIN 是LEFT OUTER JOIN 的缩写,同理,RIGHT JOIN 是RIGHT OUTER JOIN 的缩写;JOIN 是INNER JOIN 的缩写。
关联查询
1、使⽤join关键字关联查询
mysql交集查询(1)、内连接(inner join)
连接两张表,连接条件使⽤on关键字,内连接只会显⽰匹配的数据记录。
eg:查询学⽣姓名、科⽬、分数
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论