SQL中on条件与where条件的区别
SQL中on条件与where条件的区别
数据库在通过连接两张或多张表来返回记录时,都会⽣成⼀张中间的临时表,然后再将这张临时表返回给⽤户。
在使⽤left jion时,on和where条件的区别如下:
1、 on条件是在⽣成临时表时使⽤的条件,它不管on中的条件是否为真,都会返回左边表中的记录。
2、where条件是在临时表⽣成好后,再对临时表进⾏过滤的条件。这时已经没有left join的含义(必须返回左边表的记录)了,条件不为真的就全部过滤掉。
假设有两张表:
表1:tab2
id size
110
220
330
表2:tab2
size
name
10AAA
20BBB
20CCC
两条SQL: 1、select * form tab1 left join tab2 on (tab1.size = tab2.size) where tab2.name=’AAA’
2、select * form tab1 left join tab2 on (tab1.size = tab2.size and tab2.name=’AAA’)
第⼀条SQL的过程:
1、中间表 on条件: tab1.size = tab2.size tab1.id tab1.size tab2.size tab2.name 11010AAA 22020BBB 22020CCC 330(null)(null)
||
2、再对中间表过滤 where 条件: tab2.name=’AAA’tab1.id tab1.size tab2.size tab2.name 11010AAA
第⼆条SQL的过程:
1、中间表 on条件:
tab1.size = tab2.size and tab2.name=’AAA’ (条件不为真也会返回左表中的记录)tab1.id tab1.size tab2.size tab2.name 11010AAA 220(null)(null) 330(null)(null)
其实以上结果的关键原因就是left join,right join,full join的特殊性,不管on上的条件是否为真都会返回left或right表中的记录,full则具有left 和right的特性的并集。⽽inner jion没这个特殊性,则条件放在on中和where中,返回的结果集是相同的。
可以这样理解:on是在⽣成连接表的起作⽤的,where是⽣成连接表之后对连接表再进⾏过滤。
当使⽤left join时,⽆论on的条件是否满⾜,都会返回左表的所有记录,对于满⾜的条件的记录,两个表对应的记录会连接起来,对于不满⾜条件的记录,那右表字段全部是null
当使⽤right join时,类似,只不过是全部返回右表的所有记录
当使⽤inner join时,功能与where完全相同。
经过亲测后,更加深了对on和where的理解,得出以下结论:
join on是什么连接1.ON后对左表的筛选条件对于结果⾏数会被忽略,但会影响结果中的匹配右表数据,因为只有符合左表条件的数据才会去和符合条件的右表数据进⾏匹配,不符合条件的左表数据会保留在最后结果中,但匹配的右表数据都是NULL.因此,对于需要过滤左表数据的话,需要把过滤条件放到where后⾯。
2.ON后的左表条件(单独对左表进⾏的筛选条件)对于结果⾏数⽆影响,还是会返回所有左表的数据,但和右表匹配数据时,系统只会拿左表符合条件(ON后的对左表过滤条件)的数据去和右表符合条件(ON后的对右表过滤条件)的数据进⾏匹配抓取数据,⽽不符合条件的左表数据还是会出现在结果列表中,只是对应的右表数据都是NULL。
3.ON后的右表条件(单独对右表进⾏的筛选条件)会先对右表进⾏数据筛选后再和左表做连接查询,对结果⾏数有影响(当左表对右表是⼀对多时),但不会影响左表的显⽰⾏数,然后拿符合条件的右表数
据去和符合条件的左表数据进⾏匹配。
4.Where还是对连接后的数据进⾏过滤筛选,这个⽆异议。
5.匹配数据时⽆论左右表,都是拿符合ON后的过滤条件去做数据匹配,不符合的会保留左表数据,⽤NULL填充右表数据。
综上得出,ON后⾯对于左表的过滤条件,在最后结果⾏数中会被忽略,并不会先去过滤左表数据再连接查询,但是ON后的右表条件会先过滤右表数据再连接左表进⾏查询。
连接查询时,都是⽤符合ON后的左右表的过滤条件的数据进⾏连接查询,只有符合左右表过滤条件的数据才能正确匹配,剩下的左表数据会正常出现在结果集中,但匹配的右表数据是NULL。因此对于左表的过滤条件切记要放到Where后,对于右表的过滤条件要看情况了。如果需要先过滤右表数据就把条件放到ON后⾯即可。
on、where、having的区别
on、where、having这三个都可以加条件的⼦句中,on是最先执⾏,where次之,having最后。有时候如果这先后顺序不影响中间结果的话,那最终结果是相同的。但因为on是先把不符合条件的记录过滤后才进⾏统计,它就可以减少中间运算要处理的数据,按理说应该速度是最快的。根据上⾯的分析,可以
知道where也应该⽐having快点的,因为它过滤数据后才进⾏sum,所以having是最慢的。但也不是说having没⽤,因为有时在步骤3还没出来都不知道那个记录才符合要求时,就要⽤having了。在两个表联接时才⽤on的,所以在⼀个表的时候,就剩下where跟having⽐较了。在这单表查询统计的情况下,如果要过滤的条件没有涉及到要计算字段,那它们的结果是⼀样的,只是where可以使⽤rushmore技术,⽽having就不能,在速度上后者要慢。如果要涉及到计算的字段,就表⽰在没计算之前,这个字段的值是不确定的,根据上篇写的⼯作流程,where的作⽤时间是在计算之前就完成的,⽽having就是在计算后才起作⽤的,所以在这种情况下,两者的结果会不同。在多表联接查询时,on⽐where更早起作⽤。系统⾸先根据各个表之间的联接条件,把多个表合成⼀个临时表后,再由where进⾏过滤,然后再计算,计算完后再由having进⾏过滤。由此可见,要想过滤条件起到正确的作⽤,⾸先要明⽩这个条件应该在什么时候起作⽤,然后再决定放在那⾥
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论