SQLDistinct处理多列的问题--688IT编程网

a表

ID Name

1张三

2李四

多表left join3王五

4王陆

a表left join b表结果ID Name Description 1张三内联部

1张三系学⽣会

2李四外联部

3王五团委

4王陆NULL SQLDistinct处理多列的问题

今天在做SSIS的ETL⼯作时，其中⼀个left join组件的运⾏结果总是会多出⼀些记录。分析了⼀下，该问题的原因是右表中作为关联的那⼀列数据有重复。left join的运⾏策略可以理解为根据左表的每⼀条记录的关联字段去对照右表的关联字段，如果右表的关联字段存在重复，就会⽣成重复的记录。如果左表存在重复⽽右表⽆重复，则不会多出来记录。举个例⼦，如果左表a和右表b的数据分别如下所⽰

b表

ID Description

1内联部

1系学⽣会

2外联部

3团委

这时如果⽤ID作为关联字段⽤a表left join b表，结果会产⽣5条记录，⽐左表多⼀条。（顺便提⼀下，如果右表不重复，则left join的结果数会与左表相等）

实际上，我想要的结果是与左表a⼀⼀对应，不要有重复的记录。这可以通过SSIS的lookup组件实现，但是效率会很低。因此就想到把右表中的重复记录去除掉再join两张表。⾸先⾃然地想到⽤distinct函数去重

SELECT DISTINCT ID, Description

FROM B

结果却是1条记录都没去掉，因为Distinct是作⽤于多列的，也就是说必须要ID和Description全都相同的才会被剔除。

在⽹上搜了⼀下，有⼈说⽤ select *, count(distinct name) from table group by name 这样的语句是可⾏的，但我在SQL Server⾥⾯试了⼀下会报错。只好⾃⼰动⼿，丰⾐⾜⾷啦，想了⼀下，其实可以⽤下⾯的语句

SELECT ID, Max(Description) AS Description

FROM B

GROUP BY ID

进⼀步的思考后发现，SQL Server中有First_Value和Last_Value函数，也可以实现

SELECT DISTINCT ID, FIRST_VALUE(Description) OVER (PARTITION BY ID

　ORDER BY Description) AS Description

FROM B

第⼆种⽅法中Partition by的参数必须是ID，Order by的参数可以调整，这就使得该⽅法更加灵活。这两种⽅法经实测效率差不多，第⼀种稍微快⼀点点。不过遗憾的是SSIS中不⽀持第⼆种⽅法，只能⽤第⼀种group by的⽅式。

688IT编程网

SQLDistinct处理多列的问题

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

SQLDistinct处理多列的问题

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式