MySQL中有关于对数据表不重复记录的语法,通常用distinct来辨别,找到不重复的记录,那么用distinct来过滤掉重复字段,又存在什么问题呢?
在使用mysql时,有时需要查询出某个字段不重复的记录,虽然mysql提供有distinct这个关键字来过滤掉多余的重复记录只保留一条,但往往只用它来返回不重复记录的条数,而不是用它来返回不重记录的所有值。其原因是distinct只能返回它的目标字段,而无法返回其它字段,这个问题让我困扰了很久,用distinct不能解决的话,我只有用二重循环查询来解决,而这样对于一个数据量非常大的站来说,无疑是会直接影响到效率的。
下面先来看看例子:
table
idname
1a
2b
3c
4c
5b
库结构大概这样,这只是一个简单的例子,实际情况会复杂得多。
比如我想用一条语句查询得到name不重复的所有数据,那就必须使用distinct去掉多余的重复记录。
selectdistinctnamefromtable
得到的结果是:
name
a
c
好像达到效果了,可是,我想要得到的是id值呢?改一下查询语句吧:
selectdistinctname,idfromtable
结果会是:
idname
1a
2b
3c
4c
5b
distinct怎么没起作用?作用是起了的,不过他同时作用了两个字段,也就是必须得id与name都相同的才会被排除。。。。。。。
我们再改改查询语句:
selectid,distinctnamefromtable
很遗憾,除了错误信息你什么也得不到,distinct必须放在开头。难到不能把distinct放到where条件里?能,照样报错。。。。。。。
很麻烦吧?确实,费尽心思都没能解决这个问题。没办法,继续找人问。
公司里一java程序员,他给我演示了Oracle里使用distinct之后,也没找到mysql里的解决方案,最后下班之前他建议我试试groupby。
试了半天,也不行,最后在mysql手册里找到一个用法,用group_concat(distinctname)配合groupbyname实现了我所需要的功能。
再仔细一查,group_concat函数是4.1支持。
突然灵机一闪,既然可以使用group_concat函数,那其它函数能行吗?
现在将完整语句放出:
select*,count(distinctname)fromtablegroupbyname
结果:
idnamecount(distinctname)
1a1
2b1
3c1
哦,对,再顺便说一句,groupby必须放在orderby和limit之前,不然会报错。