mysql去重查询的三种方法小结
作者:小马穿云 发布时间:2024-01-21 14:52:22
标签:mysql,去重,查询
前言
数据库生成环境中经常会遇到表中有重复的数据,或者进行关联过程中产生重复数据,下面介绍三种剔除重复数据的方法,请针对自己的应用场景选择使用。
一、插入测试数据
下图测试数据中user_name为lilei、zhaofeng的用户是重复数据。
二、剔除重复数据方法
1.方法一:使用distinct
代码如下(示例):
select distinct user_name,email,address from t_user;
如下图,已将数据剔重,重复数据仅保留1条。
2.方法二:使用group by
SELECT user_name,email,address
FROM t_user
GROUP BY user_name, email, address;
如下图,已将数据剔重,重复数据仅保留1条。
3.方法三:使用开窗函数
(1)如果你的数据库是MySQL8以上版本你可以直接使用开窗函数row_number()
SELECT *
FROM(
SELECT t.*,
ROW_NUMBER() OVER(PARTITION BY user_name
ORDER BY last_login DESC) rn
FROM table AS t
) AS t_user
WHERE rn = 1;
(2)如果你的数据库版本低于MySQL8,使用类row_number()方法
select user_name, email, address
from (
select
b.*,
@rownum := @rownum+1 ,-- 定义用户变量@rownum来记录数据的行号
if(@pdept=b.user_name,@rank:=@rank+1,@rank:=1) as rank,-- 如果当前分组user_name和上一次分组user_name相同,则@rank(对每一组的数据进行编号)值加1,否则表示为新的分组,从1开始
@pdept:=b.user_name -- 定义变量@pdept用来保存上一次的分组id
from (select * from t_user) b ,
(select @rownum :=0 , @pdept := null ,@rank:=0) c -- 初始化自定义变量值
order by b.user_name,b.last_login desc -- 该排序必须,否则结果会不对
) result
where rank = 1;
如下图,已将数据剔重,重复数据仅保留1条。
来源:https://blog.csdn.net/ma286388309/article/details/129261927
0
投稿
猜你喜欢
- 关于递归函数:函数内部调用自身的函数。以n阶乘为例:f(n) = n ! = 1 x 2 x 3 x 4 x...x(n-1)x(n) =
- return 语句就是讲结果返回到调用的地方,并把程序的控制权一起返回程序运行到所遇到的第一个return即返回(退出def块),不会再运行
- 1、为什么要掌握进程间通信python的多线程代码效率由于受制于GIL,不能利用多核CPU来加速,而多进程方式可以绕过GIL, 发挥多CPU
- 导言:到目前为止,我们的教程围绕的是text数据。然而,很多应用程序既需要处理text数据,也需要处理二进制数据。比如招聘网站可能需要用户上
- 自定义数据库字段扩展默认的models.CharField和models.TextField使之成为支持多语言的字段。可以轻松实现复用,无需
- 画之前肯定要知道规格图,我找了一个大致的图。参考图片:绘制大星的方法很简单,五角星的补角是144度。绘制小五角星有点麻烦,因为我国国旗上的小
- 1.案例要求:"""有列表["a", "d", "f&quo
- Pygame的Draw绘图Pygame 中提供了一个draw模块用来绘制一些简单的图形状,比如矩形、多边形、圆形、直线、弧线等。pygame
- Keras提供了一些用ImageNet训练过的模型:Xception,VGG16,VGG19,ResNet50,InceptionV3。在使
- 如果我们在标识列中插入值,例如: insert member(id,username) values(10,'a
- github主页导入:>>> from fuzzywuzzy import fuzz>>> from f
- 一、概论C4.5主要是在ID3的基础上改进,ID3选择(属性)树节点是选择信息增益值最大的属性作为节点。而C4.5引入了新概念“信息增益率”
- 本文实例讲述了Python类装饰器。分享给大家供大家参考,具体如下:编写类装饰器类装饰器类似于函数装饰器的概念,但它应用于类,它们可以用于管
- 多线程-共享全局变量#coding=utf-8from threading import Threadimport timeg_num =
- 写一个python脚本,实现简单的http服务器功能:1.浏览器中输入网站地址:172.20.52.163:200142.server接到浏
- 1. 关于列表更多的内容Python 的列表数据类型包含更多的方法。这里是所有的列表对象方法:list.``append(x)把一个元素添加
- SQL Server数据库查询速度慢的原因有很多,常见的有以下几种:1、没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷)
- 关于一些代码里的解释,可以看我上一篇发布的文章,里面有很详细的介绍!!!可以依次把下面的代码段合在一起运行,也可以通过jupyter not
- 1. Python的数据类型上一遍博文已经详细地介绍了Python的数据类型,详见链接Python的变量命名及数据类型。在这里总结一下Pyt
- Microsoft SQL server2000由一系列相互协作的组件构成。能满足最大的WEB站点和企业数据处理系统存储