MySQL中多个left join on关联条件的顺序说明
作者:p7+ 发布时间:2024-01-15 14:01:46
MySQL多个left join on关联条件顺序
注意:下面的案例特别重要!请重视!SQL有点长,但确实是干货!
结论
如果存在多个left join on,请注意on后面的条件与哪个表关联。这一条统计的SQL很重要!例如表A,B,C,A left join B on A.x = B.x left join C on A.x = C.x,B和C的都要和A建立关联,B和C之间是没有任何数据上的关系。
但是 如果把A.x = C.x改成B.x = C.x,那么B和C的表数据先建立关联并过滤数据,再与A表数据进行关联,这样可能会出现数据丢失!
案例
有一张分数表,表字段有日期、姓名、语文得分和数学得分等,请统计每个日期中,语文最高得分的姓名和分数,数学最低得分的姓名和分数。
思路:过滤出所有日期 left join 筛选语文 on … left join 数学得分 on …
正确的SQL:
SELECT
*
FROM
( SELECT report_date reportDate FROM tb_more_left_join mlj GROUP BY mlj.report_date ) mix
LEFT JOIN (
SELECT
mlj.report_date maxReportDate,
GROUP_CONCAT( mlj.user_name ) maxUserNames,
a.maxScore
FROM
tb_more_left_join mlj
LEFT JOIN ( SELECT report_date, MAX( chinese_score ) maxScore FROM tb_more_left_join mlj GROUP BY mlj.report_date ORDER BY NULL ) a ON mlj.report_date = a.report_date
WHERE
mlj.chinese_score = a.maxScore
GROUP BY
mlj.report_date
) mx ON mix.reportDate = mx.maxReportDate
LEFT JOIN (
SELECT
mlj.report_date minReportDate,
GROUP_CONCAT( mlj.user_name ) minUserNames,
a.minScore
FROM
tb_more_left_join mlj
LEFT JOIN ( SELECT report_date, MIN( math_score ) minScore FROM tb_more_left_join mlj GROUP BY mlj.report_date ORDER BY NULL ) a ON mlj.report_date = a.report_date
WHERE
mlj.math_score = a.minScore
GROUP BY
mlj.report_date
) mn ON mix.reportDate = mn.minReportDate
正确结果:
错误的SQL:
把正确SQL中最后一个on条件改为mx.maxReportDate = mn.minReportDate,注意,是把mix.reportDate改为了mx.maxReportDate。
错误结果:
错误原因:
查询语文最高成绩时,没有查到2019-12-01的数据
查询数学最低成绩时,使用on与语文最高成绩关联,因为没有查到语文最高成绩的日期,所以两个表关联时,数学最低成绩即使有数据,也会因为语文最高成绩无数据而被忽略。
SQL数据
CREATE TABLE `tb_more_left_join` (
`id` int(11) NOT NULL,
`report_date` date NULL DEFAULT NULL,
`user_name` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
`math_score` int(255) NULL DEFAULT NULL,
`chinese_score` int(255) NULL DEFAULT NULL,
PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;
INSERT INTO `tb_more_left_join` VALUES (1, '2019-12-01', '盲僧', 70, NULL);
INSERT INTO `tb_more_left_join` VALUES (2, '2019-12-01', '薇恩', 100, NULL);
INSERT INTO `tb_more_left_join` VALUES (3, '2019-12-02', '赵信', 30, 60);
INSERT INTO `tb_more_left_join` VALUES (4, '2019-12-02', '琴女', NULL, 100);
INSERT INTO `tb_more_left_join` VALUES (5, '2019-12-03', '蛮王', 50, 100);
INSERT INTO `tb_more_left_join` VALUES (6, '2019-12-03', '艾希', 100, 100);
INSERT INTO `tb_more_left_join` VALUES (7, '2019-12-03', '亚索', 60, 90);
使用left join的on后查询碰到的大坑
很多时候我们在使用 LEFT JOIN ...... ON .... 时, 除了连接两个表的字段条件外,我们往往还需要一些等值或者范围 等等类似的数据筛选条件。
那么对于初学者,往往会犯一个错误,就是 想当然 地 认为, ON 后面的条件是逐一执行的,因为没有了解清楚 ON 后面接条件的规则。
是个什么样的场景?
看实例讲解:
userinfo 表 :
(找兼职的人员名单信息表)
jobinfo表 :
(兼职工作信息及职业要求表)
业务需求:
根据职业要求 给 找兼职的人员 匹配上 目前 可以做的兼职,输出数据条。
例如,李三是一个程序员,他迫于经济压力,不得不向社会低头,想找一些自己能做的兼职。
使用 WHERE
如果我们不用 left join ...... on ... , 仅仅使用 where,那么简单写下sql是:
SELECT *
FROM userinfo AS u ,jobinfo AS j
WHERE u.userProfession=j.professionRequire
AND j.professionRequire='程序员'
查询出来的结果如下:
是我们需要的结果,可以看的,程序员李三能做的兼职有,送外卖或者当保安。
使用 LEFT JOIN ...... ON ......
初学者(罪过)写的SQL :
想当然地把筛选条件 职业要求为 ‘ 程序员’ 直接 拼接在 ON 后面
SELECT *
FROM userinfo AS u
LEFT JOIN
jobinfo AS j
ON u.userProfession=j.professionRequire
AND j.professionRequire='程序员'
这样地拼接筛选条件其实是达不到所想要的效果的,先来看看这样的执行结果:
可以看到查询出来很多我们不想要的数据,为什么会这样?
原因
因为如果直接把关联表的筛选条件拼接在 ON 后, 执行的顺序其实是:
将 jobinfo 表 按照筛选条件 professionRequire='程序员' 执行后作为子查询,再执行 LEFT JOIN ...... ON 。
也就是第一步变成了执行 SELECT * FROM jobinfo AS j WHERE j.professionRequire='程序员'
然后再进行连接查询,也就是
整个sql语句其实变成了:
SELECT *
FROM userinfo AS u
LEFT JOIN
(SELECT * FROM jobinfo WHERE jobinfo.professionRequire='程序员') AS j
ON
u.userProfession=j.professionRequire
这样查询出来,显然不是我们想要的结果。
那么我们在使用 LEFT JOIN ...... ON ...... 拼接筛选条件时,我们应该怎么做?
配合 WHERE 使用:
SELECT *
FROM userinfo AS u
LEFT JOIN jobinfo AS j
ON u.userProfession=j.professionRequire
WHERE j.professionRequire='程序员'
结果:
我们把筛选条件配合where去使用, 执行的逻辑就是:
先执行LEFT JOIN ...... ON ...... 先将关联两个表之后的数据查询出来;
再按照 professionRequire='程序员' 条件,进行数据筛选。
所以这是我们想要得到的结果。
这是一个使用 LEFT JOIN 的 ON 初学者很容易犯的错误,大家稍微注意点。
来源:https://blog.csdn.net/qq_30038111/article/details/103594735
猜你喜欢
- 下面通过对比来看看ASP中3种分页显示的性能,执行效率。一,使用存储过程分页,这种情况又分为两种方式:第一种,使用command对象,如下:
- 这篇文章主要介绍了Python hashlib常见摘要算法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,
- 读取excel数据需要用到xlrd模块,在命令行运行下面命令进行安装pip install xlrd表格内容大致如下,有若干sheet,每个
- 数据的完整性用于确保数据库数据遵从一定的商业的逻辑规则。在oracle中,数据完整性可以使用约束、触发器、应用程序(过程、函数)三种方法来实
- IE测试通过,FF有点小BUGCls_Leibie.asp代码如下:<% '数据库字段为类属性,添加、删除、修改、操
- 导读只需要添加几行代码,就可以得到更快速,更省显存的PyTorch模型。你知道吗,在1986年Geoffrey Hinton就在Nature
- 欢迎来到 Python Httpx 教程。在本教程中,我们将深入探讨 Httpx 库,并学习如何使用它来构建高性能的异步网络应用程序。什么是
- 对win32 COM不是很熟悉,不知道一个程序究竟有多少属性或者方法可以操作。仅仅是一个Sheet页的添加就费了我好长时间,因为这种成功来自
- 在MySQL中,对于索引的使用并是一直都采用正确的决定。简单表的示例:CREATE TABLE `r2` (ID` int(11) DEFA
- 最近需要将使用keras训练的模型移植到手机上使用, 因此需要转换到tensorflow的二进制模型。折腾一下午,终于找到一个合适的方法,废
- 本文实例讲述了python检测某个变量是否有定义的方法。分享给大家供大家参考。具体如下:第一种方法使用内置函数locals():'t
- 功能:为连连看游戏提供连接算法 说明:模块中包含一个Point类,该类是游戏的基本单元“点”,该类包含属性:x,y,value。 其中x,y
- 本文实例讲述了Python使用matplotlib绘制三维参数曲线操作。分享给大家供大家参考,具体如下:一 代码import matplot
- 今天来说说鄙人对input输入框在处理上的细节处理和心得,其实制作一个符合CSS标准、FF/IE7/IE6等主流浏览器全兼容、符合用户体验的
- 在刚学Pandas时,行选择和列选择非常容易混淆,在这里进行一下讨论和归纳本文的数据来源:https://github.com/fiveth
- 函数如下: function update_timelist(&$arr,$timestamp,$threshold){ $time
- 1.什么是变量所谓变量,是指程序运行过程中其值可以改变的量。举例:在数学中x和y就是变量,Python中不同的是变量不只是存储数字,它可以存
- 导出数据库数据:首先打开cmd进入MySQL的bin文件夹下1.导出education数据库里面的users表的表数据和表结构(下面以use
- python结构体数组在C语言中我们可以通过struct关键字定义结构类型,结构中的字段占据连续的内存空间,每个结构体占用的内存大小都相同,
- argparse介绍 argparse包用于解释命令行参数。这里给出几个常用的方法。# 创建解析器对象# @para: descripti