关于 MySQL 嵌套子查询中无法关联主表字段问题的解决方法
作者:bananaplan 发布时间:2024-01-18 23:05:28
今天在工作中写项目的时候,遇到了一个让我感到几乎无解的问题,在转换了思路后,想出了一个折中的解决方案,记录如下。
其实,问题的场景,非常简单:
就是需要查询出上图的数据,红框是从 项目产品表
中查询的2个字段,绿框是从与项目产品表关联的 文章表
中查询出的1个字段。我希望实现的效果是,获取到项目产品对应的文章提交人数,即该项目产品,有多少人提交了文章。看似很简单啊,于是我开始撸 SQL 语句了。
先写个雏形
既然在查询项目产品表的时候,希望多查询1列数据,而此列数据是从其他关联表获取的,所以基本实现方式,是使用子查询。
SELECT s.id, s.name, (SELECT COUNT(*) FROM art_subject_article WHERE subject_id = s.id) AS article_num
FROM crm_subject s
ORDER BY article_num DESC;
获得结果如下:
这个 SQL 语句,查询出了项目产品所对应的文章数,下面基于它再做个优化调整,把查询到的文章数量 article_num 变为提交文章的用户数量 member_num。
再优化一下,意外发生了
现在不是直接从文章表中,获取文章数量了,而是需要先根据文章表中的用户ID进行分组,获得分组数据之后,再通过 count(*) 聚合函数,拿到用户数量。于是继续调整 SQL 如下:
SELECT s.id, s.name, (SELECT count(*) FROM (SELECT mg_userid FROM art_subject_article WHERE subject_id = s.id GROUP BY mg_userid) t) AS member_num
FROM crm_subject s
ORDER BY member_num DESC;
但是,运行却报错了:
报错信息说:s.id 字段找不到
。这是一个嵌套的子查询,在嵌套的最内层的子查询中,关联外部表的字段,是无法关联的。虽然我没找根据,但通过报错信息,也能大致看出一二。而且,在 DataGrip 中,把鼠标放到 s.id 上面时,也会出现一个提示:
虽然这个提示,我也不甚明了,但是感觉上,好像就是在告诉我,你无法关联到外部表的字段。
好像无解了,转变思路,柳暗花明
上面的 SQL 语句,看起来是如此的完美,可是就是有问题、不成立,咋办?
突然,灵机一动,想到一个方案,姑且一试。既然在嵌套的最内层的子查询中,做 WHERE subject_id = s.id
与主表的字段关联行不通,那么,就不在内层的子查询中做关联,把它提到外层的子查询中去,不就行的通了嘛。于是,改造 SQL 如下:
SELECT s.id, s.name, (SELECT count(*) FROM (SELECT subject_id, mg_userid FROM art_subject_article GROUP BY subject_id, mg_userid) t WHERE t.subject_id = s.id) AS member_num
FROM crm_subject s
ORDER BY member_num DESC;
主要关注子查询这里的改造,我们可以把这里的子查询做个分解。
首先,可以把子查询看成这样:(SELECT count(*) FROM t WHERE t.subject_id = s.id) AS member_num
,把它理解成从 t
表中查询与主表的项目产品有关的记录数量。
然后,我们再把 t
表看成 (SELECT subject_id, mg_userid FROM art_subject_article GROUP BY subject_id, mg_userid) t
,代表从文章表中查询出每个产品对应的用户ID。
最后把2个子查询,整合起来,就实现了查询项目产品表中,每个产品所对应的提交了文章的用户数量。
有没有更好的解决方案
这个折中的方案,虽然可以解决我的问题,但是,我依然想知道,有没有更好的、更标准的最佳实践。
并且此方案,也有3点不足:
改进前我们是对文章表做项目产品关联查询后再分组,改进后是对文章表做全表扫描后的分组,效率较低,在大数据下的表现不好。
优化方案是基于两层嵌套的子查询进行的,假如需要三层嵌套的子查询,此方案估计又失效了。
此优化方案较为局限,不具有普适性,不能很好的适用于各种业务场景。
所以,我将我遇到的这个问题,和解决方案分享在此,希望能帮助到有缘人,同时,也期望各位大神能够不吝赐教,分享一下最佳实践。
后记
我沉下心来,真的去谷歌上找证据去了,还真被我找到了,你猜怎么着,此问题真的是,无解!!!
这是我搜索到的线索,其中 https://bugs.mysql.com/bug.php?id=28814 这里有个人遇到了与我一样的问题,并且在下面的评论回复中,有个人抛出了 MySQL 的官方文档,证实了此问题的存在,不是 bug,而是 MySQL 本身就不支持。
这里引用官方文档的说明:
A correlated column can be present only in the subquery's WHERE clause (and not in the SELECT list, a JOIN or ORDER BY clause, a GROUP BY list, or a HAVING clause). Nor can there be any correlated column inside a derived table in the subquery's FROM list.
注意第二句话:“子查询的 FROM 列表中的派生表内也不能有任何关联字段”。直接就给想要这么做的小伙伴们判了死刑,还真TM无解。
既然这种写法不支持,那么有没有什么替代方案?答案在这里找到了:https://dba.stackexchange.com/questions/237181/nested-subquery-giving-eror-of-unknown-column。
里面也提供了非常有价值的信息:
在 MySQL 8.0.14 版本中,优化了关联子查询不能用在 FROM 中的问题,从这个版本开始,可以使用了!!!撒花,庆祝。。。
然而悲催的是,大多数的小伙伴们,用的都是 5.6 或 5.7 的版本吧,那么这个问题的唯一解法就是:不要在 FROM 的子查询中,使用字段关联。。。
来源:https://www.cnblogs.com/bananaplan/p/mysql-cannot-find-outer-table-column-in-nested-subquery.html


猜你喜欢
- 在进行数据抓取时,经常会遇到IP被限制的情况,常见的解决方案是搭建 * 池,或购买IP代理的服务。除此之外,还有一个另外的方法就是使用家里
- 前言本文主要给大家介绍关于Django中STATIC_ROOT和STATIC_URL及STATICFILES_DIRS的相关内容,分享出来供
- 目录什么是信号Python的信号处理Python对信号的处理信号枚举信号函数signal.alarm(time)signal.pause()
- 一、错误案例package mainimport ("fmt""time")var TestMap
- 概述从今天开始, 小白我将带领大家一起来补充一下 数据库的知识.条件查询我们可以使用关键词Where来指定条件, 用于插入, 修改删除或者查
- 一、环境配置安装 Python请确保您已经安装了 Python 3.x。可以在Python 官网下载并安装。安装所需库在命令提示符或终端中运
- 先看map。map()函数接收两个参数,一个是函数,一个是序列,map将传入的函数依次作用到序列的每个元素,并把结果作为新的list返回。举
- 在用plt.imshow和cv2.imshow显示同一幅图时可能会出现颜色差别很大的现象。这是因为:opencv的接口使用BGR,而matp
- Softmax回归函数是用于将分类结果归一化。但它不同于一般的按照比例归一化的方法,它通过对数变换来进行归一化,这样实现了较大的值在归一化过
- 目录Python3 面向对象一丶面向对象技术简介对象可以包含任意数量和类型的数据。2.Python面向对象的三大特性一、继承 二、
- 环境:MacOS_Cetalina_10.15.1、Mysql8.0.18、Docker_2.0.0.31、docker仓库搜索mysqld
- 前言在python的模块有两种组织方式,一种是单纯的python文件,文件名就是模块名,一种是包,包是一个包含了若干python文件的目录,
- 一、注册自定义指令以下实例都是实现一个输入框自动获取焦点的自定义指令。1.1、全局自定义指令在vue2中,全局自定义指令通过 directi
- 一、创建元组tup1 = ('physics', 'chemistry', 1997, 2000);tup2
- 场景产品中有一张图片表,数据量将近100万条,有一条相关的查询语句,由于执行频次较高,想针对此语句进行优化表结构很简单,主要字段:user_
- 编写高质量代码的30条黄金守则-Day 01(首选隐式类型转换),本文由比特飞原创发布,转载务必在文章开头附带链接:https://www.
- Pycharm Database Navigator连接mysql1.安装Database Navigator由于使用的是Pycharm C
- 本文实例讲述了Python udp网络程序实现发送、接收数据功能。分享给大家供大家参考,具体如下:1. udp网络程序-发送数据创建一个基于
- 在实际信息系统开发中,经常会用到各种各样的协议,网络协议常用的有http,tcp,udp等,传输数
- 编者注:当讲到了性能优化和案例方面的东西,就要想到如何从开发人员的角度进行了理解,认识SQL是如何执行,以及如何学习高级的SQL,这篇文章对