SQL实现Excel的10个常用功能的示例详解
作者:印象Python 发布时间:2024-01-17 18:11:36
SQL,数据分析岗的必备技能,你可以不懂Python,R,不懂可视化,不懂机器学习。但SQL,你必须懂。要不然领导让你跑个数据来汇......,哦不,你不懂SQL都无法入职数据分析岗,更别说领导了。
SQL难吗?说实话,要写好,很难很难。但要通过SQL笔试这关,并不难。相信大伙都使用过Excel,用SQL实现excel 常用操作去学,感觉会比较具体。我自身也刚入数据岗不久,本文也是为自己巩固一下SQL。
数据是网上找到的销售数据,命名为sale,长这样:
01. 关联公式:Vlookup
vlookup是excel几乎最常用的公式,一般用于两个表的关联查询等。所以我先创建一个新表:复制sale表并筛选出地区仅为广州的,命名为sale_guang。
create?table?sale_guang
SELECT?*?from?sale?where?city="广州";
需求:根据订单明细号关联两表,并且sale_guang只有订单明细号与利润两列
SELECT?*?from?sale?a
inner?JOIN
(SELECT?ordernum,profit?from?sale_guang)?b
on?a.ordernum=b.ordernum
02. 对比两列差异
需求:对比sale的订单明细号与sale_guang订单明细号的差异;
SELECT?*?from?sale?a
WHERE?a.ordernum?not?in?
(SELECT?b.ordernum?from?sale_guang?b);
03. 去除重复值
需求:去除业务员编码的重复值
SELECT?*?FROM?sale
where?salesnum?not?in?
(SELECT?salesnum?from?sale
GROUP?BY?salesman
HAVING?COUNT(salesnum)>1)
04. 缺失值处理
需求:用0填充缺失值或则删除有地区名称缺失值的行。
--用0填充:
update?sale?set?city?=?0?where?city?=?NULL
--删除有缺失值的行:
delete?from?sale?where?city?=?NULL;
05. 多条件筛选
需求:想知道业务员张爱,在北京区域卖的商品订单金额大于等于6000的信息。
SELECT?*?from?sale
where?salesman?=?"张爱"?
and?city?=?"北京"
and?orderaccount?>=6000;
06. 模糊筛选数据
需求:筛选存货名称含有"三星"或则含有"索尼"的信息。
SELECT?*?from?sale
where?inventoryname?like?"%三星%"?
or?存货名称?like?"%索尼%";
07. 分类汇总
需求:北京区域各业务员的利润总额。
SELECT?city,sum(`profit`)
from?sale
WHERE?city?=?"北京"
GROUP?BY?`city`;
08. 条件计算
需求:存货名称含“三星字眼”并且税费高于1000的订单有几个?这些订单的利润总和和平均利润是多少?
--有多少个?
SELECT?COUNT(*)?from?sale
where?inventoryname?like?"%三星%"
and?`tax`?>?1000?;
--这些订单的利润总和和平均利润是多少?
SELECT?`ordernum`,SUM(profit),AVG(`profit`)
from?sale
where?inventoryname?like?"%三星%"
and?`tax`?>?1000?
GROUP?BY?`ordernum`;
09. 删除数据间的空格
需求:删除存货名称两边的空格。
SELECT?trim(inventoryname)?from?sale;
10. 合并与排序列
需求:计算每个订单号的成本并从高到低排序(成本 = 不含税金额 - 利润)
SELECT?city,ordernum,
(Nontaxamount?-?profit)?as?cost?
from?sale
order?by?cost?DESC;
总结:结构化查询语言(Structured Query Language)简称SQL,果然和它名字一样,查询起来得心应手,但做想做数据处理方面,能明细感受到比Python和excel吃力(也可能是我还没学好orz)。
SQL笔试题原题
贴一些我在面试时遇到过的SQL笔试题吧:
某数据服务公司
Student表
Score表
(1)查询Student表中的所有记录的Sname、Ssex和Class列。
select?sname,ssex,class?from?student;
(2)查询Score表中成绩在60到80之间的所有记录。
select?*?from?score?between?60?and?80;
(3)查询95033班和95031班的平均分。
select?class,avg(degree)?from?Score?a
join?student?b
on?a.sno?=?b.sno
GROUP?BY?CLASS;
总之是比较简单的SQL笔试题了,当时很快就写完了。实际上这不是原题,不过我有印象就是考察这几个知识点,并且蛮简单的。
某手游公司的SQL笔试题(原题)
(1)建立表Student的语句写下来,表Student是由学号Sno,姓名Sname,性别Ssex,年龄Sage,所在系Sdept五个属性组成,其中学号属性不能为空,并且其值是唯一的。
create?table?Student_new
(sno?varchar(20)?PRIMARY?KEY,
sname?varchar(10),ssex?char(2),
sage?int,sdept?varchar(25));
(2)在student 表中查询Sdept是“计算机”的学生所有信息并按SNO列排序。
select?*?from?student
where?sdept?=?"计算机"?
order?by?sno?;
(3)在以上三个表中查询Ccredit为5并且Grade大于60的学生的学号、姓名和性别。
select?a.sno,a.sname,a.ssex?from?student?a
join?(Course?b?,SC?c)
on?a.sno=c.sno?and?b.cno?=c.cno?
where?Ccredit?=?5?and?Grade?>?60;
某互联网金融公司SQL笔试题(原题)
(1)表A和表B的交集:
SELECT?a.cus_id?from?`表a`?as?a
INNER?JOIN?`表b`?as?b
on?a.cus_id=b.cus_id;
(2)表A和表B的并集:
SELECT?*?from?`表a`
UNION
SELECT?*?from?`表b`;
(3)表A和表B的对称差:
SELECT?*?from?`表a`?
where?cus_id?not?in?(SELECT?*?from?`表b`)
UNION
SELECT?*?from?`表b`?
where?cus_id?not?in?(SELECT?*?from?`表a`);
(4)表A中存在但表B中不存在:
SELECT?*?from?`表a`
WHERE?cus_id?not?in?(SELECT?cus_id?from?`表b`);
来源:https://mp.weixin.qq.com/s/4jS0l6YDsGuu8uWNukNz6A


猜你喜欢
- 1.使用Docker安装Elasticsearch及其扩展获取镜像,可以通过网络pullsudo docker image pull del
- Python中 join() 函数的使用函数:string.join()Python中有join()和os.path.join()两个函数,
- 由于公司网站之前的用户头像都是存储在自己的服务器上的,后来感觉管理不方便,新增加的用户头像都上传到了七牛,为了方便统一管理,领导说把本地服务
- Windows10本机环境:win10未安装node,安装了nvm工具,尝试使用nvm安装我开发环境的node版本(10.9.0 or la
- 方法一(不使用模块,by agonyr)#!/usr/bin/perl -wuse strict;my @seq = ( "A&q
- php输出全部gb2312编码内的汉字,$area表示分区,$pos表示分区内所在位置。<?php$fp = fopen('t
- 上周用了一周的时间学习了Python和Scrapy,实现了从0到1完整的网页爬虫实现。研究的时候很痛苦,但是很享受,做技术的嘛。首先,安装P
- 前言之前说了怎么写机器码到内存,然后调用。现在说说怎么优化。用Python发送微信消息给好友第二次优化再看一遍c语言的代码void Send
- 本文实例为大家分享了Vue点击显示不同图片的具体代码,供大家参考,具体内容如使用Vue中的以下知识点来显示效果①:v-for:循环遍历数据②
- 1.认识数组数组就是某类数据的集合,数据类型可以是整型、字符串、甚至是对象Javascript不支持多维数组,但是因为数组里面可以包含对象(
- 本文实例讲述了Python编码类型转换方法。分享给大家供大家参考,具体如下:1:Python和unicode为了正确处理多语言文本,Pyth
- PHP mysqli_set_charset()函数设置默认客户端字符集:<?php// 假定数据库用户名:root,密码:12345
- 一、前言写这篇文章的灵感来源于我玩游戏的时候(为了避免过不了审就不说是啥游戏了),看见一个大佬在游戏里面建造了“还原方阵
- 数据的安全性策略: 数据的生考虑应基于数据的重要性。如果数据不是很重要,那么数据的安全性策略可以稍稍放松一些。然而,如果数据很重要,那么应该
- JSON格式数据简介JSON 全称“JavaScript Object Notation”,译为&a
- python的random库,提供了很多随机抽样方法。1. 设置随机数种子 seed()在适当的情形下,为例保证抽样的结果固定,不因多次运行
- 慢SQL与索引的关系慢SQL优化原则数据库也是应用,MySQL 作为一种磁盘数据库,属于典型的 IO 密集型应用,并且随机 IO 比顺序 I
- 这是一个非常简单的解决方案,柱状图中每一条柱都是一个 div,数据的大小呈现在 div 的宽或高上。 查看演示 例子下载实现的原理
- 深度学习这个词指的是训练神经网络。深代表着非常大的神经网络。那么神经网络到底是什么呢?看了这篇文章后你就会有很直观的认识了。我们从一个房价预
- Oracle的执行计划一句话命令:set autotrace on