图解面试题:如何提高SQL查询的效率?

男宝小崽子 2024-02-22 05:00:34

【题目】

我们公司的数据量非常大,需要的不仅仅是提取数据,要了解SQL方案优化的。一般在写SQL时需要注意哪些问题,可以提高查询的效率?

【解题思路】

数据量大的情况下,不同的SQL语句,消耗的时间相差很大。按下面方法可以提高查询的效果。

1. select子句中尽量避免使用*

select子句中,*是选择全部数据的意思。比如语句:“select * from 成绩表”,意思是选择成绩表中所有列的数据。在我们平时的练习中,往往没有那么多数据,所以很多同学会图方便使用*。而在处理公司事务时,动辄十万、百万,甚至上千万的数据,这个时候再用*,那么接下来的几分钟就只能看着电脑屏幕发呆了。所以,在我们平常的练习中,就要养成好的习惯,最后需要哪些列的数据,就提取哪些列的数据。尽量少用*来获取数据。另外,如果select * 用于多表联结,会造成更大的成本开销。

2. where子句比较符号左侧避免函数

尽量避免在where条件子句中,比较符号的左侧出现表达式、函数等操作。因为这会导致数据库引擎进行全表扫描,从而增加运行时间。举个例子,下图是10名学生的成绩表,老师突然发现因为参考答案出错,给所有人都少加了5分,现在需要查询:给每人加5分后,成绩依然在90分以上的同学的学号。

按照题目的思路直接书写,“给每人加5分后,成绩90分以上”的条件很多人会这样写:

where 成绩 + 5 > 90 (表达式在比较符号的左侧)

优化方法:

where 成绩 > 90 – 5(表达式在比较符号的右侧)

所以,为了提高效率,where子句中遇到函数或加减乘除的运算,应当将其移到比较符号的右侧。

3. 尽量避免使用or

or同样会导致数据库进项全表搜索。

在工作中,如果你只想用or从几十万语句中取几条出来,是非常划不来的,怎么办呢?下面的方法可替代or。

从成绩表中选出成绩是是88分或89分学生的学号:

select 学号

from 成绩表

where 成绩 = 88 or 成绩 = 89

优化后:

select 学号

from 成绩表

where 成绩 = 88

union

select 学号 from 成绩表 where 成绩 = 89

语句虽然变长了一点,但处理大量数据时,可以省下很多时间,是非常值得的。

4.使用limit子句限制返回的数据行数

如果前台只需要显示15行数据,而你的查询结果集返回了1万行,那么这适合最好使用limt子句来限制查询返回的数据行数。

【本题考点】

在面试中,当面试官提出这一类问题,按照上述的方法进行回答都是没有问题的,但不仅在面试中,平时练习就养成习惯是最好的。

大多数同学都会觉得“麻烦”、“不做也没有什么影响”,但是习惯总是慢慢养成的。

拥有好习惯,未来在工作中,面对不同的数据量,就可以游刃有余地选择不同的方法来降低完成时间,从而提升工作效率。现在很多职位都已经把sql列入技能要求,连一些财会岗位都优先有sql技能的求职者。

其实这一定程度上也是要求求职者有数据分析能力,能使用sql的工具,最好还能对数据提出自己的见解和建议。

针对这样的情况,我在知乎知学堂上线了一个数据分析课程,结合IBM项目经验和国内互联网大厂一线业务案例,讲解常用模型+逻辑框架,还有常用数据分析工具带练+业务实操带练,数据分析技能和思维两条腿走路,让你成为真正的数据分析师,而不是数据处理工具人。

课程共3天6小时,从基础讲起,对0基础的小白也很友好,还会讲解个人数据分析项目怎么做,一些其他求职的问题,也可以1v1咨询专业老师。无论你是想学习个辅助工作的技能,还是想转行数据分析,都可以点击文末阅读原文链接学习:

Python机器学习:适合新手的8个项目

领导让我预测下一年销量,怎么办?

一张图看懂数据分析、机器学习、深度学习、人工智能的关系

为什么Kaggle对找工作有帮助?如何入门?

0 阅读:0