游戏行业实战案例2：玩家等级

【面试题】某游戏数据后台设有「登录日志」和「登出日志」两张表。

「登录日志」记录各玩家的登录时间和登录时的角色等级。

「登出日志」记录各玩家的登出时间和登出时的角色等级。

其中，「角色 id 」字段唯一识别玩家。

游戏开服前两天（ 2022-08-13 至 2022-08-14 ）的角色登录和登出日志如下

一天中，玩家可以多次登录登出游戏，请使用 SQL 分析出以下业务问题：

玩家在开服首日（ 2022-08-13 ）等级分布情况，即每个等级停留的角色数。（如玩家没有登出日志，则使用登录日志的等级信息。）

【解题思路】

计算玩家在开服首日（ 2022-08-13 ）等级分布情况即为计算 2022-08-13 各等级停留的角色数。

可以看到，这里存在一个筛选条件—日期为 2022-08-13 。因此，在查询时，我们需要从表中筛选出 2022-08-13 的数据，即：

那么从哪个表中取数进行筛选呢？

根据题意：如玩家没有登出日志，则使用登录日志的等级信息，也就是说我们既需要从「登出日志」取数，也需要从「登录日志」取数。那么，我们可以把「登出日志」和「登录日志」两张表联结成一张表使用。

如何联结呢？

首先，我们需要理解「各等级停留」的含义。根据题意再结合「停留」一次的字面含义可以知道，某日「各等级停留」表示玩家当日最后一次登出游戏时的等级。

又因为玩家每次登出时间必然在其对应的登录时间后，且在玩家没有登出日志时使用登录日志的等级信息，所以，不管玩家登录还是登出，各玩家当日在游戏中最后一次时间下的等级即为停留等级。

也就是说，我们可以把「登出日志」和「登录日志」纵向联结，然后再通过联结后的表对每个玩家按登录或登出时间进行排序，从而筛选出每个玩家最后一次时间下的等级。

「数据分析」知识获取

面试真实案例

等资料关注

「登出日志」和「登录日志」字段数和字段含义一致，因此将「登出日志」和「登录日志」纵向联结可以使用 union all 子句。

另外，为了提高查询速度，在联结前我们就可以分别对「登出日志」和「登录日志」进行日期的筛选。

「登出日志」和「登录日志」纵向联结的 SQL 的书写方法：

查询结果如下：

纵向联结后，在联结的表（设为临时表 a ）的基础上对每个玩家按时间排序，找出每个玩家最后一次时间下的等级。

对每个玩家按时间排序即是分组排序，使用排序窗口函数即可实现。即：以角色 id 进行分组（ partition by 角色 id ），以时间进行排序（ order by 时间），获取每个玩家下的每个时间的排名。

为了方便地筛选出最后一次时间，我们对时间采用降序排序（ order by 时间 desc ），因为降序排序时，最后一次时间的排名总是 1 ，这样我们直接筛选出排名为 1 的数据即可得到最后一次时间下的数据。

排序窗口函数有 rank() 、dense_rank() 、row_number() 三种，那么我们选用哪一种排序窗口函数呢？

rank() 、 dense_rank() 、 row_number() 三者的区别在于：

rank() 函数：生成重复不连续的排序编码；

dese_rank() 函数：生成重复且连续的排序编码；

row_number() 函数：生成连续不重复的排序编码。

我们的目的是获取最后一次时间的排名，由于采用降序排序，不管使用哪种排序窗口函数，最后一次时间的排名总会是 1 。

因此，这三种排序窗口函数都可以使用，选择其一即可，在此，我们选择 rank() 函数。

这样，对每个玩家按时间排序的 SQL 语句为：

其中，a 为前面纵向联结的表，将其带入后，SQL 的书写方法：

查询结果如下：

将上述查询结果设为临时表 b ，从该临时表中筛选出排名为 1（where 排名 = 1）的数据即可得到玩家的停留等级信息。

SQL 的书写方法：

将临时表 b 的具体 SQL 语句带入，完整的 SQL 的书写方法：

查询结果如下：

最后，我们来计算各等级停留的角色数。

计算各等级停留的角色数分为两步：

第一步，对各停留的角色等级进行分组；

第二步，分组后，计算各等级的角色数。

可以看到，这其实是一个分组汇总问题，而计算数量可以使用具有计数功能的聚合函数— count() 函数。

因此，我们使用 group by 子句组合 count() 函数计算各等级停留的角色数。

SQL 的书写方法：

查询结果如下：

玩酷网

游戏行业实战案例2：玩家等级

热门分类