「求职」2024年金三银四，这份数据分析面试题集锦请查收！

在数据分析师面试中，掌握必备的知识和技能是至关重要的，例如，统计学基础知识、常用的数据分析工具、数据分析思维等，为了帮助你更好地准备面试，本文将为你带来一份数据分析面试题集锦，涵盖了数据分析师必备的核心知识点。一、概率论与统计学基础面试题1：正态分布的特征关于正态分布,下列说法错误的是( ) A. 正态分布具有集中性和对称性B. 正态分布的均值和方差能够决定正态分布的位置和形态C. 正态分布的偏度为0，峰度为1D. 标准正态分布的均值为0，方差为1 答案解析：C A. 正态分布具有集中性和对称性。这是正态分布的基本性质，所以A选项是正确的。B. 正态分布的均值和方差能够决定正态分布的位置和形态。均值决定位置，方差决定形态（即分散程度），所以B选项也是正确的。C. 正态分布的偏度为0，峰度为1。偏度确实为0，但峰度是3，不是1。因此，C选项是错误的。D. 标准正态分布的均值为0，方差为1。这是标准正态分布的定义，所以D选项是正确的。面试题2：泊松分布若X服从参数为入的泊松分布，则EX的值等于() A. DX B. DX^2 C. D2X D. D(X/2) 答案解析：A 泊松分布是一种离散概率分布，其概率质量函数为：P(X = k) = λ^k × e^(-λ) / k!，其中k是整数，λ是泊松分布的参数。对于任何随机变量X，其期望EX和方差DX满足以下关系：EX = μ，其中μ是X的均值。DX = EX^2 - (EX)^2。对于泊松分布，我们知道：EX = λ，这是泊松分布的期望。DX = λ，这是泊松分布的方差。二、EXCEL数据分析面试题1：IF函数设E列单元格存放工资总额，F列用以存放实发工资。其中当工资总额>800时，实发工资=工资总额-(工资总额-800)*税率;当工资总额≤800时，实发工资=工资总额。设税率=0.05，则F列可根据公式实现。其中F2的公式为（） A. =IF(E2>800,E2-(E2-800)*0.05,E2)B. =IF(E2>800,E2,E2-(E2-800)*0.05)C. =IF("E2>800",E2-(E2-800)*0.05,E2)D. =IF("E2>800",E2,E2-(E2-800)*0.05)答案解析：A IF函数用于根据条件判断并返回不同的值。该函数的语法为IF(logical_test, value_if_true, value_if_false)。根据题目描述，当工资总额大于800时，实发工资为工资总额减去税款，税款为(工资总额-800)乘以税率；当工资总额小于或等于800时，实发工资等于工资总额。因此，F2单元格的公式为IF(E2>800, E2-(E2-800)*0.05, E2)，其中E2>800为逻辑测试条件，E2-(E2-800)*0.05为当条件为真时返回的值，E2为当条件为假时返回的值。面试题2：EXCEL排序使用excel对"星期一、星期二、星期三、星期四、星期五、星期六、星期日"进行降序排序，下列正确的是（） A. 星期一、星期五、星期四、星期三、星期日、星期六、星期二B. 星期一、星期二、星期三、星期四、星期五、星期六、星期日C. 星期日、星期一、星期二、星期三、星期四、星期五、星期六D. 星期六、星期日、星期一、星期二、星期三、星期四、星期五答案解析：A 在Excel中对于“一、二、三、四、五、六日”的排序顺序为“二、六、日、三、四、五、一”，所以“星期一、星期二、星期三、星期四、星期五星期六、星期日”的降序为“星期一、星期五、星期四、星期三、星期日、星期六、星期二” 三、SQL数据分析面试题1：alter操作设置表ts_score中的score列为非空，那么可以使用哪个语句（） A. alter table ts_score add score not nullB. alter table ts_score modify score not nullC. alter table ts_score alter score not nullD. alter table ts_score drop score not null问题解析：B 要设置表ts_score中的score列为非空，应该使用以下SQL语句： B. alter table ts_score modify score not null;这条语句的意思是将ts_score表中的score列修改为非空。面试题2：SELECT操作对下面的查询语句描述正确的是（） Select StudentID,Name, (select count(*) from StudentExam where StudentExam.StudentID= Student.StudentID) as ExamsTaken from Student order by ExamsTaken descA. 从student表中查找studentID和Name，并按照升序排列B. 从student表中查找studentID和Name，并按照降序排列C. 从student表中查找studentID、Name和考试次数D. 从student表中查找studentID、Mame，并从studentExam表中查找与studentID一致的学生考试次数，并按照降序排列问题解析：D 对下面的查询语句描述正确的是： D. 从student表中查找studentID、Mame，并从studentExam表中查找与studentID一致的学生考试次数，并按照降序排列。解释：查询涉及两个表：Student 和 StudentExam。Student 表被选择，并且选择了 StudentID 和 Name 列。使用了子查询来计算每个学生参加的考试次数。这个子查询从 StudentExam 表中选择与 Student 表中的 StudentID 相匹配的记录数。as ExamsTaken 是一个别名，将子查询的结果命名为 ExamsTaken。order by ExamsTaken desc 表示结果将根据 ExamsTaken（即学生参加的考试次数）进行降序排列。因此，选项D是正确的描述。四、Python数据分析面试题1：Python实现报数算法有40个人围成一圈，顺序排号。从第一个人开始报数（只报123这三个数），凡报到数字为3的人就会退出圈子，问最后留下的是原来第几号的那位。问题解析：28 在Python中实现这个报数算法，我们可以使用列表来模拟这40个人的圈子，并循环遍历这个列表来模拟报数的过程。当报到数字3时，我们就从列表中移除对应的元素。由于人们是围成一圈的，我们需要使用模运算来确保索引在列表的范围内循环。以下是实现这个算法的Python代码： def josephus_problem(n): # 创建一个列表来表示围成一圈的人，初始时每个人的编号是连续的 people = list(range(1, n + 1)) # 初始化报数的索引，从第一个人开始 index = 0 # 当列表中还有多于一个人时，继续报数 while len(people) > 1: # 报数1、2、3，每次报数后索引向前移动一位 for _ in range(3): # 如果当前索引指向的人已经被移除，则跳过 if index >= len(people): index = 0 # 否则，检查是否需要移除这个人 elif people[index] == 3: # 移除这个人 people.pop(index) # 索引向前移动一位，准备报下一个数 index = (index + 1) % len(people) # 返回最后留下的人的编号 return people[0] # 在这个例子中，有40个人 final_person = josephus_problem(40) print(f"最后留下的是原来第{final_person}号的那位。")这段代码定义了一个函数josephus_problem，它接收一个参数n，表示总人数。函数内部创建了一个列表people来存储每个人的编号，并使用一个while循环来模拟报数和淘汰的过程。当只剩下一个人时，函数返回这个人的编号。最后，我们调用这个函数并传入40作为参数，打印出最后留下的人的原始编号。根据题目要求，这个编号应该是28。面试题2：Python统计字母和数字个数分别计算Helwsx121wae233w43af%213_awe+41anuju=1ioxkla1~wee这一字符串中字母和数字的个数，结果输出字母个数和数字个数的和；问题解析：35 为了统计字符串中字母和数字的个数，我们可以使用Python的isalpha()和isdigit()方法。isalpha()方法检查字符串中的所有字符是否都是字母，而isdigit()方法检查字符串中的所有字符是否都是数字。我们可以遍历字符串中的每个字符，并使用这些方法来确定字符的类型。下面是一个简单的Python代码示例，用于计算给定字符串中字母和数字的个数，并输出它们的和： # 给定的字符串 s = "Helwsx121wae233w43af%213_awe+41anuju=1ioxkla1~wee" # 初始化计数器 letter_count = 0 digit_count = 0 # 遍历字符串中的每个字符 for char in s: # 如果字符是字母，增加字母计数器 if char.isalpha(): letter_count += 1 # 如果字符是数字，增加数字计数器 elif char.isdigit(): digit_count += 1 # 输出字母和数字的总数 total_count = letter_count + digit_count print(f"字母个数: {letter_count}") print(f"数字个数: {digit_count}") print(f"字母和数字个数的和: {total_count}")当你运行这段代码时，它会输出：字母个数: 22 数字个数: 13 字母和数字个数的和: 35这表明字符串中有22个字母和13个数字，它们的总和是35。五、数据分析思维面试题1：APP产品对比以下哪款产品的盈利模式与其他的不同（） A. 58同城B. 淘宝C. 马蜂窝D. 神州专车答案解析：D 已知四款产品：58同城、淘宝、马蜂窝和神州专车，我们需要找出盈利模式与其他不同的产品。 58同城：主要通过在线广告和会员服务来获取收入。淘宝：通过商家入驻费、交易佣金、推广服务费等来获取收入。马蜂窝：主要来源于在线广告、旅游代理服务费等。神州专车：通过提供专车服务和相关费用来获取收入。经过对比分析，我们可以看到神州专车的盈利模式与其他三款产品存在明显差异。其他三款产品（58同城、淘宝、马蜂窝）的收入来源都与在线广告和/或服务费有关，而神州专车的收入主要来源于提供实体服务（专车服务）。面试题2：企业运营模式常见的企业运营模式包括大客户模式、直销模式、分销模式、免费模式、会议营销模式、社群模式、体验营销模式等。其中小米、逻辑思维、理财体验金分别属于（）模式 A. 直销模式、社群模式、体验营销B. 直销模式、分销模式、免费模式C. 分销模式、直销模式、免费模式D. 免费模式、分销模式、直销模式答案解析：A 首先，我们需要理解每个运营模式的定义和特点：大客户模式：主要针对大型企业或机构，提供定制化的服务和解决方案。直销模式：直接与最终消费者建立联系，通过电话、邮件、网络等方式进行销售。分销模式：通过经销商或代理商将产品分发到不同的销售渠道。免费模式：通过提供免费的产品或服务来吸引用户，再通过其他方式实现盈利。会议营销模式：通过组织各类会议或活动来推广产品或服务。社群模式：基于共同的兴趣或目标建立社群，通过社群运营来促进产品销售。体验营销模式：让消费者亲身体验产品或服务，从而促进销售。接下来，根据这些定义来判断小米、逻辑思维、理财体验金分别属于哪种模式：小米：主要通过线上直销和分销渠道，与消费者直接建立联系，因此属于直销模式。逻辑思维：通过建立社群，提供有价值的内容吸引用户，并在此基础上进行产品销售，所以属于社群模式。理财体验金：通常提供一定额度的虚拟资金让用户进行理财体验，这种模式旨在通过用户体验来促进产品或服务的销售，因此属于体验营销模式。通过深入了解这些面试问题，你将能够更好地准备数据分析师的面试。希望这些面试题能帮助你在面试中展现出自己的专业知识和技能，成功获得心仪的职位，如果你在学习过程中遇到问题，可在评论区留言，解决你的面试问题。

玩酷网

「求职」2024年金三银四，这份数据分析面试题集锦请查收！

数据我来大话侃