“找数据分析师的工作好难啊,没有相关经验可以写到简历里怎么办?”
“没有实习经验,面试直接拒绝,怎么找第一份实习啊?”
“没做过商业数据分析项目怎么在面试中展示自己的能力呀?”
——这是小九在公众号后台中收到最多的连环问题……
如果你是一名数据分析新人,有一定统计理论知识储备和数据分析软件运用(SQL、EXCEL、Python),但却没有实际做过商业项目,想知道如何来找一些数据分析的项目来做,练习所学习的数据分析技能,并能写出一份数据分析报告呢?
因为作为新人,如果没有数据项目经历很难找到一份相关工作。该从哪里可以学习如何做数据分析项目?如何找到项目做?如何出报告?小九今天在这给大家支支招!
途径一:Kaggle
什么是Kaggle?Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。数据分析社区一直有这样一个难题:对于同一个问题,可以有多个模型来解决,但是研究者不可能在一开始就了解哪些模型是最好的。
Kaggle就是为了解决这样的问题诞生的,它试图通过众包的形式来解决这一难题。众包是什么意思呢,举个栗子,小九现在有一个问题,我可以把这个问题发布到网站上,然后很多人看到了这个问题,其中有10个人给出了这个问题的答案,这样我就有10个答案了 (对应机器学习中的模型)。我选出排名前3的答案,拿出一笔奖金奖励这3个人。
如何上手Kaggle?理论上来讲,Kaggle欢迎任何数据科学的爱好者,不过实际上,要想真的参与其中,还是有一定门槛的。一般来讲,参赛者最好具有统计、计算机或数学相关背景,有一定的coding技能,对机器学习和深度学习有基本的了解。Kaggle任务虽然不限制编程语言,但绝大多数队伍会选用Python和R,所以你应该至少熟悉其中一种。当然,如果你从未独立做过一个项目,可以先从练习赛开始熟悉。因为竞赛模式中的任务是公司悬赏发布的实际案例,并没有标准的答案;而练习赛不仅项目难度低,而且是有官方给出的参考方案的,大家可以用来对比改善自己的测试结果,从中进行提高。
途径二:和鲸社区
刚刚介绍了Kaggle,里面确实有非常多的项目,可是本人是个英语弱鸡,刚开始还是觉得很吃力怎么办,这里小九再介绍一个国内的网站,相当于中国版Kaggle,叫和鲸社区。初期可以跟着学习,理解分析思路,学习python语法和库的使用,虽然项目不是很多,但也够新手练习的。
途径三:九道门商业数据分析学院
企业想要的项目经验最好是做过真实项目的项目经验,而不是模拟实验。
首先模拟项目和真实性项目是肯定有区别的。
一个企业的真实项目的流程是这样的:去企业开会接项目——了解企业需求——详细咨询企业最迫切解决的问题——指标分解——去企业拿数据并签订保密协议——数据处理——数据分析(过程中不断与企业对接人交流)——可视化制作——PPT与分析报告撰写——向企业汇报分析结果——企业验收分析项目。
而模拟的项目是做不到这样的。所以在没有企业项目的情况下,你就只能退一步,去看看别的大数据分析师是如何做一个项目的,去复制他们做项目的思路,再结合自己的理解。这个过程你可以去阿里天池大赛上看看,或者Kaggle还有和鲸社区,小九这也有一些数据分析师的案例视频,这些都可以帮你理解大数据分析师的分析思路。
小结
其实不论是Kaggle还是和鲸社区,都为我们提供了丰富的数据集。但并不是所有的数据集都适合我们拿来练手作为项目经历的补充,绝大多数的数据集都是偏向于算法优化的,这就导致数据集本身的数据字段不一定能够挖掘出和很多业务思想相关的东西。敲重点,小九所说的数据项目经历,是偏数据分析方向的,而非算法方向。
数据分析和算法的区别之一就在于,以算法岗为求职目标的同学在看见数据集的时候,脑子里想到的一定是“我要怎么做才能让模型预测的更好?”;而以数分(商分)为求职目标的同学在看见数据集的时候,应该去判断“这些数据对我优化业务管理有什么帮助?”
其实没有数分相关的实习或者项目经历并不可怕,花上2个月的时间,投入100%的精力选择一个企业真实项目去琢磨,体验“数据清洗->数据探索->数据建模(数据可视化)->输出结论”的过程,技巧性的总结成项目文档,一定能有所收获。在面试的过程中,拥有企业真实项目经历,能够成为你的亮点项目。
九道门商业数据分析实训课一共分为4个阶段:(必须具备Python、Mysql基础)
第1阶段:强化训练数据分析流程,组队完成一个自主项目,从数据获取、数据爬取、数据清洗、数据分析、数据可视化、数据分析报告撰写演讲进行训练,通过自主分析项目将分析工具运用熟练。
第2阶段:强化训练商业分析思维和分析方法,从产品、促销、定价、顾客四个维度进行商业数据分析项目整合,从新产品的竞争情报分析到定价策略、促销方案计算、顾客分类管理等方面入手强化商业分析思维。
第3阶段:面对复杂数据问题进行进阶训练,主要训练数据分析师常用的算法模型,比如:线性回归、逻辑回归、关联、聚类、决策树、随机森林等。将放置在企业的一个数据场景中进行训练。
第4阶段:企业真实项目的导入,教员带领学员去企业沟通项目需求、签订三方保密协议、获取数据、实施分析、项目提报、企业验收、会议总结交流。
通过以上4个阶段的强化实训,相当于1年多的工作经验,对一个初入商业数据分析领域的小伙伴有很好的经验加速作用。