新人入职场,会经常听到老员工或者leader说,“这个业务我们要看XXX数据”“这个需求出个数据”等话题,很多新人初入职场的时候会很迷茫——数据是什么数据?哪些数据重要?我要怎么去分析数据才是有价值的?实际上,随着大数据的发展,现在似乎越来越多的业务需要“数据意识”“数据分析”的能力,特别是大企业更是如此。简单的来讲,就是大企业的用户多,产生的数据多,因此除了传统的问卷调研、访谈等手段,还能通过大量的数据进行分析。这样同样能够起到了解用户反馈、产品效益的目的,甚至在很多情况下还会更准确、更省时间。
也因此,许多企业在招聘时会偏好有“数据分析”能力的候选人;同时很多打工人也发现,原有的Excel技能很难满足自己的工作需求,有一定的数据能力能够大大提升自己的办公效率,开始自学数据分析。
今天,小助手就和大家分享下,除了常规的Excel,还有什么数据分析的工具值得用、值得学,主要分了三个等级
1.入门级:非数分方向的同学,如果仅是有一定的数据分析需求的话,学会这个就非常够用了;
2.进阶级:非数分方向的同学,如果对自己要求较高,又经常需要汇报演讲,那这个就很合适;
3.专业级:数分方向的同学可以研究,非专业人士没什么太大必要。
入门级:MySQL/ORACLE/POSTGRESQL
SQL基本上是数据方向上所有岗位的必备技能,重要程度和Excel不相上下。做数据分析专业的同学常常会称自己为SQL民工也是因为同样的原因。对于非数分岗位的同学,其实能够掌握sql就非常足够了。
SQL入门比较容易,概括起来就是在数据库里搜索调取想要的数据,在数据库里增删改查新旧数据。总而言之,要想入行数据分析,SQL是必要技能。
进阶级:TABLEAU/POWERBI:
作为可视化工具的Tableau和PowerBI在数据分析中也是不可或缺的一部分。Tableau的上手非常快,只要拖拽处理过的数据后便会产出很多精美的可视化图像。
数据可视化简单明了,用图表来识别问题,在做数据分析和演讲时都会让你在工作上非常加分。适合有数据分析需求,又需要做汇报的同学。
专业级:PYTHON:
除了SQL外,如果需要更成熟的数分技能,Python也一定会要求(当然大多数非数分岗的打工人还不需要这么专业)。Python也是一款比较容易上手的数据分析软件。写作语法和英语比较相似,比起Java,C++等SDE必须要会的软件更容易上手。
用Python清理数据和处理数据时往往比较方便快捷,同时,有很多数据科学家也会在Python中编写模型。Python可以进行爬虫,写游戏,可以说是数据分析师一定要会的数据分析工具了。
专业级:R Programming:
随着Python的广泛应用,用R的分析师近几年好像有所减少,但R多数被用于统计计算和图形的编程语言的免费软件。
R语言在统计学家和数据挖掘者中广泛用于开发统计软件和数据分析,同时R语言作为一个老牌分析软件,其Library做的非常的完善,如果同学们在使用R语言时遇到任何问题都基本可以在Library里找到答案。
专业级:APACHE SPARK
Apache Spark是大数据分析软件,用于大规模数据处理的统一分析引擎。
它提供Java,Scala,Python和R中的高级API,以及支持常规执行图的优化引擎。 和Hadoop MapReduce一样,用于在集群上使用并行的分布式算法来处理和生成大数据集。但Spark的执行速度比MapReduce快100倍,如果你想要进入大数据领域的分析师,Spark是一定要会的技能之一。
专业级:BIGML:
BigML是另一种广泛使用工具,它提供了一个完全可交互的,可用于处理机器学习算法。
BigML提供了使用云计算满足行业需求的标准化软件。通过它,公司可以在公司的各个部门中使用机器学习算法。
例如,它可以将这一软件用于销售预测,风险分析和产品创新。 BigML专门从事预测建模。它使用各种各样的机器学习算法,例如聚类,分类,时间序列预测等。