1. 数据分析需要掌握些什么知识
1、数学知识:数学是每一位数据分析师必学的基础知识,对于初级数据分析师来讲,必须要具备一定的公式计算能力,并且要了解常用的模型算法。
2、分析工具:对于初级分析师来看,必须要学会玩转excel,并且要将透视表和公式使用的比较熟练。除此之外,还要学会VBA基本必备,SPSS/SAS/R等分析工具的使用。
3、编程语言:初级的数据分析师,是必须要会写SQL查询,有需要的可以写一下Hadoop和Hive查询。另外,还要学习好Python,这都是具备的基础语言。
4、业务理解:业务理解对于每一位数据分析来说也是基础的知识,主要包括获取方案以及指标的选取还有最终结论洞察等各个方面的内容。
2. 学习数据分析要哪些基础
一、 办公软件
1) 熟练使用excel, Access,Visio等MS Office办公软件,可以制作相关的原型; (MS即microsoft微软,MS Office 是微软提供的系列软件,Word, Excel, PowerPoint, Access, OutLook,Publisher,InfoPath这7个办公软件中,常用的是前4个。) 2) 重点掌握EXCEL表,会使用高级功能,能快速制作报表,熟练使用EXCEL VBA;
二、 数据分析软件及方法
1)熟练使用各种数理统计、数据分析、数据挖掘工具软件,熟悉各种网站分析软件的应用,如Google Analytics 、网络统计、Omniture等;
2)具备相关数据分析软件的使用经验SPSS\SAS\EVIEW\STATA\R\Weka……
3)至少精通使用IBM Intelligent Miner、SAS Enterprise Miner、SPSS Clementine、LEVEL5Quest、SGI、WinRosa、ExcelVBA、S-plus、Matlab、SSIS等等常见数据挖掘软件中的一个进行数据挖掘的 开发工作;
4)熟练使用至少一种网站流量分析工具(Google Analytics、Webtrends、网络统计等),并掌握分析工具的部署、配置优化和权限管理;
5)精通一种或多种数据挖掘算法(如聚类、回归、决策树等); 6)熟悉维基编辑者优先; 7)使用软件的要求;
(7.1)掌握数据分析、挖掘方法,具备使用Excel、SQL、SPSS/SAS、Powerpoint等工具处理和分析较大量级数据的能力;
(7.2)能够综合使用各种数理统计、数据分析、制表绘图等软件进行图表、图像以及文字处理;
(7.3)掌握常用的数据统计、分析方法,有敏锐的洞察力和数据感觉,优秀的数据分析能力;
(7.4)能够综合使用各种数理统计、数据分析、数据挖掘、制表绘图等软件进行具有基本数据美感的图表、图像以及文字处理 。
三、 数据库语言
1)熟悉linux操作系统及至少一种脚本语言(Shell/Perl/Python);
2)熟练掌握C/C++/java中的一种,有分布式平台(如Hadoop)开发经验者优先; 3)熟悉数据库原理及SQL基本操作;
(3.1)了解Mysql,postgresql,sql server等数据库原理,熟悉SQL,具备很强的学习能力,写过程序,会perl,python等脚本语言者优先; (3.2)熟练应用mysql的select,update等sql语句; 4)熟悉sql server或其他主流数据库,熟悉olap原理; 5)熟悉Oracle或其他大型数据库。
四、 思维能力等方面
1)具备良好的行业分析、判断能力、及文字表达能力;
2)沟通、协调能力强,有较高的数据敏感性及分析报告写作能力; 3)理解网站运营的常识,能从问题中引申出解决方案,提供设计改进建议;
4)具有良好经济学、统计学及相关领域的理论基础,熟悉数理统计、数据分析或市场研究的工作方法,具有较强的数据分析能力;
5)熟悉数据分析与数理统计理论,具有相关课程研修经历。
五、 其他要求
1)较强的英文听说读写能力,英语6级以上;
2)文笔良好;
3)了解seo,sem优先;
4)知识要求:同时具备统计学、数据库、经济学三个领域的基础知识;英语四级或以上、熟悉指标英文名称;具备互联网产品设计知识;
5)具有深厚的数据分析、数据挖掘理论知识,深入了解相关技术;能熟练使用至少一种统计分析或数据挖掘工具。
3. 数据分析需要掌握哪些知识
数据分析指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。是有组织有目的地收集数据、分析数据,使之成为信息的过程。数据分析分类。数据分析划分为描述性统计分析、探索性数据分析以及验证性数据分析;其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。数据分析常用方法。PEST分析:。是利用环境扫描分析总体环境中的政治(Political)、经济(Economic)、社会(Social)与科技(Technological)等四种因素的一种模型。这也是在作市场研究时,外部分析的一部分,能给予公司一个针对总体环境中不同因素的概述。这个策略工具也能有效的了解市场的成长或衰退、企业所处的情况、潜力与营运方向。一般用于宏观分析。SWOT分析:。又称优劣分析法或道斯矩阵,是一种企业竞争态势分析方法,是市场营销的基础分析方法之一,通过评价自身的优势(Strengths)、劣势(Weaknesses)、外部竞争上的机会(Opportunities)和威胁(Threats),用以在制定发展战略前对自身进行深入全面的分析以及竞争优势的定位。
4. 大数据分析应该掌握哪些基础知识呢
前言,学大数据要先换电脑:
保证电脑4核8G内存64位操作系统,尽量有ssd做系统盘,否则卡到你丧失信心。硬盘越大越好。
1,语言要求
java刚入门的时候要求javase。
scala是学习spark要用的基本使用即可。
后期深入要求:
java NIO,netty,多线程,ClassLoader,jvm底层及调优等,rpc。
2,操作系统要求
linux 基本的shell脚本的使用。
crontab的使用,最多。
cpu,内存,网络,磁盘等瓶颈分析及状态查看的工具。
scp,ssh,hosts的配置使用。
telnet,ping等网络排查命令的使用
3,sql基本使用
sql是基础,hive,sparksql等都需要用到,况且大部分企业也还是以数据仓库为中心,少不了sql。
sql统计,排序,join,group等,然后就是sql语句调优,表设计等。
4,大数据基本了解
Zookeeper,hadoop,hbase,hive,sqoop,flume,kafka,spark,storm等这些框架的作用及基本环境的搭建,要熟练,要会运维,瓶颈分析。
5,maprece及相关框架hive,sqoop
深入了解maprece的核心思想。尤其是shuffle,join,文件输入格式,map数目,rece数目,调优等。
6,hive和hbase等仓库
hive和hbase基本是大数据仓库的标配。要回用,懂调优,故障排查。
hbase看浪尖hbase系列文章。hive后期更新。
7,消息队列的使用
kafka基本概念,使用,瓶颈分析。看浪尖kafka系列文章。
8,实时处理系统
storm和spark Streaming
9,spark core和sparksql
spark用于离线分析的两个重要功能。
10,最终方向决策
a),运维。(精通整套系统及故障排查,会写运维脚本啥的。)
b),数据分析。(算法精通)
c),平台开发。(源码精通)
自学还是培训?
无基础的同学,培训之前先搞到视频通学一遍,防止盲目培训跟不上讲师节奏,浪费时间,精力,金钱。
有基础的尽量搞点视频学基础,然后跟群里大牛交流,前提是人家愿意,
想办法跟大牛做朋友才是王道。