1. 數據分析需要掌握些什麼知識
1、數學知識:數學是每一位數據分析師必學的基礎知識,對於初級數據分析師來講,必須要具備一定的公式計算能力,並且要了解常用的模型演算法。
2、分析工具:對於初級分析師來看,必須要學會玩轉excel,並且要將透視表和公式使用的比較熟練。除此之外,還要學會VBA基本必備,SPSS/SAS/R等分析工具的使用。
3、編程語言:初級的數據分析師,是必須要會寫SQL查詢,有需要的可以寫一下Hadoop和Hive查詢。另外,還要學習好Python,這都是具備的基礎語言。
4、業務理解:業務理解對於每一位數據分析來說也是基礎的知識,主要包括獲取方案以及指標的選取還有最終結論洞察等各個方面的內容。
2. 學習數據分析要哪些基礎
一、 辦公軟體
1) 熟練使用excel, Access,Visio等MS Office辦公軟體,可以製作相關的原型; (MS即microsoft微軟,MS Office 是微軟提供的系列軟體,Word, Excel, PowerPoint, Access, OutLook,Publisher,InfoPath這7個辦公軟體中,常用的是前4個。) 2) 重點掌握EXCEL表,會使用高級功能,能快速製作報表,熟練使用EXCEL VBA;
二、 數據分析軟體及方法
1)熟練使用各種數理統計、數據分析、數據挖掘工具軟體,熟悉各種網站分析軟體的應用,如Google Analytics 、網路統計、Omniture等;
2)具備相關數據分析軟體的使用經驗SPSS\SAS\EVIEW\STATA\R\Weka……
3)至少精通使用IBM Intelligent Miner、SAS Enterprise Miner、SPSS Clementine、LEVEL5Quest、SGI、WinRosa、ExcelVBA、S-plus、Matlab、SSIS等等常見數據挖掘軟體中的一個進行數據挖掘的 開發工作;
4)熟練使用至少一種網站流量分析工具(Google Analytics、Webtrends、網路統計等),並掌握分析工具的部署、配置優化和許可權管理;
5)精通一種或多種數據挖掘演算法(如聚類、回歸、決策樹等); 6)熟悉維基編輯者優先; 7)使用軟體的要求;
(7.1)掌握數據分析、挖掘方法,具備使用Excel、SQL、SPSS/SAS、Powerpoint等工具處理和分析較大量級數據的能力;
(7.2)能夠綜合使用各種數理統計、數據分析、製表繪圖等軟體進行圖表、圖像以及文字處理;
(7.3)掌握常用的數據統計、分析方法,有敏銳的洞察力和數據感覺,優秀的數據分析能力;
(7.4)能夠綜合使用各種數理統計、數據分析、數據挖掘、製表繪圖等軟體進行具有基本數據美感的圖表、圖像以及文字處理 。
三、 資料庫語言
1)熟悉linux操作系統及至少一種腳本語言(Shell/Perl/Python);
2)熟練掌握C/C++/java中的一種,有分布式平台(如Hadoop)開發經驗者優先; 3)熟悉資料庫原理及SQL基本操作;
(3.1)了解Mysql,postgresql,sql server等資料庫原理,熟悉SQL,具備很強的學習能力,寫過程序,會perl,python等腳本語言者優先; (3.2)熟練應用mysql的select,update等sql語句; 4)熟悉sql server或其他主流資料庫,熟悉olap原理; 5)熟悉Oracle或其他大型資料庫。
四、 思維能力等方面
1)具備良好的行業分析、判斷能力、及文字表達能力;
2)溝通、協調能力強,有較高的數據敏感性及分析報告寫作能力; 3)理解網站運營的常識,能從問題中引申出解決方案,提供設計改進建議;
4)具有良好經濟學、統計學及相關領域的理論基礎,熟悉數理統計、數據分析或市場研究的工作方法,具有較強的數據分析能力;
5)熟悉數據分析與數理統計理論,具有相關課程研修經歷。
五、 其他要求
1)較強的英文聽說讀寫能力,英語6級以上;
2)文筆良好;
3)了解seo,sem優先;
4)知識要求:同時具備統計學、資料庫、經濟學三個領域的基礎知識;英語四級或以上、熟悉指標英文名稱;具備互聯網產品設計知識;
5)具有深厚的數據分析、數據挖掘理論知識,深入了解相關技術;能熟練使用至少一種統計分析或數據挖掘工具。
3. 數據分析需要掌握哪些知識
數據分析指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支持過程。在實用中,數據分析可幫助人們作出判斷,以便採取適當行動。是有組織有目的地收集數據、分析數據,使之成為信息的過程。數據分析分類。數據分析劃分為描述性統計分析、探索性數據分析以及驗證性數據分析;其中,探索性數據分析側重於在數據之中發現新的特徵,而驗證性數據分析則側重於已有假設的證實或證偽。數據分析常用方法。PEST分析:。是利用環境掃描分析總體環境中的政治(Political)、經濟(Economic)、社會(Social)與科技(Technological)等四種因素的一種模型。這也是在作市場研究時,外部分析的一部分,能給予公司一個針對總體環境中不同因素的概述。這個策略工具也能有效的了解市場的成長或衰退、企業所處的情況、潛力與營運方向。一般用於宏觀分析。SWOT分析:。又稱優劣分析法或道斯矩陣,是一種企業競爭態勢分析方法,是市場營銷的基礎分析方法之一,通過評價自身的優勢(Strengths)、劣勢(Weaknesses)、外部競爭上的機會(Opportunities)和威脅(Threats),用以在制定發展戰略前對自身進行深入全面的分析以及競爭優勢的定位。
4. 大數據分析應該掌握哪些基礎知識呢
前言,學大數據要先換電腦:
保證電腦4核8G內存64位操作系統,盡量有ssd做系統盤,否則卡到你喪失信心。硬碟越大越好。
1,語言要求
java剛入門的時候要求javase。
scala是學習spark要用的基本使用即可。
後期深入要求:
java NIO,netty,多線程,ClassLoader,jvm底層及調優等,rpc。
2,操作系統要求
linux 基本的shell腳本的使用。
crontab的使用,最多。
cpu,內存,網路,磁碟等瓶頸分析及狀態查看的工具。
scp,ssh,hosts的配置使用。
telnet,ping等網路排查命令的使用
3,sql基本使用
sql是基礎,hive,sparksql等都需要用到,況且大部分企業也還是以數據倉庫為中心,少不了sql。
sql統計,排序,join,group等,然後就是sql語句調優,表設計等。
4,大數據基本了解
Zookeeper,hadoop,hbase,hive,sqoop,flume,kafka,spark,storm等這些框架的作用及基本環境的搭建,要熟練,要會運維,瓶頸分析。
5,maprece及相關框架hive,sqoop
深入了解maprece的核心思想。尤其是shuffle,join,文件輸入格式,map數目,rece數目,調優等。
6,hive和hbase等倉庫
hive和hbase基本是大數據倉庫的標配。要回用,懂調優,故障排查。
hbase看浪尖hbase系列文章。hive後期更新。
7,消息隊列的使用
kafka基本概念,使用,瓶頸分析。看浪尖kafka系列文章。
8,實時處理系統
storm和spark Streaming
9,spark core和sparksql
spark用於離線分析的兩個重要功能。
10,最終方向決策
a),運維。(精通整套系統及故障排查,會寫運維腳本啥的。)
b),數據分析。(演算法精通)
c),平台開發。(源碼精通)
自學還是培訓?
無基礎的同學,培訓之前先搞到視頻通學一遍,防止盲目培訓跟不上講師節奏,浪費時間,精力,金錢。
有基礎的盡量搞點視頻學基礎,然後跟群里大牛交流,前提是人家願意,
想辦法跟大牛做朋友才是王道。