A. 數據運營經驗:什麼是數據分析,怎麼做數據分
數據分析是基於商業目的,有目的的進行收集、整理、加工和分析數據,提煉有價信息的一個過程。
其過程概括起來主要包括:明確分析目的與框架、數據收集、數據處理、數據分析、數據展現和撰寫報告等6個階段。
1、明確分析目的與框架
一個分析項目,你的數據對象是誰?商業目的是什麼?要解決什麼業務問題?數據分析師對這些都要瞭然於心。
基於商業的理解,整理分析框架和分析思路。例如,減少新客戶的流失、優化活動效果、提高客戶響應率等等。不同的項目對數據的要求,使用的分析手段也是不一樣的。
2、數據收集
數據收集是按照確定的數據分析和框架內容,有目的的收集、整合相關數據的一個過程,它是數據分析的一個基礎。
3、數據處理
數據處理是指對收集到的數據進行加工、整理,以便開展數據分析,它是數據分析前必不可少的階段。這個過程是數據分析整個過程中最占據時間的,也在一定程度上取決於數據倉庫的搭建和數據質量的保證。
數據處理主要包括數據清洗、數據轉化等處理方法。
4、數據分析
數據分析是指通過分析手段、方法和技巧對准備好的數據進行探索、分析,從中發現因果關系、內部聯系和業務規律,為商業目提供決策參考。
到了這個階段,要能駕馭數據、開展數據分析,就要涉及到工具和方法的使用。其一要熟悉常規數據分析方法,最基本的要了解例如方差、回歸、因子、聚類、分類、時間序列等多元和數據分析方法的原理、使用范圍、優缺點和結果的解釋;其二是熟悉1+1種數據分析工具,Excel是最常見,一般的數據分析我們可以通過Excel完成,後而要熟悉一個專業的分析軟體,如數據分析工具SPSS/SAS/R/Matlab等,便於進行一些專業的統計分析、數據建模等。
5、數據展現
一般情況下,數據分析的結果都是通過圖、表的方式來呈現,俗話說:字不如表,表不如圖。。藉助數據展現手段,能更直觀的讓數據分析師表述想要呈現的信息、觀點和建議。。
常用的圖表包括餅圖、折線圖、柱形圖/條形圖、散點圖、雷達圖等、金字塔圖、矩陣圖、漏斗圖、帕雷托圖等。
6、撰寫報告
最後階段,就是撰寫數據分析報告,這是對整個數據分析成果的一個呈現。通過分析報告,把數據分析的目的、過程、結果及方案完整呈現出來,以供商業目的提供參考。
一份好的數據分析報告,首先需要有一個好的分析框架,並且圖文並茂,層次明晰,能夠讓閱讀者一目瞭然。結構清晰、主次分明可以使閱讀者正確理解報告內容; 圖文並茂,可以令數據更加生動活潑,提高視覺沖擊力,有助於閱讀者更形象、直觀地看清楚問題和結論,從而產生思考。
另外,數據分析報告需要有明確的結論、建議和解決方案,不僅僅是找出問題,後者是更重要的,否則稱不上好的分析,同時也失去了報告的意義,數據的初衷就是為解決一個商業目的才進行的分析,不能舍本求末。
B. 什麼是數據倉庫,數據挖掘及數據挖掘的主要方法
數據倉庫主要是對不完整的、錯誤的、重復的數據進行清洗,經過清洗的數據就可以在數據倉庫的存儲層進行存儲。對於數據挖掘來講,數據清洗是數據預處理的一部分,數據挖掘的數據預處理包括數據清理、數據集成、數據變換、數據歸約、數據離散化。其中,數據清理的內容要大於等於數據倉庫的數據清洗,如果數據挖掘的數據源是從數據倉庫, 則在數據清理階段可以省去對不完整數據、錯誤數據和重復數據的清理,但像平滑雜訊數據,識別並刪除孤立點,解決不一致性等還是要在數據清理階段執行。也就是說,數據倉庫是為所有的分析應用提供數據源支撐,而數據挖掘是分析應用的一種,數據質量高的數據倉庫可以讓數據挖掘過程省去一部分預處理過程,但是不可能代替。
C. 管理學原理數據倉庫的基本分析數據包括哪些
資料庫與數據倉庫的本質差別如下:
1、邏輯層面/概念層面:資料庫和數據倉庫其實是一樣的或者及其相似的,都是通過某個資料庫,基於某種數據模型來組織、管理數據。但是,資料庫通常更關注業務交易處理(OLTP),而數據倉庫更關注數據分析層面(OLAP),由此產生的資料庫模型上也會有很大的差異。
2、資料庫通常追求交易的速度,交易完整性,數據的一致性等,在資料庫模型上主要遵從範式模型(1NF,2NF,3NF等),從而盡可能減少數據冗餘,保證引用完整性;而數據倉庫強調數據分析的效率,復雜查詢的速度,數據之間的相關性分析,所以在資料庫模型上,數據倉庫喜歡使用多維模型,從而提高數據分析的效率。
3、產品實現層面:資料庫和數據倉庫是有些不同的,資料庫通常使用行式存儲,如SAP ASE,Oracle, Microsoft SQL Server,而數據倉庫傾向使用列式存儲,如SAP IQ,SAP HANA。