① excel大數據處理技巧
方法/步驟
1、數據整理。工欲善其事,必先利其器。數據質量是數據分析的生命,此步驟不可忽視、不可走過場。
①數字型的數字才可以參與畫圖和做分析模型,所以數據不能帶單位(如:元、萬元),也不能用區間數據(如:23-25,不要將電腦當作神腦)。
②數據的單位要一致,統一按列排序或者按行排序,此案例用列排序。
③注意:對於用文本格式存儲的數字,單元格左上角有個綠色三角表示,要注意修改為數字格式。
2、對於本例,需要用到隨機函數rand()。一個色子有6個面,取數為1-6。模擬色子數據=int(rand()*6)+1。
其他用到的函數有:求和sum();最大值max();最小值min()。
3、繪制圖形。
①目前我們只做2維的數據分析,只有1個自變數和1個因變數。選擇2列數據,合計列和最大值列。技巧:當需要選擇不相鄰兩列,可以先選1列,按ctrl鍵,再選另1列,放開ctrl鍵。
②菜單插入→圖形→散點圖,確認。當然,折線圖等也可以數據分析,但為了圖面干凈,推薦還是用散點圖。
4、相關性分析。
首先,在散點圖上某個散點上右鍵→添加趨勢線。
5、然後,緊接著自動彈出設置趨勢線模式(若沒彈出這個對話框,也可在圖上某個散點上右鍵,選擇設置趨勢線模式)→顯示公式、顯示R平方值。至於回歸分析類型,採用線性類型比較通用些。
6、關閉後,觀察圖上的r2值(實際是指R平方值,下同),r2值0.8到1,說明正相關,自變數和因變數有(線性)關系。r2值0.6到0.8,弱相關。-0.6到0.6,不相關,自變數對因變數沒有影響。-0.8到-0.6,弱負相關。-1到-0.8,負相關,自變數和因變數有(線性)關系,但方向相反。
7、最後,點擊圖上任意散點,表格會出現紅色框和藍色框,紅色是因變數,不能移動,藍色框可以移動。通過滑鼠拖動藍色框,可以看到最大值、最小值、中間值與合計數的線性相關性r2值。
8、本案例數據統計:合計數與最大值、最小值的相關性大多在0-0.7以內,合計數與中間值的相關性大多在0.7以上。自變數x為中間值,因變數y為合計數,他們的關系模型為:y = 0.4196x - 0.8817。(當然,公式中的參數只是針對這25次試驗)
本案例結論:三數合計與中間值呈弱線性相關。
推論:評分比賽中,將最高分和最低分同時去掉,不影響最終得分。
以上就是Excel數據處理並繪製成分析圖形方法介紹,操作很簡單的,你學會了嗎?希望這篇文章能對大家有所幫助!