『壹』 如何做面板數據的聚類分析
如果你要考慮到面板數據本身的特定 還要再進行聚類的話,spss是沒法做的,因為spss無法處理面板分析。
但是如果只是進行聚類的話,無論是否有時間序列因素在,都可以直接採用一般的聚類方式進行操作就可以了。
實際上做聚類分析,不需要考慮面板的時間序列因素,所以你可以直接按照一般聚類方法做就好了
『貳』 R語言基礎知識筆記
1、向量是用於存儲數值型,字元型或者邏輯型數據的一維數組。執行組合功能的函數為c(),可以用來創建向量。向量可根據位置進行索引,需要用[]。
2、矩陣是一個二維數組,每個元素都擁有相同的模式,可通過函數matrix()創建矩陣。
3、數組是一個可以在兩個以上維度存儲數據的數據對象。例如,如果創建尺寸(2,3,4)的數組,那麼就是創建4個矩形矩陣每個2行3列。數組只能存儲數據類型。
4、矩陣和數組一樣都只能包含一種數據類型,當有多種模式的數據時,使用數據框就更為方便。數據框可以用函數data.frame () 創建。
5、$ 被用來選取一個給定數據框中的某個特定變數。
6、attach()綁定數據集,detach()解除數據集。
7、with:attach,detach最好在單獨的數據框內使用,在多個同名對象最好不要使用,函數with(),可以再具有多個同名對象的數據框內使用,但是必須加入花括弧{},這樣就無須擔心名稱沖突了,但是它也有局限性,賦值僅在此函數的括弧內生效。
8、列表是一些對象的有序集合。
9,、數據導入 read.table(),其中header = T,代表第一行為變數名稱,不作為數據,header = F相反。sep代表數據分隔符,txt為"\t",csv為","。
10、table函數,用 table() 函數統計因子各水平的出現次數(稱為頻數或頻率)。
>sex = c("女","女","女","男","男")
>table(sex)
>sex
男 女
2 3
求眾數
> aim = table(sex)[table(sex)==max(table(sex))]
> aim
女
3
> max(table(sex))
[1] 3
> table(sex)==max(table(sex))
sex
男 女
FALSE TRUE
11、 無尺度網路: 是指在某一復雜的 系統 中,大部分節點只有少數幾個連結,而某些節點卻擁有與其他節點的大量連結。這些具有大量連結的節點稱為「集散節點」,所擁有的連結可能高達數百、數千甚至數百萬。這一特性說明該網路是無尺度的,因此,凡具有這一特性的網路都是無尺度網路。
12、options(stringsAsFactors = F)
#在調用as.data.frame的時,將stringsAsFactors設置為FALSE可以避免character類型自動轉化為factor類型。
13、class():查看數據結構:vector、matrix、array、dataframe、list。
14、str():作用用英語來表示是:check classification of viriables,一般用於檢查數據框當中有哪些數據。
15、mode() :查看數據元素類型。
16、typeof() :查看數據元素類型,基本等同於mode(),比mode()更為詳細。
17、example():假設有一個函數foo,example("foo"),函數foo的使用示例。
18、apropos():列出名稱中含有foo的所有可用函數。apropos("foo",mode="function")。
19、data():列出當前已載入包中所含的所有可用示例數據集。
20、ls():列出當前工作空間中的對象。
21、rm():移除(刪除)一個或多個對象。
22、history(#):顯示最近使用過的#個命令(默認值為25)。
23、options():顯示或設置當前選項。有一個收藏文件有介紹options的功能。
24、boxplot():生成盒型圖。
25、sum():計算和。sum(x,na.rm = TRUE)。
26、median():計算中位數。
27、cbind():以列結合變數。cbind(x,y,z)。
28、rbind():以行結合變數。
29、vector():以向量形式結合數據。vector(length = 10)。
30、rep():以矩陣形式結合數據。rep(c(1,,2,3),each = 10)
31、seq():生成一個有序的數列。seq(1,10)。
32、dim():矩陣或者cbind輸出的維數。dim(Mydata)。
33、scan():從ascii文件中讀取數據。scan(file = "test.txt")。
34、write.table():把一個變數寫入到ascii文件。write.table(Z,file = "test.txt")。
35、order():確定數據的順序。order(x)。
36、merge():合並兩個數據框。merge(x,y,by = "ID")。
37、str():顯示一個對象的內部結構。str(Mydata)。
38、factor():定義變數作為因子。factor(x)。
39、tapply():tapply(X = Veg$R,INDEX = Veg$Transect,FUN = mean).tapply函數根據第二個變數(Transect)的不同水平對第一變數(R)進行了求平均值運算。還可以求sd,var,length等操作。R語言初學者指南P75詳細介紹了這個函數。
40、下一頁介紹了sapply和lapply。
41、summary():計算基本信息。
42、table():計算列聯表,統計因子各水平的出現次數(頻數或頻率)。table(x,y)。
43、plot():y對x的圖形。pch形狀,col顏色。
44、par():par(mfrow = c(2,2),mar = c(3,3,2,1))
mfrow生成一個具有4個面板的圖形窗口。mar選項指定每個圖形周圍空白的大小,底部、左側、頂部、右側。
45、paste():將變數連接成字元串。paste("a","b",sep = "")。
46、log(): log = "x",log = "y",log = "xy",生成對數軸。
47、%in%:
a<-c(1,3,13,1443,43,43,4,34,3,4,3)
b<-c(1,13,11,1313,434,1)
a%in%b
# 返回內容#
[1] TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
# 取反操作
!(a%in%b)
48、sort()函數是對向量進行從小到大的排序
rank()函數返回的是對向量中每個數值對應的秩
order()函數返回的值表示位置,依次對應的是向量的最小值、次小值、第三小值……最大值等(位置索引)
arrange()函數(需載入dplyr包)針對數據框,返回基於某列排序後的數據框,方便多重依據排序。
49、subset(): df <- data.frame( a = 1:10, b = 2:11, c = 3:12 )
df <- subset(df, select = c(a,c)) #選取列a和c
df <- subset(df, select = -c(a,c) ) #去除列a和c