1. 大數據培訓課程都包含哪些內容
老男孩教育的大數據培訓課程內容包括:Java、Linux、內Hadoop、Hive、Avro與Protobuf、ZooKeeper、HBase、Phoenix、Redis、Flume、SSM、Kafka、Scala、Spark、azkaban、Python與大數據容分析等
2. 簡述knn是什麼 輸入 輸出 大數據考試
kNN演算法的核心思想非常簡單:在訓練集中選取離輸入的數據點最近的k個鄰居,專根據這個k個鄰居中出現屬次數最多的類別(最大表決規則),作為該數據點的類別。
演算法描述
訓練集T={(x1,y1),(x2,y2),⋯,(xN,yN)}T={(x1,y1),(x2,y2),⋯,(xN,yN)},其類別yi∈{c1,c2,⋯,cK}yi∈{c1,c2,⋯,cK},訓練集中樣本點數為NN,類別數為KK。輸入待預測數據xx,則預測類別
y=argmaxcj∑xi∈Nk(x)I(yi=cj), i=1,2,⋯,N; j=1,2,⋯,K(1)
(1)y=argmaxcj∑xi∈Nk(x)I(yi=cj), i=1,2,⋯,N; j=1,2,⋯,K
其中,涵蓋xx的k鄰域記作Nk(x)Nk(x),當yi=cjyi=cj時指示函數I=1I=1,否則I=0I=0。