1. 大数据培训课程都包含哪些内容
老男孩教育的大数据培训课程内容包括:Java、Linux、内Hadoop、Hive、Avro与Protobuf、ZooKeeper、HBase、Phoenix、Redis、Flume、SSM、Kafka、Scala、Spark、azkaban、Python与大数据容分析等
2. 简述knn是什么 输入 输出 大数据考试
kNN算法的核心思想非常简单:在训练集中选取离输入的数据点最近的k个邻居,专根据这个k个邻居中出现属次数最多的类别(最大表决规则),作为该数据点的类别。
算法描述
训练集T={(x1,y1),(x2,y2),⋯,(xN,yN)}T={(x1,y1),(x2,y2),⋯,(xN,yN)},其类别yi∈{c1,c2,⋯,cK}yi∈{c1,c2,⋯,cK},训练集中样本点数为NN,类别数为KK。输入待预测数据xx,则预测类别
y=argmaxcj∑xi∈Nk(x)I(yi=cj), i=1,2,⋯,N; j=1,2,⋯,K(1)
(1)y=argmaxcj∑xi∈Nk(x)I(yi=cj), i=1,2,⋯,N; j=1,2,⋯,K
其中,涵盖xx的k邻域记作Nk(x)Nk(x),当yi=cjyi=cj时指示函数I=1I=1,否则I=0I=0。