① 请高手帮我看看SAS中两个独立样本t检验结果
先看 Equality of Variances: Test1 中P-value = 0.4659 > >0.05说明两组数据方差不相等的假设失败,也就是说不可以承认方差相等,于是可以用Pooled method处理两组方差;
再看T-Tests中的Pooled method的结果,t-test的p-value = 0.3651, 说明两组数据没有差异的假设不可拒绝。
同理,Test2中证明方差不相等,用satterthwaite method处理方差,得到p-value = 0.3357,同样不能证明方差相异。
综上,两个test都不能证明两组数据的均值有统计学上的显著性差异。
② 跪求用Java语言实现试卷的难度与区分度 信度评估算法的源代码
简单的说,所谓调查问卷的信度是指这个问卷是不是可靠的,这个包含多层含义,比如说这份问卷是不是多次重复做结果都接近等等。
效度是指这个问卷是不是考察出了你想要考察的结果,一般这个会和一个校标做校标关联系数。
信度一般用阿尔法系数做检验
效度一般用T检验,显著性差异指数P检验。
一般应该先用小样本做信度和效度,但是做效度的样本也不应该低于60人。然后再做推广。
还有你这种量表是否应该在做效度时用校标关联系数呢,但这又需要你有新的校标。
因为不太了解具体情况,所以先这么说,在做的时候你要遇到什么问题,你在问我哈。还有建议关于怎么做信度和效度,你还是看一下相关书籍。我觉得这还是很有必要的。
一、信度系数与信度指数
大部分情况下,信度是以信度系数为指标,它是一种相关系数。常常是同一被试样本所得到的两组资料的相关,理论上说就是真分数方差与实得分数方差的比值,公式为:
r(xx)=r^2(xt)=S^2(t)/S^2(x)
公式中r^2(xt)是真分数标准差与实得分数标准差的比值,称作信度系数,公式为:
r(xt)=S(t)/S(x)
可见信度指数的平方就是信度系数。
二、测量标准误
信度系数仅表示一组测量的实得分数与真分数的符合程度,但并没有直接指出个人测验分数的变异量。我们可以用一组被试两次测量结果来代替对同一个人的反复施测,于是有了信度的另一个指标,公式为:
SE=S(x)√1-r(xx)
公式中SE为测量的标准误,S(x)是所得分数的标准差,r(xx)为测验的信度系数,从公式我们可以看出测量的标准误与信度之间有互为消长的关系:信度越高,标准误越小,信度越低,标准误越大。
p value 和t value 我在网络上没看到,你自己再找找吧
③ 大数据技术包括哪些
大数据技术包括数据收集、数据存取、基础架构、数据处理、统计分析、数据挖掘、模型预测、结果呈现。
1、数据收集:在大数据的生命周期中,数据采集处于第一个环节。根据MapRece产生数据的应用系统分类,大数据的采集主要有4种来源:管理信息系统、Web信息系统、物理信息系统、科学实验系统。
2、数据存取:大数据的存去采用不同的技术路线,大致可以分为3类。第1类主要面对的是大规模的结构化数据。第2类主要面对的是半结构化和非结构化数据。第3类面对的是结构化和非结构化混合的大数据,
3、基础架构:云存储、分布式文件存储等。
4、数据处理:对于采集到的不同的数据集,可能存在不同的结构和模式,如文件、XML 树、关系表等,表现为数据的异构性。对多个异构的数据集,需要做进一步集成处理或整合处理,将来自不同数据集的数据收集、整理、清洗、转换后,生成到一个新的数据集,为后续查询和分析处理提供统一的数据视图。
5、统计分析:假设检验、显著性检验、差异分析、相关分析、T检验、方差分析、卡方分析、偏相关分析、距离分析、回归分析、简单回归分析、多元回归分析、逐步回归、回归预测与残差分析、岭回归、logistic回归分析、曲线估计、因子分析、聚类分析、主成分分析、因子分析、快速聚类法与聚类法、判别分析、对应分析、多元对应分析(最优尺度分析)、bootstrap技术等等。
6、数据挖掘:目前,还需要改进已有数据挖掘和机器学习技术;开发数据网络挖掘、特异群组挖掘、图挖掘等新型数据挖掘技术;突破基于对象的数据连接、相似性连接等大数据融合技术;突破用户兴趣分析、网络行为分析、情感语义分析等面向领域的大数据挖掘技术。
7、模型预测:预测模型、机器学习、建模仿真。
8、结果呈现:云计算、标签云、关系图等。
④ 大数据培训课程大纲要学什么课程
课纲不一样,看是大数据开发还是大数据分析了,我学的大数据分析可视化,学的版主要权有Python入门、sql、oracle、tableau、帆软、Informatica、Excel等等
我刚出来半年,视频录播可能还不算落后,有视频可***