导航:首页 > 网络数据 > 加拿大数据挖掘学校

加拿大数据挖掘学校

发布时间:2023-02-04 05:27:14

『壹』 哪些技术可能在未来的教育中得到应用

中国论文网 http://www.xzbu.com/8/view-4759172.htm
关键词:学习分析;学习分析技术;数据挖掘
中图分类号:G434文献标识码:文章编号文章编号:1672-7800(2013)012-0191-02
作者简介:乔金瑶(1990-),女,东北师范大学硕士研究生,研究方向为现代远程教育、计算机在教学中的应用;王红(1988-),女,东北师范大学硕士研究生,研究方向为现代远程教育、计算机在教学中的应用。
0引言
自从“学习分析”这一理念被提出后,在教育界里就引起了很大反响。美国新媒体联盟与美国高校教育信息化协会合作的“地平线项目”在2010和2011两年的年度报告中均预测学习分析技术将在未来的四到五年内成为主流[1]。英国开放大学知识媒体研究所 2011 和 2012 年连续推出了《社会学习分析报告 》(Social Learning Analytics)和《学习分析现状报告》(The State of Learning Analytics in 2012: A Review and Future Challenges)[2]。2011 年,以加拿大阿塞巴斯卡大学的G.Siemens教授为主要召集人的学习分析学会(The Society for Learning Analytics, SoLAR)在第一届学习与知识分析大会中将学习分析定义为:测量、收集、分析、报告学习者及其学习情境的相关数据,以促进对学习过程的理解,并对学习及其发生的环境进行优化[3]。著名的《地平线报告》在 2012 版中将学习分析定义为:通过收集来自学生的大量数据进行分析,从而对其学术表现进行评价和预测,并发现潜在的问题[4]。通过以上有关定义可以看出,学习分析是利用学习分析技术,对学习者学习活动的有关数据进行分析和建模,对学习者的学习结果进行评估,发现学习者学习中潜在的问题,并对学习者行为进行预测。
1学习分析技术在国内外高校中的应用
国外学科中,搜集的大量数据越来越成为重要的教育教学资源。这样的数据可以提供可视化或者非可视化的相关指标。研究人员通过对这些指标的分析,可以发现学习者的学习状况,以此作为基础为使用者提供建议项目。
澳大利亚卧龙岗大学(University of Wollongong)的研究人员则运用“社会网络适应性教学实践”应用软件——SNAPP(Social Networks Adapting Pedagogical Practice)进行数据分析。这种软件可以帮助用户直观了解学习者在论坛的发帖和回复情况,通过直观跟踪论坛交流内容,教师可以快速判断用户的行为模式,覆盖课程进度的任何阶段。通过分析发帖者、回复对象、讨论话题以及话题范围,SNAPP可以对数据加以分析并以社会网络图的形式呈现分析结果,进而对学业面临风险的学习者进行识别。
美国普渡大学的信号灯系统在提高学生学业成绩方面也有很大帮助。这种信号灯系统运用了预测模型与“黑板视野(Blackboard Vista)”软件共同提供的数据,对学习者的学业进展情况进行实时分析,当学习者的学业成绩处于边缘风险状况时,信号灯系统就会发挥其功能,指导学习者相应地提高课程学习。由于这种系统实时反馈性很强,所以对教师和学习者帮助很大。
通过运用学习分析技术来提高学习者成绩的学校还有很多。像德雷塞尔大学(Drexel University)收集数据的方法是采用在线教学管理系统的“视野之星报告(Vista Star Report)”,进而对学习者的在线学习时间、登录次数、下载量等相关数据进行收集评估。北卡罗来纳州立大学(North Carolina State University)也是运用学习分析技术对学校已有的学生信息以及针对学习者进行问卷调查等形式获得的数据进行统计分析后,预测学习者在第一学期的学习成绩。
在我国值得一提的是由浙江温岭市中学信息技术教师开发的一款信息技术教学辅助平台——ITtools3.0。这一教学辅助平台从2005年起着手研发,期间经历了几个版本,直到2011年5月才初步完成,目前还在不断改进和完善。这一信息技术教学辅助平台目前已经被我国多所学校使用,如大连海湾高中、浙江省湖州五中、浙江省海盐第二高级中学、广州宜州一中以及浙江省义乌市实验小学等。针对现在机房对机器的特殊保护,不允许学生对计算机进行改写,所以,每当学生对计算机进行相关学习任务的操作后,再重新启动计算机,以前的学习记录就会消失,信息技术教学辅助平台的展示模块解决了这一令人无奈的问题。该模块可以对教师和学生的所有操作进行记录,其强大的查询和展示功能对于学生来说,不仅可以随时查阅自己的学习成果,对其他同学发布的学习作品也可进行查询,大大提高了学生自主学习的能力;对于教师来说,通过这一平台对记录的数据进行分析,教师针对分析结果,可以即时调整自己的教学方式和方法,从而提高教学效果。
2学习分析技术的未来发展前景
2.1向教师、学生及课程管理人员及时反馈
相关系统在搜集大量的数据后利用学习分析技术进行分析,将分析结果及时反馈给教师、学生及课程管理人员尤为必要。利用学习分析技术及其相关分析工具,教师可获得有关学生的学习绩效、学习过程以及学习环境的信息。这些信息可以为教师改进教学提供依据[5]。不仅使教师能够及时调整自己的教学策略,优化自己的教育教学过程,而且使学生能够及时发现自己的不良学习行为,提高学习质量。通过对学习者活动数据的统计,课程管理人员可以及时修订课程,发现哪些学习资源是学习者经常关注的,哪些学习资源是学习者根本不关心的,对于学习者比较感兴趣的学习资源加以丰富,对于学习者不感兴趣的资源进行删除,以此来优化网络空间。 2.2推荐相关学习资源
有关学习的推荐系统近年来获得了越来越多的关注,这些系统分析了学习者的数据,通过统计学习者有关下载、标注、观看、阅读等行为频次,研究人员在比较分析后将学习者进行分类,最后将学习者分等级来获得课程,并为学习者推荐合适的学习资源,例如推荐学习者选择初级、中级还是高级课程。通过这一系统可以使学习者在有限的时间内提高自身的学习效率,另外还可以提高学习者的学习兴趣。
2.3优化社会学习环境
在技术提高学习这一环境下,学习者彼此之间的交互是如何学习的一个核心部分。在计算机支持的协作学习中,许多研究已经集中到了对网络学习者的分析上。相关的学习分析技术通过对聊天工具、论坛,或者电子邮件客户端中被捕获的数据进行分析,不但会对学习者进行预测而且还会建议有关的小组学习活动。例如,某些学习者在某些学习系统中注册了个人账户,如果所填的个人信息某些方面表示对天文知识感兴趣,课程推荐系统会建议学习者参加天文学习小组。学习者在这个小组中通过彼此之间的信息交流、资源共享等,不仅可以吸引到更多有相同爱好的学习者,而且对提高自身研究领域的学术水平也有很大帮助。
3结语
目前,虽然对教育数据进行搜集和分析会对教育教学产生深远的影响,但是为了使在这一领域的研究者能够共享和重复使用有效的教育数据,还面临很多挑战。
3.1确定搜集数据格式标准
在数据收集中由于对交互数据缺少统一的陈述标准,从而在系统中阻止了有关数据的共享和重复使用。另外,如果学习者的一个自定义的数据信息格式没有被记录,当其他人使用这一数据时就很难理解被存储数据信息的意义,想要对这些数据进行重复使用则很难。
3.2明确使用数据合法性
这是有关隐私权和教育数据收集许可的问题。虽然研究者在学习环境中会获得大量的数据,但是使用数据的权利等相关问题需要从两个视角来解决:一方面,从使用者的角度来说,学习者需要被告知在课程学习活动中要搜集相关数据,并且需要得到学习者本人的准许才能搜集他们的个人信息;另一方面,这些数据的组织或提供者也需要同意搜集和共享这些数据。为了避免研究者花费大量的人力、物力、财力通过某些方式搜集到相关的数据后才发现这些数据不可被使用的现象发生,让数据能够合法进行搜集,我国相关法律法规的完善刻不容缓。
3.3提高数据搜集相关技术
在学习分析探索性研究中,数据追踪为学习管理提供了一个良好的基础。学习者除了使用学习管理系统外,还经常使用各种各样的工具和相关的学习服务,所以提高相关技术来获得更多的数据非常必要,比如,可以在相关学习系统中安装开发的小插件,以此来搜集有关数据。
参考文献参考文献:
[1]The Horizon Report 2011 edition[DB/OL].http://wp.nmc.org/,2012.
[2]BUCKINGHAM SHUM S,FERGUSON R.Social learning analytics[DB/OL].http://kmi.open.ac.uk/publications/pdf/kmi-11-01.pdf, 2012.
[3]Society for learning analytics research[DB/OL].https://tekri.athabascau.ca/analytics, 2012.
[4]JOHNSON L,ADAMS S,CUMMINS M.The NMC horizon report:2012 Higher Ecation Edition [DB/OL].http://www.nmc.org/publications/horizon-report-2012-higher-ed-edition,2012.
[5]顾小清,黄景碧.让数据说话:决策支持系统在教育中的应用[J].开放教育研究,2010(10):99-105.

『贰』 数据挖掘提出的背景

数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
知识发现过程由以下三个阶段组成:(1)数据准备,(2)数据挖掘,(3)结果表达和解释。数据挖掘可以与用户或知识库交互。
数据挖掘
数据挖掘
数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。
数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析,等等。
并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索(information retrieval)领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。
起源
需要是发明之母。近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。
数据挖掘利用了来自如下一些领域的思想:(1) 来自统计学的抽样、估计和假设检验,(2)人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想,这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。一些其他领域也起到重要的支撑作用。特别地,需要数据库系统提供有效的存储、索引和查询处理支持。源于高性能(并行)计算的技术在处理海量数据集方面常常是重要的。分布式技术也能帮助处理海量数据,并且当数据不能集中到一起处理时更是至关重要。
发展阶段
第一阶段:电子邮件阶段
这个阶段可以认为是从70年代开始,平均的通讯量以每年几倍的速度增长。
第二阶段:信息发布阶段
从1995年起,以Web技术为代表的信息发布系统,爆炸式地成长起来,成为目前Internet的主要应用。中小企业如何把握好从“粗放型”到“精准型”营销时代的电子商务。
第三阶段: EC(Electronic Commerce),即电子商务阶段
EC在美国也才刚刚开始,之所以把EC列为一个划时代的东西,是因为Internet的最终主要商业用途,就是电子商务。同时反过来也可以说,若干年后的商业信息,主要是通过Internet传递。Internet即将成为我们这个商业信息社会的神经系统。1997年底在加拿大温哥华举行的第五次亚太经合组织非正式首脑会议(APEC)上美国总统克林顿提出敦促各国共同促进电子商务发展的议案,其引起了全球首脑的关注,IBM、HP和Sun等国际著名的信息技术厂商已经宣布1998年为电子商务年。
第四阶段:全程电子商务阶段
随着SaaS(Software as a service)软件服务模式的出现,软件纷纷登陆互联网[5],延长了电子商务链条,形成了当下最新的“全程电子商务”概念模式。

『叁』 数据挖掘中的数据预处理技术有哪些,它们分别适用于哪些场合

一、数据挖掘工具分类数据挖掘工具根据其适用的范围分为两类:专用挖掘工具和通用挖掘工具。专用数据挖掘工具是针对某个特定领域的问题提供解决方案,在涉及算法的时候充分考虑了数据、需求的特殊性,并作了优化。对任何领域,都可以开发特定的数据挖掘工具。例如,IBM公司的AdvancedScout系统针对NBA的数据,帮助教练优化战术组合。特定领域的数据挖掘工具针对性比较强,只能用于一种应用;也正因为针对性强,往往采用特殊的算法,可以处理特殊的数据,实现特殊的目的,发现的知识可靠度也比较高。通用数据挖掘工具不区分具体数据的含义,采用通用的挖掘算法,处理常见的数据类型。通用的数据挖掘工具不区分具体数据的含义,采用通用的挖掘算法,处理常见的数据类型。例如,IBM公司Almaden研究中心开发的QUEST系统,SGI公司开发的MineSet系统,加拿大SimonFraser大学开发的DBMiner系统。通用的数据挖掘工具可以做多种模式的挖掘,挖掘什么、用什么来挖掘都由用户根据自己的应用来选择。二、数据挖掘工具选择需要考虑的问题数据挖掘是一个过程,只有将数据挖掘工具提供的技术和实施经验与企业的业务逻辑和需求紧密结合,并在实施的过程中不断的磨合,才能取得成功,因此我们在选择数据挖掘工具的时候,要全面考虑多方面的因素,主要包括以下几点:(1)可产生的模式种类的数量:分类,聚类,关联等(2)解决复杂问题的能力(3)操作性能(4)数据存取能力(5)和其他产品的接口三、数据挖掘工具介绍:1.QUESTQUEST是IBM公司Almaden研究中心开发的一个多任务数据挖掘系统,目的是为新一代决策支持系统的应用开发提供高效的数据开采基本构件。系统具有如下特点:提供了专门在大型数据库上进行各种开采的功能:关联规则发现、序列模式发现、时间序列聚类、决策树分类、递增式主动开采等。各种开采算法具有近似线性计算复杂度,可适用于任意大小的数据库。算法具有找全性,即能将所有满足指定类型的模式全部寻找出来。为各种发现功能设计了相应的并行算法。2.MineSetMineSet是由SGI公司和美国Standford大学联合开发的多任务数据挖掘系统。MineSet集成多种数据挖掘算法和可视化工具,帮助用户直观地、实时地发掘、理解大量数据背后的知识。MineSet有如下特点:MineSet以先进的可视化显示方法闻名于世。支持多种关系数据库。可以直接从Oracle、Informix、Sybase的表读取数据,也可以通过SQL命令执行查询。多种数据转换功能。在进行挖掘前,MineSet可以去除不必要的数据项,统计、集合、分组数据,转换数据类型,构造表达式由已有数据项生成新的数据项,对数据采样等。操作简单、支持国际字符、可以直接发布到Web。3.DBMinerDBMiner是加拿大SimonFraser大学开发的一个多任务数据挖掘系统,它的前身是DBLearn。该系统设计的目的是把关系数据库和数据开采集成在一起,以面向属性的多级概念为基础发现各种知识。DBMiner系统具有如下特色:能完成多种知识的发现:泛化规则、特性规则、关联规则、分类规则、演化知识、偏离知识等。综合了多种数据开采技术:面向属性的归纳、统计分析、逐级深化发现多级规则、元规则引导发现等方法。提出了一种交互式的类SQL语言——数据开采查询语言DMQL。能与关系数据库平滑集成。实现了基于客户/服务器体系结构的Unix和PC(Windows/NT)版本的系统。4.IntelligentMiner由美国IBM公司开发的数据挖掘软件IntelligentMiner是一种分别面向数据库和文本信息进行数据挖掘的软件系列,它包括IntelligentMinerforData和IntelligentMinerforText。IntelligentMinerforData可以挖掘包含在数据库、数据仓库和数据中心中的隐含信息,帮助用户利用传统数据库或普通文件中的结构化数据进行数据挖掘。它已经成功应用于市场分析、诈骗行为监测及客户联系管理等;IntelligentMinerforText允许企业从文本信息进行数据挖掘,文本数据源可以是文本文件、Web页面、电子邮件、LotusNotes数据库等等。5.SASEnterpriseMiner这是一种在我国的企业中得到采用的数据挖掘工具,比较典型的包括上海宝钢配矿系统应用和铁路部门在春运客运研究中的应用。SASEnterpriseMiner是一种通用的数据挖掘工具,按照"抽样--探索--转换--建模--评估"的方法进行数据挖掘。可以与SAS数据仓库和OLAP集成,实现从提出数据、抓住数据到得到解答的"端到端"知识发现。6.SPSSClementineSPSSClementine是一个开放式数据挖掘工具,曾两次获得英国政府SMART创新奖,它不但支持整个数据挖掘流程,从数据获取、转化、建模、评估到最终部署的全部过程,还支持数据挖掘的行业标准--CRISP-DM。Clementine的可视化数据挖掘使得"思路"分析成为可能,即将集中精力在要解决的问题本身,而不是局限于完成一些技术性工作(比如编写代码)。提供了多种图形化技术,有助理解数据间的关键性联系,指导用户以最便捷的途径找到问题的最终解决法。7.数据库厂商集成的挖掘工具SQLServer2000包含由Microsoft研究院开发的两种数据挖掘算法:Microsoft决策树和Microsoft聚集。此外,SQLServer2000中的数据挖掘支持由第三方开发的算法。Microsoft决策树算法:该算法基于分类。算法建立一个决策树,用于按照事实数据表中的一些列来预测其他列的值。该算法可以用于判断最倾向于单击特定标题(banner)或从某电子商务网站购买特定商品的个人。Microsoft聚集算法:该算法将记录组合到可以表示类似的、可预测的特征的聚集中。通常这些特征可能是隐含或非直观的。例如,聚集算法可以用于将潜在汽车买主分组,并创建对应于每个汽车购买群体的营销活动。,SQLServer2005在数据挖掘方面提供了更为丰富的模型、工具以及扩展空间。包括:可视化的数据挖掘工具与导航、8种数据挖掘算法集成、DMX、XML/A、第三方算法嵌入支持等等。OracleDataMining(ODM)是Oracle数据库10g企业版的一个选件,它使公司能够从最大的数据库中高效地提取信息并创建集成的商务智能应用程序。数据分析人员能够发现那些隐藏在数据中的模式和内涵。应用程序开发人员能够在整个机构范围内快速自动提取和分发新的商务智能—预测、模式和发现。ODM针对以下数据挖掘问题为Oracle数据库10g提供支持:分类、预测、回归、聚类、关联、属性重要性、特性提取以及序列相似性搜索与分析(BLAST)。所有的建模、评分和元数据管理操作都是通过OracleDataMining客户端以及PL/SQL或基于Java的API来访问的,并且完全在关系数据库内部进行。IBMIntelligentMiner通过其世界领先的独有技术,例如典型数据集自动生成、关联发现、序列规律发现、概念性分类和可视化呈现,它可以自动实现数据选择、数据转换、数据发掘和结果呈现这一整套数据发掘操作。若有必要,对结果数据集还可以重复这一过程,直至得到满意结果为止。现在,IBM的IntelligentMiner已形成系列,它帮助用户从企业数据资产中识别和提炼有价值的信息。它包括分析软件工具----IntelligentMinerforData和IBMIntelligentMinerforText,帮助企业选取以前未知的、有效的、可行的业务知识----如客户购买行为,隐藏的关系和新的趋势,数据来源可以是大型数据库和企业内部或Internet上的文本数据源。然后公司可以应用这些信息进行更好、更准确的决策,获得竞争优势。

『肆』 数据挖掘哪家强求考研学校推荐,快来,各位学长

我本科学的是电子商务,专业课还可以,就是学校不是特别好。想考研换个学校数据仓库与数据挖掘方向,全国最好的就是复旦大学和中国人民大学了.清华北大在

『伍』 如何通过抓取教育大数据来深化课堂教学改革

现代信息技术的发展为大数据的收集和分析提供了无限的可能,大数据时代的这一趋势也对教育产生了巨大的影响:一方面,在科技理性的指导下,通过多维度收集学生行为的数据并进行模型建构,可以对学生的学习行为进行预测;另一方面,大数据时代的人文主义转向使人们更关注教学活动的适应性,教育大数据的挖掘和利用可以更好地实现适应个人需求的定制化教学。

国际数据公司(IDC)认为大数据时代数据有4大特点——数据的规模大、价值大、数据流转速度快以及数据类型多。大数据的挖掘和利用对教育——特别是课堂教学——产生着深远的影响。学习科学家索耶认为:越来越多的学习将经过计算机中介发生, 并产生越来越多的数据,我们有必要运用这些数据分析什麼时候有效的学习正在发生。所以数据挖掘可以用於探究行为与学习之间的关系,如学习者的个体差异与学习行为之间有何关系,不同行为又会导致何种不同的学习结果等。2012年美国发布《通过教育数据挖掘和学习分析促进教与学》(Enhancing Teaching and Learning through Ecational Data Miningand Learning Analytics)提出大数据时代教育数据的特点:具有层级性、时序性和情境性,其中数据的层级性指,既收集教师层面的数据也收集学生层面的数据,既收集课堂数据也收集活动数据,为後期模型的建立提供了多维度的资源;数据的时序性是指,数据是实时的、连续的,为材料的前沿性提供了保障;而数据的情境性是指,数据是基於真实情境脉的,保证了模型的信度。

大数据技术能够促进以学生为本的学习,数据不仅仅是科技理性指导下收集数据和拟合成模型,并针对学生的群体行为做出预测判断,还可能在固有模型的基础上,通过诊断学生在课堂中的行为表现,对固有模型进行修改,使课程内容更加适合学生的长尾需求,实现个性化教学。大数据的利用可以支持对教育活动行为的建模预测,还可能支持教育实践中的适应性教学。前者是後者的基础,後者是前者的深化。

建模与预测导向的大数据应用

大数据时代数据促进教育变革的方法之一是收集和分析处理数据,并进行预测。现如今,由於数据记录、存储与运算的便捷性,海量的、多层次的数据可以便捷地加以收集,由随机抽样带来的误差因此减小,建模和预测可以基於全数据和真实数据,因而就更为精确。大数据时代通过探求海量数据的相关关系获得盈利的最成功的案例是亚马逊的市场营销,亚马逊收集读者网上查阅行为和购买行为数据,建立读者偏爱阅读模型,预测读者购买的群体行为,实现书籍的推荐。近几年,教育研究的对象逐渐关注学生的学习行为,其背後是一种学习观的转变,学习被视为一种识知的过程(knowing about),识知是一个活动,而不是将知识作为一个物品加以传递。识知总是境脉化的,而不是抽象的和脱离於具体情境的。识知是在个体与环境的互动中交互建构的,而不是客观准确的,也不是主观创造的。所以,学生的行为活动数据被认为是可以反映学生在学习过程这一情境化的动态变化进程中的情况。海量、多层次、连续的行为数据在收集後被拟合成模型,实现预测,如学习管理系统(LMS)的运用。然而,由於建模和预测依赖的基本原理为数理统计,其预判对象主要是学生的群体行为。

1.案例分析

学习管理系统(Learning Manage System)简称LMS,是基於网络的管理系统平台,用於监控学生学习活动行为,识别和预测学困生(student at-risk),并为其提供相应的帮助。大多数LMS包括5个部分:有和课程相关的学习资料、用於确保学生提交作业与完成测试的评价工具、用於沟通的交流工具(如邮件、聊天室等)、用於确保教师记录和存储学生的学习活动并发布活动截止日期的课程管理工具、用於帮助学生学习回顾和跟踪学习进程的学习管理工具。在高校大量使用的BB(Blackboard)平台就是一个常见的学习管理系统。系统记录了学生参与选修的网上课程的种类、在线时长、阅读和浏览的文章数量,反映学习者的学习行为。2008年,Leah P.Macfadyen和Shane Dawson教授在加拿大不列颠哥伦比亚大学通过分析5个本科班级使用BB平台选修生物课的数据,建立了预测模型。平台记录了学生课程材料的使用情况、参与学业交流情况和完成作业提交和考试情况。大数据时代教育数据记录的层级性在这裏充分显现,课程材料的使用包括记录在线时长、邮件的阅读时间、邮件的发送时间、讨论信息的阅读时间等。参与学业交流记录了发布新讨论的时间、回复讨论的时间、使用搜索工具所花的时间、访问个人信息的时间、文件的浏览时间、浏览谁同时在线的时间、浏览网页连结的时间等等。评价模块记录了评价的阅读时长和提交评价的时间等。通过应用统计工具描述散点图,发现了在LMS记录下学生在线时长和学业表现呈相关关系。在进行多元回归时,研究者发现,学业成就处在後四分之一的学生在线时间略长於平均时间,而学业成就处於前四分之一的学生的在线学习时间低於平均水平。紧接着,研究人员为了作出预测,利用逻辑斯特回归生成了一个预测模型,通过收集学生的新的行为数据,预测学生是否处於真正参与了学习活动,并得出如下结论:讨论举行的次数、邮件信息发送量和测评的完成情况这三个维度构成的模型可以预测学生的学业水平情况。

大数据时代,通过探求学生行为与学业水平之间的相关关系,建立模型,实现预测,能够对课堂教学产生重要影响。然而,数据建模过程中,为了保证模型的效度与信度,极端个别数据被处理,使模型只能实现群体行为的预测,不能针对学习者个体实现定制化和个性化。

2.建模与预测的不足

数据建模与预测的背後充分体现了实证主义的思想和方法。19世纪上半叶,以孔德为代表的社会学家提出了实证主义的基本信条:利用观察、分类,探求彼此的关系,得到科学定律。实证主义的哲学思潮到20世纪60年代,演变成一种科技理性,实践知识逐渐染上了工具性的色彩,专业活动存在於工具性的解决问题之中,所有的专业活动都被视为厘定目标、套用已知的方法解决问题的过程。这一期间,大量的学科被系统地整合发展,甚至包括教育学和社会学这样的「软科学」。用证据解决未知的问题,用数据预测未来一时成为潮流。

学生活动行为数据的建模尤其侧重体验实证主义的思想,模型注重成功教学行为的共性,忽视教师与学生群体的独特性需求时,科技理性的主导有可能使课堂教学被视为独立於真实境脉的模块,只要教学行为取得成功,就会被数据抽象化,形成模型,对学生群体行为产生预测。科技理性有赖於人们认同的共有目标,教学实践目标的厘定极其复杂,包含巨大的不确定性和独特性,甚至,由於社会角色的不同,还会带来价值冲突。一个稳定的、为所有人所认同的目标不复存在,依据科技理性精神和方法推理预测的行为模式并不可能满足每一个人的需求,教育变革在大数据时代下出现新的取向。

从数据模型到支持适应性学习

在数据建模的基础上实现教学的适应性是大数据时代促进教育变革的另一成果。数据建模及行为预测依旧属於科技理性指导下的行为模式,可能会造成忽视学生个性需求的现象,而个性化需求正是知识社会的重要特徵,个性化的教育也受到教育研究者、政策制定者和教育实践者越来越多的关注。教育系统设计专家赖格卢斯认为,教育投入没有达到效果的一个很重要的原因是忽视了社会的转型。「社会已经从工业社会步入了资讯时代,劳动力市场对人才的要求不再是工业时代在流水线上操作的工人,而是具有创新性思维、决断力强的知识性人才。」教学面临从产生清一色的劳工转向产生有判断力和适应性能力的人群。2010年,OECD的报告《The Nature Of Learning》中指出,适应性能力(adaptive competence)是21世纪核心竞争力,包括在真实的境脉中灵活并有创造力地使用有意义的知识和技能。吴刚在《大数据时代的个性化教育:策略与实践》中提出了个性化教育的必要性和必然性,指出「只有利用信息技术所提供的强大支持,才有可能真正实现个性化学习」。大数据时代的来临,正是个性化教育发展的一个良好契机。2012年,美国颁布了《通过教育数据挖掘和学习分析促进教与学》,提出大数据时代,通过收集在线学习数据,对数据进行分类和探寻数据之间关联的方式挖掘数据,形成数据模型。通过学生行为和模型的互动,形成适应性学习系统。概言之,我们可以以对行为数据的充分利用为基础,改变教学的内容和进度,构建适应性评价和教学系统,充分实现教育的定制化,满足学生的长尾需求。

1.案例分析:
适应性教学系统又称适应性学习系统,(Adaptive Learning Support System),简称ALSS系统,强调基於资源的主动学习,认为学习不是知识的传递,而是学习者的自我建构。自上世纪90年代以来,研究者开发了不少适应性学习系统,如1998年De Bra开发的AHA系统,2003年,Brandsford和Smith开发的针对任务型学习的MLtutor系统,以及近几年颇受关注的翻转课堂(Flipped Classroom Model)简称FCM系统。

学习者学习相关学科内容时,学习行为被记录跟踪下来,学生的学习行为数据被传送到後台,记录在学习者数据库内,作用於预测模块。预测模块通过改变内容传递模块,再次作用於学习者。在整个过程中,教师、教学管理者起干涉作用。

适应性学习系统是一个交互的动态系统,系统往往会提供给学生一些学习行为建议。奥地利针对学生的问题解决的过程设计了一个适应性学习系统。适应性学习系统的第一步是教育数据挖掘(ecational data mining),简称EDM。数据挖掘的过程包括数据收集、数据预处理、应用数据的挖掘和诠释评价发展结果。Moodle提出了CMS数据挖掘系统(Course Management System)。研究者先使用原始数据进行建模,第一步是原始数据的收集,原始数据大约包含2007年73名用户产生的28000活动例子,2008年97名用户产生的265000份解决问题的案例和2009年45名用户产生的115000个活动案例。除了记录学生解答问题时产生的数据,原始数据还收集了学生的信息、问题的信息和解决问题的步骤;在对数据进行分类後,归纳出问题解决的类型,利用很擅长拟合连续数据的Markvo Models(MMs)的一个子模型DMMs拟合了如上的连续性数据,通过添加判断学生学习行为的结果模型和一系列监控和调节模块,构成了整个面向问题解决的适应性系统。当学生使用这个模型时,模型会根据学生的行为数据为学生提供他们所偏爱的解决问题的过程与方法。

除了适应性教学系统,还有适应性评测系统。LON-CAPA(Learning Online Network with Computer-Assisted Personalized Approach)是一个计算机辅助的个性化网络学习测评平台,平台不提供课程设计和课程目标,而是一个教学工具。CAPA通过後台记录学生的基本资料,学生参与的互动交流、学业情况,针对学业课程中的疑难点,提供个性化的考试资源。

2.适应性转向的意义

在大数据时代,科技理性指导下的模型预判在面对结构不良的问题时显得应对能力不足。科技理性指导下的数据建模忽视学习的真实境脉,只能支持群体行为的预判,模型的推广可能会使人们忽视其实践成功背後的个体经验与具体情境,从而导致科技理性与哲学思辨对抗。然而,完全依靠哲学思辨和经验进行教学不仅不利於教育学科系统理论性的发展,也不利於课堂实践的管理与教师的培训。唐纳德·A.舍恩提出了一种适应性思维模式。他指出:「如果科技理性的模式在面对『多样』的情境时,是无法胜任、不完整的,甚至更遭的话,那麼,让我们重新寻找替代的、较符合实践的、富有艺术性及直觉性的实践认识。」适应性学习是在系统理论知识的指导下,针对个体差异,使学习内容和活动高度个性化的学习方式。

适应性平衡了理性与经验的两难,英国学者Hargreaves(1996)首次提出基於证据的教育研究向医疗诊断学靠拢。临床诊断学和教育的相似之处在於,他们都要面对变动不居、极其复杂的环境,在这样一个结构不良的系统中,充分意识到客体(患者或者学生)的独特性与共性,利用系统的专业知识解决问题。

Ralf St. Clair教授在参考医学临床实践研究的三要素後提出基於证据的教育研究的三要素——研究的证据、教育工作者的经验、学习者的环境与特点。其中,行为预测关注的是研究的证据,而适应性学习系统的建设则关注的是教育工作者的经验和学习者的环境与特点。

从预测行为到支持适应性教学的转向,是一种人文主义的转向,教育研究的重点从关注研究的证据走向关注教育工作者的经验与学习环境特点,关注以证据支持个性化学习的实践变革。证据不再是其在科技理性时代所处的指导决策的角色,而是被视作一种资源,教育工作者在大量的基於证据的课堂教学决策中找寻最适合自己特点和学生特点的方式,推进课堂教学流程。也就是说,大数据的更重要价值在於支持适应性学习,满足个性化学习和个性化发展的时代需要。数据的预测功能依赖於大数据收集数据的全面性与处理数据的便捷性,根据统计学原理对群体行为做出预测,一定程度上弱化了个体特徵和具体情境。其主要指向行为预判。而适应性是在模型与客体的交互作用上改变模型,如图3所示,数据的适应性运转模型比预测模型多了一个循环(loop until)系统,使其更加契合个人需求,其主要指向实践改进。预测是支持个性化学习的基础,而支持个性化学习是预测功能的深化和转化——从整体人群到个体学习者、从理论模型到实践策略的转化。

分析与启示

大数据时代由於数据量大,数据收集与携带便捷,使海量学生行为数据被挖掘、收集,通过数据建模对学习者行为的分析变得比前大数据时代更为全面和可靠。数据时代在数据的挖掘和预测上固然潜力十足,但是大数据时代更多的价值是满足学习者的适应性长尾需求,在预测行为的基础上,修改教学模式,使之个性化与定制化。从数据建模走向支持适应性教学,支持对象从群体转向了个人,对教育活动的影响从对行为的认识转向了教育活动的实践,从科技理性指导下的去境脉转向了基於真实情境的教学活动。

走向适应性,不仅改变人类行为方式,更重要的是改变了认知方式。前大数据时代人们在科技理性的指导下完全被数据证据左右(driven by the data),教师和学生、教育决策者和学校形成传统社会契约关系,当事人把自己百分之百地交给专业工作人员,而专业工作人员遵守契约,对当事人全心全意地负责,从而使专业工作人员享受至高无上的垄断性地位。大数据时代,教师不再是知识的控制者,他通过参与学生的学习活动,根据学生的先拥知识和认知特点、个性需求,不断地调整教学步骤、教学进度和难度。学生不用完全将自己有如病人交付给医生一般完全托付给教师。在学习的过程中,通过与教师的互动交流,在教师的协助下,成为自己学习的主体,控制并对自己的学习负责。由於教师精力有限,大数据时代下网络计算机辅助学习系统可以为教师和学生提供辅助指导的机会。

尽管如此,一方面,我们要拥抱大数据给我们带来的便捷的生活和高质量的教育,另一方面,我们需要保持警惕和防止因果关系和相关关系的误用,并且维护数据安全。

在推理方面,教育工作者需要警惕将相关关系和因果关系误用,以Leah P.Macfadyen教授的前述案例为例,BB平台在线时间的长短和学生的学业成就有相关关系,而非因果关系,成绩优异的学生在线时间低於平均在线时间,但不能说低於平均在线时间的学习导致学生成绩优异而要求学生减少在线学习时间。

此外,在信息安全方面,学生和教师的大量信息被收集和使用,在使用的过程中,必须制定相关私隐保护法,保证信息的安全,警惕数据滥用。学生的行为数据也不可以作为教师教学评优的依据,让大数据真正成为支持教学变革、提升教学效能、促进学生发展的手段,而不是控制教师和学生的工具。

『陆』 数据挖掘证书有哪些,尤其是加拿大比较认可的

获取IBM SPSS分析软件产品认证

现在,通过获取分析支持产品证书,您可以证明自己已经掌握了专业知识,并进而推动自己的职业生涯发展。您可以选择获取面向统计分析领域的IBM SPSS统计认证或者面向数据采集领域的IBM SPSS建模师认证 – 还可以两者兼而有之。因为这些高级软件产品在全球范围内广泛使用并得到认可,所以您可以放心:您的证书将为职业生涯提供强大的推动力。

『柒』 数据挖掘技术培训哪家强

随着互联网的发展,数据挖掘也是这两年刚兴起的培训课程但是这方面的培训机构却是数不胜数。所以建议你在选择培训机构的时候最好是去实际考察一下培训机构的资质、师资力量、培训环境、实验设备等等这方面的硬件设施。我之前是在恒智IT学过云计算觉得还不错,有时间你可以去看一下。

阅读全文

与加拿大数据挖掘学校相关的资料

热点内容
华道数据交付是什么 浏览:861
系统网络有什么 浏览:320
有什么可以帮忙p图的app 浏览:121
美食教程视频软件 浏览:549
2017win7与win10 浏览:43
iphone电脑定位追踪 浏览:620
如何判断文件是否存在 浏览:291
怎么搞移动数据密码 浏览:97
编程中如何开始学习 浏览:494
信息论编码与密码学电驴 浏览:200
ps打开文件的方式是什么 浏览:604
西软x5教程 浏览:693
国企虚报财务数据给什么处分 浏览:300
prt源文件下载 浏览:64
java指定字段排序规则 浏览:325
win7文件图标显示 浏览:833
class文件有多少个 浏览:820
qq对话框无法输入中文 浏览:528
港版iphone5s设置呼叫转移 浏览:534
d盘文件全部跑到桌面 浏览:173

友情链接