『壹』 哪些技術可能在未來的教育中得到應用
中國論文網 http://www.xzbu.com/8/view-4759172.htm
關鍵詞:學習分析;學習分析技術;數據挖掘
中圖分類號:G434文獻標識碼:文章編號文章編號:1672-7800(2013)012-0191-02
作者簡介:喬金瑤(1990-),女,東北師范大學碩士研究生,研究方向為現代遠程教育、計算機在教學中的應用;王紅(1988-),女,東北師范大學碩士研究生,研究方向為現代遠程教育、計算機在教學中的應用。
0引言
自從「學習分析」這一理念被提出後,在教育界里就引起了很大反響。美國新媒體聯盟與美國高校教育信息化協會合作的「地平線項目」在2010和2011兩年的年度報告中均預測學習分析技術將在未來的四到五年內成為主流[1]。英國開放大學知識媒體研究所 2011 和 2012 年連續推出了《社會學習分析報告 》(Social Learning Analytics)和《學習分析現狀報告》(The State of Learning Analytics in 2012: A Review and Future Challenges)[2]。2011 年,以加拿大阿塞巴斯卡大學的G.Siemens教授為主要召集人的學習分析學會(The Society for Learning Analytics, SoLAR)在第一屆學習與知識分析大會中將學習分析定義為:測量、收集、分析、報告學習者及其學習情境的相關數據,以促進對學習過程的理解,並對學習及其發生的環境進行優化[3]。著名的《地平線報告》在 2012 版中將學習分析定義為:通過收集來自學生的大量數據進行分析,從而對其學術表現進行評價和預測,並發現潛在的問題[4]。通過以上有關定義可以看出,學習分析是利用學習分析技術,對學習者學習活動的有關數據進行分析和建模,對學習者的學習結果進行評估,發現學習者學習中潛在的問題,並對學習者行為進行預測。
1學習分析技術在國內外高校中的應用
國外學科中,搜集的大量數據越來越成為重要的教育教學資源。這樣的數據可以提供可視化或者非可視化的相關指標。研究人員通過對這些指標的分析,可以發現學習者的學習狀況,以此作為基礎為使用者提供建議項目。
澳大利亞卧龍崗大學(University of Wollongong)的研究人員則運用「社會網路適應性教學實踐」應用軟體——SNAPP(Social Networks Adapting Pedagogical Practice)進行數據分析。這種軟體可以幫助用戶直觀了解學習者在論壇的發帖和回復情況,通過直觀跟蹤論壇交流內容,教師可以快速判斷用戶的行為模式,覆蓋課程進度的任何階段。通過分析發帖者、回復對象、討論話題以及話題范圍,SNAPP可以對數據加以分析並以社會網路圖的形式呈現分析結果,進而對學業面臨風險的學習者進行識別。
美國普渡大學的信號燈系統在提高學生學業成績方面也有很大幫助。這種信號燈系統運用了預測模型與「黑板視野(Blackboard Vista)」軟體共同提供的數據,對學習者的學業進展情況進行實時分析,當學習者的學業成績處於邊緣風險狀況時,信號燈系統就會發揮其功能,指導學習者相應地提高課程學習。由於這種系統實時反饋性很強,所以對教師和學習者幫助很大。
通過運用學習分析技術來提高學習者成績的學校還有很多。像德雷塞爾大學(Drexel University)收集數據的方法是採用在線教學管理系統的「視野之星報告(Vista Star Report)」,進而對學習者的在線學習時間、登錄次數、下載量等相關數據進行收集評估。北卡羅來納州立大學(North Carolina State University)也是運用學習分析技術對學校已有的學生信息以及針對學習者進行問卷調查等形式獲得的數據進行統計分析後,預測學習者在第一學期的學習成績。
在我國值得一提的是由浙江溫嶺市中學信息技術教師開發的一款信息技術教學輔助平台——ITtools3.0。這一教學輔助平台從2005年起著手研發,期間經歷了幾個版本,直到2011年5月才初步完成,目前還在不斷改進和完善。這一信息技術教學輔助平台目前已經被我國多所學校使用,如大連海灣高中、浙江省湖州五中、浙江省海鹽第二高級中學、廣州宜州一中以及浙江省義烏市實驗小學等。針對現在機房對機器的特殊保護,不允許學生對計算機進行改寫,所以,每當學生對計算機進行相關學習任務的操作後,再重新啟動計算機,以前的學習記錄就會消失,信息技術教學輔助平台的展示模塊解決了這一令人無奈的問題。該模塊可以對教師和學生的所有操作進行記錄,其強大的查詢和展示功能對於學生來說,不僅可以隨時查閱自己的學習成果,對其他同學發布的學習作品也可進行查詢,大大提高了學生自主學習的能力;對於教師來說,通過這一平台對記錄的數據進行分析,教師針對分析結果,可以即時調整自己的教學方式和方法,從而提高教學效果。
2學習分析技術的未來發展前景
2.1向教師、學生及課程管理人員及時反饋
相關系統在搜集大量的數據後利用學習分析技術進行分析,將分析結果及時反饋給教師、學生及課程管理人員尤為必要。利用學習分析技術及其相關分析工具,教師可獲得有關學生的學習績效、學習過程以及學習環境的信息。這些信息可以為教師改進教學提供依據[5]。不僅使教師能夠及時調整自己的教學策略,優化自己的教育教學過程,而且使學生能夠及時發現自己的不良學習行為,提高學習質量。通過對學習者活動數據的統計,課程管理人員可以及時修訂課程,發現哪些學習資源是學習者經常關注的,哪些學習資源是學習者根本不關心的,對於學習者比較感興趣的學習資源加以豐富,對於學習者不感興趣的資源進行刪除,以此來優化網路空間。 2.2推薦相關學習資源
有關學習的推薦系統近年來獲得了越來越多的關注,這些系統分析了學習者的數據,通過統計學習者有關下載、標注、觀看、閱讀等行為頻次,研究人員在比較分析後將學習者進行分類,最後將學習者分等級來獲得課程,並為學習者推薦合適的學習資源,例如推薦學習者選擇初級、中級還是高級課程。通過這一系統可以使學習者在有限的時間內提高自身的學習效率,另外還可以提高學習者的學習興趣。
2.3優化社會學習環境
在技術提高學習這一環境下,學習者彼此之間的交互是如何學習的一個核心部分。在計算機支持的協作學習中,許多研究已經集中到了對網路學習者的分析上。相關的學習分析技術通過對聊天工具、論壇,或者電子郵件客戶端中被捕獲的數據進行分析,不但會對學習者進行預測而且還會建議有關的小組學習活動。例如,某些學習者在某些學習系統中注冊了個人賬戶,如果所填的個人信息某些方面表示對天文知識感興趣,課程推薦系統會建議學習者參加天文學習小組。學習者在這個小組中通過彼此之間的信息交流、資源共享等,不僅可以吸引到更多有相同愛好的學習者,而且對提高自身研究領域的學術水平也有很大幫助。
3結語
目前,雖然對教育數據進行搜集和分析會對教育教學產生深遠的影響,但是為了使在這一領域的研究者能夠共享和重復使用有效的教育數據,還面臨很多挑戰。
3.1確定搜集數據格式標准
在數據收集中由於對交互數據缺少統一的陳述標准,從而在系統中阻止了有關數據的共享和重復使用。另外,如果學習者的一個自定義的數據信息格式沒有被記錄,當其他人使用這一數據時就很難理解被存儲數據信息的意義,想要對這些數據進行重復使用則很難。
3.2明確使用數據合法性
這是有關隱私權和教育數據收集許可的問題。雖然研究者在學習環境中會獲得大量的數據,但是使用數據的權利等相關問題需要從兩個視角來解決:一方面,從使用者的角度來說,學習者需要被告知在課程學習活動中要搜集相關數據,並且需要得到學習者本人的准許才能搜集他們的個人信息;另一方面,這些數據的組織或提供者也需要同意搜集和共享這些數據。為了避免研究者花費大量的人力、物力、財力通過某些方式搜集到相關的數據後才發現這些數據不可被使用的現象發生,讓數據能夠合法進行搜集,我國相關法律法規的完善刻不容緩。
3.3提高數據搜集相關技術
在學習分析探索性研究中,數據追蹤為學習管理提供了一個良好的基礎。學習者除了使用學習管理系統外,還經常使用各種各樣的工具和相關的學習服務,所以提高相關技術來獲得更多的數據非常必要,比如,可以在相關學習系統中安裝開發的小插件,以此來搜集有關數據。
參考文獻參考文獻:
[1]The Horizon Report 2011 edition[DB/OL].http://wp.nmc.org/,2012.
[2]BUCKINGHAM SHUM S,FERGUSON R.Social learning analytics[DB/OL].http://kmi.open.ac.uk/publications/pdf/kmi-11-01.pdf, 2012.
[3]Society for learning analytics research[DB/OL].https://tekri.athabascau.ca/analytics, 2012.
[4]JOHNSON L,ADAMS S,CUMMINS M.The NMC horizon report:2012 Higher Ecation Edition [DB/OL].http://www.nmc.org/publications/horizon-report-2012-higher-ed-edition,2012.
[5]顧小清,黃景碧.讓數據說話:決策支持系統在教育中的應用[J].開放教育研究,2010(10):99-105.
『貳』 數據挖掘提出的背景
數據挖掘(Data Mining,DM)又稱資料庫中的知識發現(Knowledge Discover in Database,KDD),是目前人工智慧和資料庫領域研究的熱點問題,所謂數據挖掘是指從資料庫的大量數據中揭示出隱含的、先前未知的並有潛在價值的信息的非平凡過程。數據挖掘是一種決策支持過程,它主要基於人工智慧、機器學習、模式識別、統計學、資料庫、可視化技術等,高度自動化地分析企業的數據,做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調整市場策略,減少風險,做出正確的決策。
知識發現過程由以下三個階段組成:(1)數據准備,(2)數據挖掘,(3)結果表達和解釋。數據挖掘可以與用戶或知識庫交互。
數據挖掘
數據挖掘
數據挖掘是通過分析每個數據,從大量數據中尋找其規律的技術,主要有數據准備、規律尋找和規律表示3個步驟。數據准備是從相關的數據源中選取所需的數據並整合成用於數據挖掘的數據集;規律尋找是用某種方法將數據集所含的規律找出來;規律表示是盡可能以用戶可理解的方式(如可視化)將找出的規律表示出來。
數據挖掘的任務有關聯分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析,等等。
並非所有的信息發現任務都被視為數據挖掘。例如,使用資料庫管理系統查找個別的記錄,或通過網際網路的搜索引擎查找特定的Web頁面,則是信息檢索(information retrieval)領域的任務。雖然這些任務是重要的,可能涉及使用復雜的演算法和數據結構,但是它們主要依賴傳統的計算機科學技術和數據的明顯特徵來創建索引結構,從而有效地組織和檢索信息。盡管如此,數據挖掘技術也已用來增強信息檢索系統的能力。
起源
需要是發明之母。近年來,數據挖掘引起了信息產業界的極大關注,其主要原因是存在大量數據,可以廣泛使用,並且迫切需要將這些數據轉換成有用的信息和知識。獲取的信息和知識可以廣泛用於各種應用,包括商務管理,生產控制,市場分析,工程設計和科學探索等。
數據挖掘利用了來自如下一些領域的思想:(1) 來自統計學的抽樣、估計和假設檢驗,(2)人工智慧、模式識別和機器學習的搜索演算法、建模技術和學習理論。數據挖掘也迅速地接納了來自其他領域的思想,這些領域包括最優化、進化計算、資訊理論、信號處理、可視化和信息檢索。一些其他領域也起到重要的支撐作用。特別地,需要資料庫系統提供有效的存儲、索引和查詢處理支持。源於高性能(並行)計算的技術在處理海量數據集方面常常是重要的。分布式技術也能幫助處理海量數據,並且當數據不能集中到一起處理時更是至關重要。
發展階段
第一階段:電子郵件階段
這個階段可以認為是從70年代開始,平均的通訊量以每年幾倍的速度增長。
第二階段:信息發布階段
從1995年起,以Web技術為代表的信息發布系統,爆炸式地成長起來,成為目前Internet的主要應用。中小企業如何把握好從「粗放型」到「精準型」營銷時代的電子商務。
第三階段: EC(Electronic Commerce),即電子商務階段
EC在美國也才剛剛開始,之所以把EC列為一個劃時代的東西,是因為Internet的最終主要商業用途,就是電子商務。同時反過來也可以說,若干年後的商業信息,主要是通過Internet傳遞。Internet即將成為我們這個商業信息社會的神經系統。1997年底在加拿大溫哥華舉行的第五次亞太經合組織非正式首腦會議(APEC)上美國總統柯林頓提出敦促各國共同促進電子商務發展的議案,其引起了全球首腦的關注,IBM、HP和Sun等國際著名的信息技術廠商已經宣布1998年為電子商務年。
第四階段:全程電子商務階段
隨著SaaS(Software as a service)軟體服務模式的出現,軟體紛紛登陸互聯網[5],延長了電子商務鏈條,形成了當下最新的「全程電子商務」概念模式。
『叄』 數據挖掘中的數據預處理技術有哪些,它們分別適用於哪些場合
一、數據挖掘工具分類數據挖掘工具根據其適用的范圍分為兩類:專用挖掘工具和通用挖掘工具。專用數據挖掘工具是針對某個特定領域的問題提供解決方案,在涉及演算法的時候充分考慮了數據、需求的特殊性,並作了優化。對任何領域,都可以開發特定的數據挖掘工具。例如,IBM公司的AdvancedScout系統針對NBA的數據,幫助教練優化戰術組合。特定領域的數據挖掘工具針對性比較強,只能用於一種應用;也正因為針對性強,往往採用特殊的演算法,可以處理特殊的數據,實現特殊的目的,發現的知識可靠度也比較高。通用數據挖掘工具不區分具體數據的含義,採用通用的挖掘演算法,處理常見的數據類型。通用的數據挖掘工具不區分具體數據的含義,採用通用的挖掘演算法,處理常見的數據類型。例如,IBM公司Almaden研究中心開發的QUEST系統,SGI公司開發的MineSet系統,加拿大SimonFraser大學開發的DBMiner系統。通用的數據挖掘工具可以做多種模式的挖掘,挖掘什麼、用什麼來挖掘都由用戶根據自己的應用來選擇。二、數據挖掘工具選擇需要考慮的問題數據挖掘是一個過程,只有將數據挖掘工具提供的技術和實施經驗與企業的業務邏輯和需求緊密結合,並在實施的過程中不斷的磨合,才能取得成功,因此我們在選擇數據挖掘工具的時候,要全面考慮多方面的因素,主要包括以下幾點:(1)可產生的模式種類的數量:分類,聚類,關聯等(2)解決復雜問題的能力(3)操作性能(4)數據存取能力(5)和其他產品的介面三、數據挖掘工具介紹:1.QUESTQUEST是IBM公司Almaden研究中心開發的一個多任務數據挖掘系統,目的是為新一代決策支持系統的應用開發提供高效的數據開采基本構件。系統具有如下特點:提供了專門在大型資料庫上進行各種開採的功能:關聯規則發現、序列模式發現、時間序列聚類、決策樹分類、遞增式主動開采等。各種開采演算法具有近似線性計算復雜度,可適用於任意大小的資料庫。演算法具有找全性,即能將所有滿足指定類型的模式全部尋找出來。為各種發現功能設計了相應的並行演算法。2.MineSetMineSet是由SGI公司和美國Standford大學聯合開發的多任務數據挖掘系統。MineSet集成多種數據挖掘演算法和可視化工具,幫助用戶直觀地、實時地發掘、理解大量數據背後的知識。MineSet有如下特點:MineSet以先進的可視化顯示方法聞名於世。支持多種關系資料庫。可以直接從Oracle、Informix、Sybase的表讀取數據,也可以通過SQL命令執行查詢。多種數據轉換功能。在進行挖掘前,MineSet可以去除不必要的數據項,統計、集合、分組數據,轉換數據類型,構造表達式由已有數據項生成新的數據項,對數據采樣等。操作簡單、支持國際字元、可以直接發布到Web。3.DBMinerDBMiner是加拿大SimonFraser大學開發的一個多任務數據挖掘系統,它的前身是DBLearn。該系統設計的目的是把關系資料庫和數據開採集成在一起,以面向屬性的多級概念為基礎發現各種知識。DBMiner系統具有如下特色:能完成多種知識的發現:泛化規則、特性規則、關聯規則、分類規則、演化知識、偏離知識等。綜合了多種數據開采技術:面向屬性的歸納、統計分析、逐級深化發現多級規則、元規則引導發現等方法。提出了一種互動式的類SQL語言——數據開采查詢語言DMQL。能與關系資料庫平滑集成。實現了基於客戶/伺服器體系結構的Unix和PC(Windows/NT)版本的系統。4.IntelligentMiner由美國IBM公司開發的數據挖掘軟體IntelligentMiner是一種分別面向資料庫和文本信息進行數據挖掘的軟體系列,它包括IntelligentMinerforData和IntelligentMinerforText。IntelligentMinerforData可以挖掘包含在資料庫、數據倉庫和數據中心中的隱含信息,幫助用戶利用傳統資料庫或普通文件中的結構化數據進行數據挖掘。它已經成功應用於市場分析、詐騙行為監測及客戶聯系管理等;IntelligentMinerforText允許企業從文本信息進行數據挖掘,文本數據源可以是文本文件、Web頁面、電子郵件、LotusNotes資料庫等等。5.SASEnterpriseMiner這是一種在我國的企業中得到採用的數據挖掘工具,比較典型的包括上海寶鋼配礦系統應用和鐵路部門在春運客運研究中的應用。SASEnterpriseMiner是一種通用的數據挖掘工具,按照"抽樣--探索--轉換--建模--評估"的方法進行數據挖掘。可以與SAS數據倉庫和OLAP集成,實現從提出數據、抓住數據到得到解答的"端到端"知識發現。6.SPSSClementineSPSSClementine是一個開放式數據挖掘工具,曾兩次獲得英國政府SMART創新獎,它不但支持整個數據挖掘流程,從數據獲取、轉化、建模、評估到最終部署的全部過程,還支持數據挖掘的行業標准--CRISP-DM。Clementine的可視化數據挖掘使得"思路"分析成為可能,即將集中精力在要解決的問題本身,而不是局限於完成一些技術性工作(比如編寫代碼)。提供了多種圖形化技術,有助理解數據間的關鍵性聯系,指導用戶以最便捷的途徑找到問題的最終解決法。7.資料庫廠商集成的挖掘工具SQLServer2000包含由Microsoft研究院開發的兩種數據挖掘演算法:Microsoft決策樹和Microsoft聚集。此外,SQLServer2000中的數據挖掘支持由第三方開發的演算法。Microsoft決策樹演算法:該演算法基於分類。演算法建立一個決策樹,用於按照事實數據表中的一些列來預測其他列的值。該演算法可以用於判斷最傾向於單擊特定標題(banner)或從某電子商務網站購買特定商品的個人。Microsoft聚集演算法:該演算法將記錄組合到可以表示類似的、可預測的特徵的聚集中。通常這些特徵可能是隱含或非直觀的。例如,聚集演算法可以用於將潛在汽車買主分組,並創建對應於每個汽車購買群體的營銷活動。,SQLServer2005在數據挖掘方面提供了更為豐富的模型、工具以及擴展空間。包括:可視化的數據挖掘工具與導航、8種數據挖掘演算法集成、DMX、XML/A、第三方演算法嵌入支持等等。OracleDataMining(ODM)是Oracle資料庫10g企業版的一個選件,它使公司能夠從最大的資料庫中高效地提取信息並創建集成的商務智能應用程序。數據分析人員能夠發現那些隱藏在數據中的模式和內涵。應用程序開發人員能夠在整個機構范圍內快速自動提取和分發新的商務智能—預測、模式和發現。ODM針對以下數據挖掘問題為Oracle資料庫10g提供支持:分類、預測、回歸、聚類、關聯、屬性重要性、特性提取以及序列相似性搜索與分析(BLAST)。所有的建模、評分和元數據管理操作都是通過OracleDataMining客戶端以及PL/SQL或基於Java的API來訪問的,並且完全在關系資料庫內部進行。IBMIntelligentMiner通過其世界領先的獨有技術,例如典型數據集自動生成、關聯發現、序列規律發現、概念性分類和可視化呈現,它可以自動實現數據選擇、數據轉換、數據發掘和結果呈現這一整套數據發掘操作。若有必要,對結果數據集還可以重復這一過程,直至得到滿意結果為止。現在,IBM的IntelligentMiner已形成系列,它幫助用戶從企業數據資產中識別和提煉有價值的信息。它包括分析軟體工具----IntelligentMinerforData和IBMIntelligentMinerforText,幫助企業選取以前未知的、有效的、可行的業務知識----如客戶購買行為,隱藏的關系和新的趨勢,數據來源可以是大型資料庫和企業內部或Internet上的文本數據源。然後公司可以應用這些信息進行更好、更准確的決策,獲得競爭優勢。
『肆』 數據挖掘哪家強求考研學校推薦,快來,各位學長
我本科學的是電子商務,專業課還可以,就是學校不是特別好。想考研換個學校數據倉庫與數據挖掘方向,全國最好的就是復旦大學和中國人民大學了.清華北大在
『伍』 如何通過抓取教育大數據來深化課堂教學改革
現代信息技術的發展為大數據的收集和分析提供了無限的可能,大數據時代的這一趨勢也對教育產生了巨大的影響:一方面,在科技理性的指導下,通過多維度收集學生行為的數據並進行模型建構,可以對學生的學習行為進行預測;另一方面,大數據時代的人文主義轉向使人們更關注教學活動的適應性,教育大數據的挖掘和利用可以更好地實現適應個人需求的定製化教學。
國際數據公司(IDC)認為大數據時代數據有4大特點——數據的規模大、價值大、數據流轉速度快以及數據類型多。大數據的挖掘和利用對教育——特別是課堂教學——產生著深遠的影響。學習科學家索耶認為:越來越多的學習將經過計算機中介發生, 並產生越來越多的數據,我們有必要運用這些數據分析什麼時候有效的學習正在發生。所以數據挖掘可以用於探究行為與學習之間的關系,如學習者的個體差異與學習行為之間有何關系,不同行為又會導致何種不同的學習結果等。2012年美國發布《通過教育數據挖掘和學習分析促進教與學》(Enhancing Teaching and Learning through Ecational Data Miningand Learning Analytics)提出大數據時代教育數據的特點:具有層級性、時序性和情境性,其中數據的層級性指,既收集教師層面的數據也收集學生層面的數據,既收集課堂數據也收集活動數據,為後期模型的建立提供了多維度的資源;數據的時序性是指,數據是實時的、連續的,為材料的前沿性提供了保障;而數據的情境性是指,數據是基於真實情境脈的,保證了模型的信度。
大數據技術能夠促進以學生為本的學習,數據不僅僅是科技理性指導下收集數據和擬合成模型,並針對學生的群體行為做出預測判斷,還可能在固有模型的基礎上,通過診斷學生在課堂中的行為表現,對固有模型進行修改,使課程內容更加適合學生的長尾需求,實現個性化教學。大數據的利用可以支持對教育活動行為的建模預測,還可能支持教育實踐中的適應性教學。前者是後者的基礎,後者是前者的深化。
建模與預測導向的大數據應用
大數據時代數據促進教育變革的方法之一是收集和分析處理數據,並進行預測。現如今,由於數據記錄、存儲與運算的便捷性,海量的、多層次的數據可以便捷地加以收集,由隨機抽樣帶來的誤差因此減小,建模和預測可以基於全數據和真實數據,因而就更為精確。大數據時代通過探求海量數據的相關關系獲得盈利的最成功的案例是亞馬遜的市場營銷,亞馬遜收集讀者網上查閱行為和購買行為數據,建立讀者偏愛閱讀模型,預測讀者購買的群體行為,實現書籍的推薦。近幾年,教育研究的對象逐漸關注學生的學習行為,其背後是一種學習觀的轉變,學習被視為一種識知的過程(knowing about),識知是一個活動,而不是將知識作為一個物品加以傳遞。識知總是境脈化的,而不是抽象的和脫離於具體情境的。識知是在個體與環境的互動中交互建構的,而不是客觀准確的,也不是主觀創造的。所以,學生的行為活動數據被認為是可以反映學生在學習過程這一情境化的動態變化進程中的情況。海量、多層次、連續的行為數據在收集後被擬合成模型,實現預測,如學習管理系統(LMS)的運用。然而,由於建模和預測依賴的基本原理為數理統計,其預判對象主要是學生的群體行為。
1.案例分析
學習管理系統(Learning Manage System)簡稱LMS,是基於網路的管理系統平台,用於監控學生學習活動行為,識別和預測學困生(student at-risk),並為其提供相應的幫助。大多數LMS包括5個部分:有和課程相關的學習資料、用於確保學生提交作業與完成測試的評價工具、用於溝通的交流工具(如郵件、聊天室等)、用於確保教師記錄和存儲學生的學習活動並發布活動截止日期的課程管理工具、用於幫助學生學習回顧和跟蹤學習進程的學習管理工具。在高校大量使用的BB(Blackboard)平台就是一個常見的學習管理系統。系統記錄了學生參與選修的網上課程的種類、在線時長、閱讀和瀏覽的文章數量,反映學習者的學習行為。2008年,Leah P.Macfadyen和Shane Dawson教授在加拿大不列顛哥倫比亞大學通過分析5個本科班級使用BB平台選修生物課的數據,建立了預測模型。平台記錄了學生課程材料的使用情況、參與學業交流情況和完成作業提交和考試情況。大數據時代教育數據記錄的層級性在這裏充分顯現,課程材料的使用包括記錄在線時長、郵件的閱讀時間、郵件的發送時間、討論信息的閱讀時間等。參與學業交流記錄了發布新討論的時間、回復討論的時間、使用搜索工具所花的時間、訪問個人信息的時間、文件的瀏覽時間、瀏覽誰同時在線的時間、瀏覽網頁連結的時間等等。評價模塊記錄了評價的閱讀時長和提交評價的時間等。通過應用統計工具描述散點圖,發現了在LMS記錄下學生在線時長和學業表現呈相關關系。在進行多元回歸時,研究者發現,學業成就處在後四分之一的學生在線時間略長於平均時間,而學業成就處於前四分之一的學生的在線學習時間低於平均水平。緊接著,研究人員為了作出預測,利用邏輯斯特回歸生成了一個預測模型,通過收集學生的新的行為數據,預測學生是否處於真正參與了學習活動,並得出如下結論:討論舉行的次數、郵件信息發送量和測評的完成情況這三個維度構成的模型可以預測學生的學業水平情況。
大數據時代,通過探求學生行為與學業水平之間的相關關系,建立模型,實現預測,能夠對課堂教學產生重要影響。然而,數據建模過程中,為了保證模型的效度與信度,極端個別數據被處理,使模型只能實現群體行為的預測,不能針對學習者個體實現定製化和個性化。
2.建模與預測的不足
數據建模與預測的背後充分體現了實證主義的思想和方法。19世紀上半葉,以孔德為代表的社會學家提出了實證主義的基本信條:利用觀察、分類,探求彼此的關系,得到科學定律。實證主義的哲學思潮到20世紀60年代,演變成一種科技理性,實踐知識逐漸染上了工具性的色彩,專業活動存在於工具性的解決問題之中,所有的專業活動都被視為釐定目標、套用已知的方法解決問題的過程。這一期間,大量的學科被系統地整合發展,甚至包括教育學和社會學這樣的「軟科學」。用證據解決未知的問題,用數據預測未來一時成為潮流。
學生活動行為數據的建模尤其側重體驗實證主義的思想,模型注重成功教學行為的共性,忽視教師與學生群體的獨特性需求時,科技理性的主導有可能使課堂教學被視為獨立於真實境脈的模塊,只要教學行為取得成功,就會被數據抽象化,形成模型,對學生群體行為產生預測。科技理性有賴於人們認同的共有目標,教學實踐目標的釐定極其復雜,包含巨大的不確定性和獨特性,甚至,由於社會角色的不同,還會帶來價值沖突。一個穩定的、為所有人所認同的目標不復存在,依據科技理性精神和方法推理預測的行為模式並不可能滿足每一個人的需求,教育變革在大數據時代下出現新的取向。
從數據模型到支持適應性學習
在數據建模的基礎上實現教學的適應性是大數據時代促進教育變革的另一成果。數據建模及行為預測依舊屬於科技理性指導下的行為模式,可能會造成忽視學生個性需求的現象,而個性化需求正是知識社會的重要特徵,個性化的教育也受到教育研究者、政策制定者和教育實踐者越來越多的關注。教育系統設計專家賴格盧斯認為,教育投入沒有達到效果的一個很重要的原因是忽視了社會的轉型。「社會已經從工業社會步入了資訊時代,勞動力市場對人才的要求不再是工業時代在流水線上操作的工人,而是具有創新性思維、決斷力強的知識性人才。」教學面臨從產生清一色的勞工轉向產生有判斷力和適應性能力的人群。2010年,OECD的報告《The Nature Of Learning》中指出,適應性能力(adaptive competence)是21世紀核心競爭力,包括在真實的境脈中靈活並有創造力地使用有意義的知識和技能。吳剛在《大數據時代的個性化教育:策略與實踐》中提出了個性化教育的必要性和必然性,指出「只有利用信息技術所提供的強大支持,才有可能真正實現個性化學習」。大數據時代的來臨,正是個性化教育發展的一個良好契機。2012年,美國頒布了《通過教育數據挖掘和學習分析促進教與學》,提出大數據時代,通過收集在線學習數據,對數據進行分類和探尋數據之間關聯的方式挖掘數據,形成數據模型。通過學生行為和模型的互動,形成適應性學習系統。概言之,我們可以以對行為數據的充分利用為基礎,改變教學的內容和進度,構建適應性評價和教學系統,充分實現教育的定製化,滿足學生的長尾需求。
1.案例分析:
適應性教學系統又稱適應性學習系統,(Adaptive Learning Support System),簡稱ALSS系統,強調基於資源的主動學習,認為學習不是知識的傳遞,而是學習者的自我建構。自上世紀90年代以來,研究者開發了不少適應性學習系統,如1998年De Bra開發的AHA系統,2003年,Brandsford和Smith開發的針對任務型學習的MLtutor系統,以及近幾年頗受關注的翻轉課堂(Flipped Classroom Model)簡稱FCM系統。
內容傳遞模塊:傳遞相關知識與信息支持學生的學習。
學習者資料庫:存儲學生在參與教學活動中的相關行為。
預測模塊:包括學生信息和學生行為數據,跟蹤學生的學習,並做出預判。
顯示模塊:為學生生成行為報告。
自適應模塊:根據學生行為生成的報告,反饋到預置模型,為模型做出相應的改變,使之更符合學生。
干預模塊:使教師、系統管理者和領導可以在系統運行時實施人為干涉。
學習者學習相關學科內容時,學習行為被記錄跟蹤下來,學生的學習行為數據被傳送到後台,記錄在學習者資料庫內,作用於預測模塊。預測模塊通過改變內容傳遞模塊,再次作用於學習者。在整個過程中,教師、教學管理者起干涉作用。
適應性學習系統是一個交互的動態系統,系統往往會提供給學生一些學習行為建議。奧地利針對學生的問題解決的過程設計了一個適應性學習系統。適應性學習系統的第一步是教育數據挖掘(ecational data mining),簡稱EDM。數據挖掘的過程包括數據收集、數據預處理、應用數據的挖掘和詮釋評價發展結果。Moodle提出了CMS數據挖掘系統(Course Management System)。研究者先使用原始數據進行建模,第一步是原始數據的收集,原始數據大約包含2007年73名用戶產生的28000活動例子,2008年97名用戶產生的265000份解決問題的案例和2009年45名用戶產生的115000個活動案例。除了記錄學生解答問題時產生的數據,原始數據還收集了學生的信息、問題的信息和解決問題的步驟;在對數據進行分類後,歸納出問題解決的類型,利用很擅長擬合連續數據的Markvo Models(MMs)的一個子模型DMMs擬合了如上的連續性數據,通過添加判斷學生學習行為的結果模型和一系列監控和調節模塊,構成了整個面向問題解決的適應性系統。當學生使用這個模型時,模型會根據學生的行為數據為學生提供他們所偏愛的解決問題的過程與方法。
除了適應性教學系統,還有適應性評測系統。LON-CAPA(Learning Online Network with Computer-Assisted Personalized Approach)是一個計算機輔助的個性化網路學習測評平台,平台不提供課程設計和課程目標,而是一個教學工具。CAPA通過後台記錄學生的基本資料,學生參與的互動交流、學業情況,針對學業課程中的疑難點,提供個性化的考試資源。
2.適應性轉向的意義
在大數據時代,科技理性指導下的模型預判在面對結構不良的問題時顯得應對能力不足。科技理性指導下的數據建模忽視學習的真實境脈,只能支持群體行為的預判,模型的推廣可能會使人們忽視其實踐成功背後的個體經驗與具體情境,從而導致科技理性與哲學思辨對抗。然而,完全依靠哲學思辨和經驗進行教學不僅不利於教育學科系統理論性的發展,也不利於課堂實踐的管理與教師的培訓。唐納德·A.舍恩提出了一種適應性思維模式。他指出:「如果科技理性的模式在面對『多樣』的情境時,是無法勝任、不完整的,甚至更遭的話,那麼,讓我們重新尋找替代的、較符合實踐的、富有藝術性及直覺性的實踐認識。」適應性學習是在系統理論知識的指導下,針對個體差異,使學習內容和活動高度個性化的學習方式。
適應性平衡了理性與經驗的兩難,英國學者Hargreaves(1996)首次提出基於證據的教育研究向醫療診斷學靠攏。臨床診斷學和教育的相似之處在於,他們都要面對變動不居、極其復雜的環境,在這樣一個結構不良的系統中,充分意識到客體(患者或者學生)的獨特性與共性,利用系統的專業知識解決問題。
Ralf St. Clair教授在參考醫學臨床實踐研究的三要素後提出基於證據的教育研究的三要素——研究的證據、教育工作者的經驗、學習者的環境與特點。其中,行為預測關注的是研究的證據,而適應性學習系統的建設則關注的是教育工作者的經驗和學習者的環境與特點。
從預測行為到支持適應性教學的轉向,是一種人文主義的轉向,教育研究的重點從關注研究的證據走向關注教育工作者的經驗與學習環境特點,關注以證據支持個性化學習的實踐變革。證據不再是其在科技理性時代所處的指導決策的角色,而是被視作一種資源,教育工作者在大量的基於證據的課堂教學決策中找尋最適合自己特點和學生特點的方式,推進課堂教學流程。也就是說,大數據的更重要價值在於支持適應性學習,滿足個性化學習和個性化發展的時代需要。數據的預測功能依賴於大數據收集數據的全面性與處理數據的便捷性,根據統計學原理對群體行為做出預測,一定程度上弱化了個體特徵和具體情境。其主要指向行為預判。而適應性是在模型與客體的交互作用上改變模型,如圖3所示,數據的適應性運轉模型比預測模型多了一個循環(loop until)系統,使其更加契合個人需求,其主要指向實踐改進。預測是支持個性化學習的基礎,而支持個性化學習是預測功能的深化和轉化——從整體人群到個體學習者、從理論模型到實踐策略的轉化。
分析與啟示
大數據時代由於數據量大,數據收集與攜帶便捷,使海量學生行為數據被挖掘、收集,通過數據建模對學習者行為的分析變得比前大數據時代更為全面和可靠。數據時代在數據的挖掘和預測上固然潛力十足,但是大數據時代更多的價值是滿足學習者的適應性長尾需求,在預測行為的基礎上,修改教學模式,使之個性化與定製化。從數據建模走向支持適應性教學,支持對象從群體轉向了個人,對教育活動的影響從對行為的認識轉向了教育活動的實踐,從科技理性指導下的去境脈轉向了基於真實情境的教學活動。
走向適應性,不僅改變人類行為方式,更重要的是改變了認知方式。前大數據時代人們在科技理性的指導下完全被數據證據左右(driven by the data),教師和學生、教育決策者和學校形成傳統社會契約關系,當事人把自己百分之百地交給專業工作人員,而專業工作人員遵守契約,對當事人全心全意地負責,從而使專業工作人員享受至高無上的壟斷性地位。大數據時代,教師不再是知識的控制者,他通過參與學生的學習活動,根據學生的先擁知識和認知特點、個性需求,不斷地調整教學步驟、教學進度和難度。學生不用完全將自己有如病人交付給醫生一般完全託付給教師。在學習的過程中,通過與教師的互動交流,在教師的協助下,成為自己學習的主體,控制並對自己的學習負責。由於教師精力有限,大數據時代下網路計算機輔助學習系統可以為教師和學生提供輔助指導的機會。
盡管如此,一方面,我們要擁抱大數據給我們帶來的便捷的生活和高質量的教育,另一方面,我們需要保持警惕和防止因果關系和相關關系的誤用,並且維護數據安全。
在推理方面,教育工作者需要警惕將相關關系和因果關系誤用,以Leah P.Macfadyen教授的前述案例為例,BB平台在線時間的長短和學生的學業成就有相關關系,而非因果關系,成績優異的學生在線時間低於平均在線時間,但不能說低於平均在線時間的學習導致學生成績優異而要求學生減少在線學習時間。
此外,在信息安全方面,學生和教師的大量信息被收集和使用,在使用的過程中,必須制定相關私隱保護法,保證信息的安全,警惕數據濫用。學生的行為數據也不可以作為教師教學評優的依據,讓大數據真正成為支持教學變革、提升教學效能、促進學生發展的手段,而不是控制教師和學生的工具。
『陸』 數據挖掘證書有哪些,尤其是加拿大比較認可的
獲取IBM SPSS分析軟體產品認證
現在,通過獲取分析支持產品證書,您可以證明自己已經掌握了專業知識,並進而推動自己的職業生涯發展。您可以選擇獲取面向統計分析領域的IBM SPSS統計認證或者面向數據採集領域的IBM SPSS建模師認證 – 還可以兩者兼而有之。因為這些高級軟體產品在全球范圍內廣泛使用並得到認可,所以您可以放心:您的證書將為職業生涯提供強大的推動力。
『柒』 數據挖掘技術培訓哪家強
隨著互聯網的發展,數據挖掘也是這兩年剛興起的培訓課程但是這方面的培訓機構卻是數不勝數。所以建議你在選擇培訓機構的時候最好是去實際考察一下培訓機構的資質、師資力量、培訓環境、實驗設備等等這方面的硬體設施。我之前是在恆智IT學過雲計算覺得還不錯,有時間你可以去看一下。