A. 大數據的應用案例以及未來發展趨勢
趕超發達國家的重要機遇
半個世紀以來,隨著計算機技術全面融入社會生活,信息爆炸已經積累到了一個開始引發變革的程度,不僅使世界充斥著比以往更多的信息,而且其增長速度也在加快。信息爆炸的學科如天文學和基因學,創造出來大數據這個概念,如今,這個概念幾乎應用到了所有人類智力與發展的領域中。21世紀是數據信息大發展的時代,移動互聯、社交網路、電子商務等極大拓展了互聯網的邊界和應用范圍,各種數據正在迅速膨脹並變大。互聯網(社交、搜索、電商)、移動互聯網(微博)、物聯網(感測器、智慧地球)、車聯網、GPS、醫學影像、安全監控、金融(銀行、股市、保險)、電信(通話、簡訊)都在瘋狂產生著數據,大數據時代已經到來。
當前全球和我國大數據都呈現了井噴式爆發性增長,大數據已經滲透到各個行業和業務職能領域,成為重要的生產因素,大數據的演進與生產力的提高有著直接的關系。其發展特點,一是數據量呈現指數級增長。二是不同行業的大數據內容和開發應用特點各有不同,如證券、投資服務以及銀行等金融服務領域擁有最高的平均數字化數據存儲量,通信和媒體公司、公共事業公司以及政府等組織也有規模顯著的數字化數據存儲,這些行業更加具有通過大數據來創造價值的潛力。三是可以預見到大數據高速增長的現有趨勢將繼續推動數據增長,例如在各部門和地區之間,企業正在加快收集數據的步伐,推動了傳統的事務資料庫的增長;醫療衛生等面向消費者的行業中,多媒體的廣泛使用刺激了大數據的增長;社交媒體的廣泛普及以及物聯網中應用的不斷創新都進一步推動了大數據不斷增長……這些相互交叉的動力刺激了數據的增長,並將繼續推動數據池的迅速擴張。
發展大數據及其相關服務業將成為新興經濟體特別是我國在戰略性新興產業領域發揮後發優勢趕超發達國家的重要機遇。只要條件具備,發展中經濟體能夠利用大數據發揮巨大的潛力。例如,亞洲地區移動手機用戶最多,終端設備最多,其中中國設備數量最多,個人位置數據在亞洲已經領先。此外,在IT資產方面,盡管一些新興市場組織落後於發達市場,但發展中經濟體可以用最新技術跳躍式前進。大數據的應用不僅僅是商務,通過用戶行為分析實現精準管理、科學決策和人性化服務是大數據的典型應用,大數據在各行各業特別是公共服務領域具有廣闊的應用前景,包括消費行業、金融服務、食品安全、醫療衛生、軍事、交通環保、電子商務、氣象等。發展大數據產業機遇可貴潛力巨大。從經濟和產業發展維度看大數據及相關產業發展的潛力,我國獨特的位勢和經濟社會高速穩定發展,給大數據及其應用帶來了巨大的發展空間。大數據在我國各領域和不同行業的應用潛力巨大、機遇重大。大數據的核心技術進展和大數據應用有可能帶來我國新興戰略性產業發展的新機遇。
信息服務業發展的重要推力
研究表明,大數據是繼傳統IT之後下一個提高生產率的技術前沿和信息服務業發展的重要推動力。大數據的使用將成為未來提高競爭力、生產力、創新能力以及創造消費者盈餘的關鍵要素。
例如醫療衛生行業,能夠利用大數據避免過度治療、減少錯誤治療和重復治療,從而降低系統成本、提高工作效率,改進和提升治療質量;公共管理領域,能夠利用大數據有效推動稅收工作開展,提高教育部門和就業部門的服務效率;零售業領域,通過在供應鏈和業務方面使用大數據,能夠改善和提高整個行業的效率;市場和營銷領域,能夠利用大數據幫助消費者在更合理的價格範圍內找到更合適的產品以滿足自身的需求,提高附加值。數據已經成為可以與物質資產和人力資產相提並論的重要的生產要素,伴隨著信息化發展,企業將收集更多的信息,從而帶來數據呈現指數級的增長。大數據在同時為商業和消費者創造價值方面有巨大的發展潛力。
大數據應用能夠發揮重要的經濟作用,不但有利於私人商業活動,更有利於國民經濟和公民。數據可以為世界經濟創造重要價值,提高企業和公共部門的生產率與競爭力,並為消費者創造大量的經濟剩餘。例如,能夠富有創造性而有效地利用大數據來提高效率和質量。麥卡錫公司研究報告指出,預計美國醫療行業每年通過數據獲得的潛在價值可超過3000億美元,能夠使得美國醫療衛生支出降低超過8%,充分利用大數據的零售商有可能將其經營利潤提高60%以上。通過利用大數據實現政府行政管理方面的運作效率提高。估計歐洲發達經濟體可以節省開支超過1000億歐元,其中尚不包括可以用來減少欺詐、錯誤以及稅差的影響作用。可以預見的是,隨著人們存儲、匯聚和組合數據然後利用其結果進行深入分析的能力超過以往,隨著越來越尖端技術的軟體與不斷提高的計算能力相結合,從數據中提取洞見的能力也在顯著提高。
大數據及其開發利用能夠催生新的產業形態,拓展成為戰略性新興產業的重要組成部分。大數據的生產、整合、開發利用具有廣泛的高附加值,可以形成和應用於各行業的關鍵發現,大數據的有效利用可以創造巨大的潛在價值,許多行業和承擔業務職能的組織可以利用大數據提高人力、物力資源的分配和協調能力,減少浪費,增加透明度,並促進新想法和新見解的產生。其價值一是提高透明度,讓利益相關方能夠更加容易地及時獲取信息,例如在公安部門,讓原本相互分離的部門之間更加容易地獲取相關數據,就可大大降低搜索和處理時間;在製造業,整合來自研發、工程和製造部門的數據以便實現並行工程,可以顯著縮短產品上市時間並提高質量。二是可以通過實驗來發現需求、暴露可變因素並提高業績。隨著組織創造並存儲更多數字形式的交易數據,並以實時或接近實時的方式收集更多准確而詳細的績效數據,組織能夠通過安排對比實驗,運用數據分析獲取更好的決策,例如在線零售商,通過將流量和銷售結合的試驗論證決定價格調整和促銷活動的制定。三是更加精準地組織市場,根據客戶需求細分人群。利用大數據使組織能夠對人群進行非常具體的細分,以便精確地定製產品和服務以滿足用戶需求。例如在公共部門如公共勞動力機構,利用大數據為不同的求職者提供工作培訓服務,確保採用最有效和最高效的干預措施使不同的人重返工作崗位。四是可以協助決策者更加科學地進行決策。大數據的自動處理能夠更好地為決策者提供更加精準恰當的決策支持,通過對大數據的自動處理來替換或支持人為決策。有些組織已經在通過分析來自客戶、雇員甚至嵌入產品中的感測器的整個數據集而做出更有效的決策。五是能夠創新商業模式、產品和服務。例如在醫療保健領域,通過分析病人的臨床和行為數據已經創造了瞄準最適當群體的預防保健項目。例如互聯網公司收集大量的在線行為數據,創新速度非常快。
應組織實施大數據產業專項
發展大數據及其相關服務業具有重要意義,有望使各個行業產生更多收益。隨著我國經濟和社會信息化的高速發展,不僅信息產業自身獲取了巨大的數據池,各個行業都存在利用大數據獲取價值的潛力。大數據促使信息化建設模式大轉變,結構化數據向非結構化數據演進,使得未來IT投資重點不再是建系統為核心,而是圍繞大數據為核心。政府和企業決策者應對大數據發展研究制定發展戰略和策略給予高度重視。
大數據真正的問題是大數據應用,讓大數據更有意義。目前大數據管理多從架構和並行等方面考慮,解決高並發數據存取的性能要求及數據存儲的橫向擴展,但對非結構化數據的內容理解仍缺乏實質性的突破和進展,這是實現大數據資源化、知識化、普適化的核心。非結構化海量信息的智能化處理包括自然語言理解、多媒體內容理解、機器學習等。例如2012年3月29日白宮發布美國政府的大數據計劃:通過提高從大型復雜的數據集中提取知識和觀點的能力,承諾幫助加快在科學與工程中的步伐,加強國家安全,並改變教學研究。
由此,我們提出組織實施大數據產業專項的初步設想。一是圍繞拓展新興信息服務業態,組織實施以大數據示範、加工、處理、整合和深加工的信息資源與內容服務業示範工程,面向重點行業和重點民生領域包括金融證券、醫療衛生、稅務海關、交通運輸、社會保障、電子商務等領域,開展大數據重大應用示範,提升基於大數據的公共服務能力;二是加快推動北斗導航核心技術研發和產業化,推動北斗導航與移動通信、地理信息、衛星遙感、移動互聯網等融合發展,支持位置信息服務市場拓展,完善北斗導航基礎設施,推進服務模式和產品創新,在重點區域和領域開展示範應用;三是大力發展地理信息產業,拓寬地理信息服務市場,推進大數據技術和服務模式融合創新,支持大數據服務創新和商業模式創新;四是組織實施基於大數據的信息內容加工服務業典型示範工程,包括關鍵技術產品產業化和大數據生產、轉換、加工、投送平台及專用工具的產業化項目,為豐富信息消費內容產品供給提供支撐;五是組織實施自主可控的大數據關鍵技術產品產業化項目,主要包括商業智能、數據倉庫、數據集市、元數據、可視化技術等。
B. 美國政府第一個強調大數據對美國國家戰略和美國國家的重要性的行動是
大數據的概念確實是老美最先提出而是付諸行動的,最開始是應用於經濟金融領域,分析股票市場的,慢慢的滲透到了各行各業,甚至體育中俱樂部選人都會應用,不過,還沒聽說過能應用在國防戰略上,原因很簡單,能應用大數據的領域前提是有足夠的數據可供採集,而是樣本還要有相似點,國防領域明顯不具備應用大數據技術的基礎
C. 如何通過抓取教育大數據來深化課堂教學改革
現代信息技術的發展為大數據的收集和分析提供了無限的可能,大數據時代的這一趨勢也對教育產生了巨大的影響:一方面,在科技理性的指導下,通過多維度收集學生行為的數據並進行模型建構,可以對學生的學習行為進行預測;另一方面,大數據時代的人文主義轉向使人們更關注教學活動的適應性,教育大數據的挖掘和利用可以更好地實現適應個人需求的定製化教學。
國際數據公司(IDC)認為大數據時代數據有4大特點——數據的規模大、價值大、數據流轉速度快以及數據類型多。大數據的挖掘和利用對教育——特別是課堂教學——產生著深遠的影響。學習科學家索耶認為:越來越多的學習將經過計算機中介發生, 並產生越來越多的數據,我們有必要運用這些數據分析什麼時候有效的學習正在發生。所以數據挖掘可以用於探究行為與學習之間的關系,如學習者的個體差異與學習行為之間有何關系,不同行為又會導致何種不同的學習結果等。2012年美國發布《通過教育數據挖掘和學習分析促進教與學》(Enhancing Teaching and Learning through Ecational Data Miningand Learning Analytics)提出大數據時代教育數據的特點:具有層級性、時序性和情境性,其中數據的層級性指,既收集教師層面的數據也收集學生層面的數據,既收集課堂數據也收集活動數據,為後期模型的建立提供了多維度的資源;數據的時序性是指,數據是實時的、連續的,為材料的前沿性提供了保障;而數據的情境性是指,數據是基於真實情境脈的,保證了模型的信度。
大數據技術能夠促進以學生為本的學習,數據不僅僅是科技理性指導下收集數據和擬合成模型,並針對學生的群體行為做出預測判斷,還可能在固有模型的基礎上,通過診斷學生在課堂中的行為表現,對固有模型進行修改,使課程內容更加適合學生的長尾需求,實現個性化教學。大數據的利用可以支持對教育活動行為的建模預測,還可能支持教育實踐中的適應性教學。前者是後者的基礎,後者是前者的深化。
建模與預測導向的大數據應用
大數據時代數據促進教育變革的方法之一是收集和分析處理數據,並進行預測。現如今,由於數據記錄、存儲與運算的便捷性,海量的、多層次的數據可以便捷地加以收集,由隨機抽樣帶來的誤差因此減小,建模和預測可以基於全數據和真實數據,因而就更為精確。大數據時代通過探求海量數據的相關關系獲得盈利的最成功的案例是亞馬遜的市場營銷,亞馬遜收集讀者網上查閱行為和購買行為數據,建立讀者偏愛閱讀模型,預測讀者購買的群體行為,實現書籍的推薦。近幾年,教育研究的對象逐漸關注學生的學習行為,其背後是一種學習觀的轉變,學習被視為一種識知的過程(knowing about),識知是一個活動,而不是將知識作為一個物品加以傳遞。識知總是境脈化的,而不是抽象的和脫離於具體情境的。識知是在個體與環境的互動中交互建構的,而不是客觀准確的,也不是主觀創造的。所以,學生的行為活動數據被認為是可以反映學生在學習過程這一情境化的動態變化進程中的情況。海量、多層次、連續的行為數據在收集後被擬合成模型,實現預測,如學習管理系統(LMS)的運用。然而,由於建模和預測依賴的基本原理為數理統計,其預判對象主要是學生的群體行為。
1.案例分析
學習管理系統(Learning Manage System)簡稱LMS,是基於網路的管理系統平台,用於監控學生學習活動行為,識別和預測學困生(student at-risk),並為其提供相應的幫助。大多數LMS包括5個部分:有和課程相關的學習資料、用於確保學生提交作業與完成測試的評價工具、用於溝通的交流工具(如郵件、聊天室等)、用於確保教師記錄和存儲學生的學習活動並發布活動截止日期的課程管理工具、用於幫助學生學習回顧和跟蹤學習進程的學習管理工具。在高校大量使用的BB(Blackboard)平台就是一個常見的學習管理系統。系統記錄了學生參與選修的網上課程的種類、在線時長、閱讀和瀏覽的文章數量,反映學習者的學習行為。2008年,Leah P.Macfadyen和Shane Dawson教授在加拿大不列顛哥倫比亞大學通過分析5個本科班級使用BB平台選修生物課的數據,建立了預測模型。平台記錄了學生課程材料的使用情況、參與學業交流情況和完成作業提交和考試情況。大數據時代教育數據記錄的層級性在這裏充分顯現,課程材料的使用包括記錄在線時長、郵件的閱讀時間、郵件的發送時間、討論信息的閱讀時間等。參與學業交流記錄了發布新討論的時間、回復討論的時間、使用搜索工具所花的時間、訪問個人信息的時間、文件的瀏覽時間、瀏覽誰同時在線的時間、瀏覽網頁連結的時間等等。評價模塊記錄了評價的閱讀時長和提交評價的時間等。通過應用統計工具描述散點圖,發現了在LMS記錄下學生在線時長和學業表現呈相關關系。在進行多元回歸時,研究者發現,學業成就處在後四分之一的學生在線時間略長於平均時間,而學業成就處於前四分之一的學生的在線學習時間低於平均水平。緊接著,研究人員為了作出預測,利用邏輯斯特回歸生成了一個預測模型,通過收集學生的新的行為數據,預測學生是否處於真正參與了學習活動,並得出如下結論:討論舉行的次數、郵件信息發送量和測評的完成情況這三個維度構成的模型可以預測學生的學業水平情況。
大數據時代,通過探求學生行為與學業水平之間的相關關系,建立模型,實現預測,能夠對課堂教學產生重要影響。然而,數據建模過程中,為了保證模型的效度與信度,極端個別數據被處理,使模型只能實現群體行為的預測,不能針對學習者個體實現定製化和個性化。
2.建模與預測的不足
數據建模與預測的背後充分體現了實證主義的思想和方法。19世紀上半葉,以孔德為代表的社會學家提出了實證主義的基本信條:利用觀察、分類,探求彼此的關系,得到科學定律。實證主義的哲學思潮到20世紀60年代,演變成一種科技理性,實踐知識逐漸染上了工具性的色彩,專業活動存在於工具性的解決問題之中,所有的專業活動都被視為釐定目標、套用已知的方法解決問題的過程。這一期間,大量的學科被系統地整合發展,甚至包括教育學和社會學這樣的「軟科學」。用證據解決未知的問題,用數據預測未來一時成為潮流。
學生活動行為數據的建模尤其側重體驗實證主義的思想,模型注重成功教學行為的共性,忽視教師與學生群體的獨特性需求時,科技理性的主導有可能使課堂教學被視為獨立於真實境脈的模塊,只要教學行為取得成功,就會被數據抽象化,形成模型,對學生群體行為產生預測。科技理性有賴於人們認同的共有目標,教學實踐目標的釐定極其復雜,包含巨大的不確定性和獨特性,甚至,由於社會角色的不同,還會帶來價值沖突。一個穩定的、為所有人所認同的目標不復存在,依據科技理性精神和方法推理預測的行為模式並不可能滿足每一個人的需求,教育變革在大數據時代下出現新的取向。
從數據模型到支持適應性學習
在數據建模的基礎上實現教學的適應性是大數據時代促進教育變革的另一成果。數據建模及行為預測依舊屬於科技理性指導下的行為模式,可能會造成忽視學生個性需求的現象,而個性化需求正是知識社會的重要特徵,個性化的教育也受到教育研究者、政策制定者和教育實踐者越來越多的關注。教育系統設計專家賴格盧斯認為,教育投入沒有達到效果的一個很重要的原因是忽視了社會的轉型。「社會已經從工業社會步入了資訊時代,勞動力市場對人才的要求不再是工業時代在流水線上操作的工人,而是具有創新性思維、決斷力強的知識性人才。」教學面臨從產生清一色的勞工轉向產生有判斷力和適應性能力的人群。2010年,OECD的報告《The Nature Of Learning》中指出,適應性能力(adaptive competence)是21世紀核心競爭力,包括在真實的境脈中靈活並有創造力地使用有意義的知識和技能。吳剛在《大數據時代的個性化教育:策略與實踐》中提出了個性化教育的必要性和必然性,指出「只有利用信息技術所提供的強大支持,才有可能真正實現個性化學習」。大數據時代的來臨,正是個性化教育發展的一個良好契機。2012年,美國頒布了《通過教育數據挖掘和學習分析促進教與學》,提出大數據時代,通過收集在線學習數據,對數據進行分類和探尋數據之間關聯的方式挖掘數據,形成數據模型。通過學生行為和模型的互動,形成適應性學習系統。概言之,我們可以以對行為數據的充分利用為基礎,改變教學的內容和進度,構建適應性評價和教學系統,充分實現教育的定製化,滿足學生的長尾需求。
1.案例分析:
適應性教學系統又稱適應性學習系統,(Adaptive Learning Support System),簡稱ALSS系統,強調基於資源的主動學習,認為學習不是知識的傳遞,而是學習者的自我建構。自上世紀90年代以來,研究者開發了不少適應性學習系統,如1998年De Bra開發的AHA系統,2003年,Brandsford和Smith開發的針對任務型學習的MLtutor系統,以及近幾年頗受關注的翻轉課堂(Flipped Classroom Model)簡稱FCM系統。
內容傳遞模塊:傳遞相關知識與信息支持學生的學習。
學習者資料庫:存儲學生在參與教學活動中的相關行為。
預測模塊:包括學生信息和學生行為數據,跟蹤學生的學習,並做出預判。
顯示模塊:為學生生成行為報告。
自適應模塊:根據學生行為生成的報告,反饋到預置模型,為模型做出相應的改變,使之更符合學生。
干預模塊:使教師、系統管理者和領導可以在系統運行時實施人為干涉。
學習者學習相關學科內容時,學習行為被記錄跟蹤下來,學生的學習行為數據被傳送到後台,記錄在學習者資料庫內,作用於預測模塊。預測模塊通過改變內容傳遞模塊,再次作用於學習者。在整個過程中,教師、教學管理者起干涉作用。
適應性學習系統是一個交互的動態系統,系統往往會提供給學生一些學習行為建議。奧地利針對學生的問題解決的過程設計了一個適應性學習系統。適應性學習系統的第一步是教育數據挖掘(ecational data mining),簡稱EDM。數據挖掘的過程包括數據收集、數據預處理、應用數據的挖掘和詮釋評價發展結果。Moodle提出了CMS數據挖掘系統(Course Management System)。研究者先使用原始數據進行建模,第一步是原始數據的收集,原始數據大約包含2007年73名用戶產生的28000活動例子,2008年97名用戶產生的265000份解決問題的案例和2009年45名用戶產生的115000個活動案例。除了記錄學生解答問題時產生的數據,原始數據還收集了學生的信息、問題的信息和解決問題的步驟;在對數據進行分類後,歸納出問題解決的類型,利用很擅長擬合連續數據的Markvo Models(MMs)的一個子模型DMMs擬合了如上的連續性數據,通過添加判斷學生學習行為的結果模型和一系列監控和調節模塊,構成了整個面向問題解決的適應性系統。當學生使用這個模型時,模型會根據學生的行為數據為學生提供他們所偏愛的解決問題的過程與方法。
除了適應性教學系統,還有適應性評測系統。LON-CAPA(Learning Online Network with Computer-Assisted Personalized Approach)是一個計算機輔助的個性化網路學習測評平台,平台不提供課程設計和課程目標,而是一個教學工具。CAPA通過後台記錄學生的基本資料,學生參與的互動交流、學業情況,針對學業課程中的疑難點,提供個性化的考試資源。
2.適應性轉向的意義
在大數據時代,科技理性指導下的模型預判在面對結構不良的問題時顯得應對能力不足。科技理性指導下的數據建模忽視學習的真實境脈,只能支持群體行為的預判,模型的推廣可能會使人們忽視其實踐成功背後的個體經驗與具體情境,從而導致科技理性與哲學思辨對抗。然而,完全依靠哲學思辨和經驗進行教學不僅不利於教育學科系統理論性的發展,也不利於課堂實踐的管理與教師的培訓。唐納德·A.舍恩提出了一種適應性思維模式。他指出:「如果科技理性的模式在面對『多樣』的情境時,是無法勝任、不完整的,甚至更遭的話,那麼,讓我們重新尋找替代的、較符合實踐的、富有藝術性及直覺性的實踐認識。」適應性學習是在系統理論知識的指導下,針對個體差異,使學習內容和活動高度個性化的學習方式。
適應性平衡了理性與經驗的兩難,英國學者Hargreaves(1996)首次提出基於證據的教育研究向醫療診斷學靠攏。臨床診斷學和教育的相似之處在於,他們都要面對變動不居、極其復雜的環境,在這樣一個結構不良的系統中,充分意識到客體(患者或者學生)的獨特性與共性,利用系統的專業知識解決問題。
Ralf St. Clair教授在參考醫學臨床實踐研究的三要素後提出基於證據的教育研究的三要素——研究的證據、教育工作者的經驗、學習者的環境與特點。其中,行為預測關注的是研究的證據,而適應性學習系統的建設則關注的是教育工作者的經驗和學習者的環境與特點。
從預測行為到支持適應性教學的轉向,是一種人文主義的轉向,教育研究的重點從關注研究的證據走向關注教育工作者的經驗與學習環境特點,關注以證據支持個性化學習的實踐變革。證據不再是其在科技理性時代所處的指導決策的角色,而是被視作一種資源,教育工作者在大量的基於證據的課堂教學決策中找尋最適合自己特點和學生特點的方式,推進課堂教學流程。也就是說,大數據的更重要價值在於支持適應性學習,滿足個性化學習和個性化發展的時代需要。數據的預測功能依賴於大數據收集數據的全面性與處理數據的便捷性,根據統計學原理對群體行為做出預測,一定程度上弱化了個體特徵和具體情境。其主要指向行為預判。而適應性是在模型與客體的交互作用上改變模型,如圖3所示,數據的適應性運轉模型比預測模型多了一個循環(loop until)系統,使其更加契合個人需求,其主要指向實踐改進。預測是支持個性化學習的基礎,而支持個性化學習是預測功能的深化和轉化——從整體人群到個體學習者、從理論模型到實踐策略的轉化。
分析與啟示
大數據時代由於數據量大,數據收集與攜帶便捷,使海量學生行為數據被挖掘、收集,通過數據建模對學習者行為的分析變得比前大數據時代更為全面和可靠。數據時代在數據的挖掘和預測上固然潛力十足,但是大數據時代更多的價值是滿足學習者的適應性長尾需求,在預測行為的基礎上,修改教學模式,使之個性化與定製化。從數據建模走向支持適應性教學,支持對象從群體轉向了個人,對教育活動的影響從對行為的認識轉向了教育活動的實踐,從科技理性指導下的去境脈轉向了基於真實情境的教學活動。
走向適應性,不僅改變人類行為方式,更重要的是改變了認知方式。前大數據時代人們在科技理性的指導下完全被數據證據左右(driven by the data),教師和學生、教育決策者和學校形成傳統社會契約關系,當事人把自己百分之百地交給專業工作人員,而專業工作人員遵守契約,對當事人全心全意地負責,從而使專業工作人員享受至高無上的壟斷性地位。大數據時代,教師不再是知識的控制者,他通過參與學生的學習活動,根據學生的先擁知識和認知特點、個性需求,不斷地調整教學步驟、教學進度和難度。學生不用完全將自己有如病人交付給醫生一般完全託付給教師。在學習的過程中,通過與教師的互動交流,在教師的協助下,成為自己學習的主體,控制並對自己的學習負責。由於教師精力有限,大數據時代下網路計算機輔助學習系統可以為教師和學生提供輔助指導的機會。
盡管如此,一方面,我們要擁抱大數據給我們帶來的便捷的生活和高質量的教育,另一方面,我們需要保持警惕和防止因果關系和相關關系的誤用,並且維護數據安全。
在推理方面,教育工作者需要警惕將相關關系和因果關系誤用,以Leah P.Macfadyen教授的前述案例為例,BB平台在線時間的長短和學生的學業成就有相關關系,而非因果關系,成績優異的學生在線時間低於平均在線時間,但不能說低於平均在線時間的學習導致學生成績優異而要求學生減少在線學習時間。
此外,在信息安全方面,學生和教師的大量信息被收集和使用,在使用的過程中,必須制定相關私隱保護法,保證信息的安全,警惕數據濫用。學生的行為數據也不可以作為教師教學評優的依據,讓大數據真正成為支持教學變革、提升教學效能、促進學生發展的手段,而不是控制教師和學生的工具。
D. 大數據對教育教學的作用
數據(data),一般而言是指通過科學實驗、檢驗、統計等方式所獲得的,用於科學研究、技術設計、查證、決策等目的的數值。通過全面、准確、 系統地測量、收集、記錄、分類、存儲這些數據,再經過嚴格地統計、分析、檢驗這些數據,就能得出一些很有說服力的結論。大規模、長期地測量、記錄、存儲、 統計、分析這些數據,所獲得的海量數據就是大數據(big data)。在製作大數據時,需要嚴格的方案設計、變數控制和統計檢驗等,不然所獲得的大數據就是不全面、不準確、無價值或價值不大的。
在教育特別是在學校教育中,數據成為教學改進最為顯著的指標。通常,這些數據主要是指考試成績。當然,也可以包括入學率、出勤率、輟學率、升學 率等。對於具體的課堂教學來說,數據應該是能說明教學效果的,比如學生識字的准確率、作業的正確率、多方面發展的表現率——積極參與課堂科學的舉手次數, 回答問題的次數、時長與正確率,師生互動的頻率與時長。進一步具體來說,例如每個學生回答一個問題所用的時間是多長,不同學生在同一問題上所用時長的區別 有多大,整體回答的正確率是多少,這些具體的數據經過專門的收集、分類、整理、統計、分析就成為大數據。
分析大數據助力教學改革
近年來,隨著大數據成為互聯網信息技術行業的流行詞彙,教育逐漸被認為是大數據可以大有作為的一個重要應用領域,有人大膽地預測大數據將給教育帶來革命性的變化。
大數據技術允許中小學和大學分析從學生的學習行為、考試分數到職業規劃等所有重要的信息。許多這樣的數據已經被諸如美國國家教育統計中心之類的政府機構儲存起來用於統計和分析。
而近年來越來越多的網路在線教育和大規模開放式網路課程橫空出世,也使教育領域中的大數據獲得了更為廣闊的應用空間。專家指出,大數據將掀起新的教育革命,比如革新學生的學習、教師的教學、教育政策制定的方式與方法。
教育領域中的大數據分析最終目的是為了改善學生的學習成績。成績優異的學生對學校、對社會、以及對國家來說都是好事。學生的作業和考試中有一系 列重要的信息往往被我們常規的研究所忽視。而通過分析大數據,我們就能發現這些重要信息,並利用它們為改善學生的成績提供個性化的服務。與此同時,它還能 改善學生期末考試的成績、平時的出勤率、輟學率、升學率等。
E. 「人工智慧」,「大數據」+教育如何驅動教育的未來
近日,由論答公司主辦的教育大數據研討會在北京舉行,討論會主題為「大數據+教育,有哪些可能性?」。本次研討會主要關注數據在教育領域的應用,具體包括自適應學習、學習數據分析和教育數據挖掘。來自賓夕法尼亞大學、人民大學、華中師范大學的專家和企業界代表,共同探討了教育大數據和自適應學習領域的技術趨勢和產業機會
Ryan Baker是國際教育數據挖掘協會(International Ecational Data Mining Society)的創始人、《教育數據挖掘》雜志(Journal Ecational Data Mining)主編,在各類期刊和會議發表了260餘篇學術論文,先後主持了美國科學基金會(National Science Foundation)、蓋茨基金會(Gates Foundation)等研究基金的多項重大項目,累計獲得研究經費超過1600萬美元。
他也在哥倫比亞大學教育學院和愛丁堡大學同時擔任教職,他在Coursera和edX上開設的「Big Data in Ecation(教育大數據)」課程,有來自100多個國家和地區的學生注冊。
研討會現場,Ryan Baker通過遠程視頻,分享了他對教育大數據的體驗和應用。據他介紹,目前在教育大數據領域主要有四大研究組織,分別研究人工智慧與教育、教育數據挖掘、學習數據分析和大規模學習。
Ryan Baker表示,在教育領域廣泛應用大數據的時代正在到來。教育數據挖掘有很多的應用方向,包括:預測學生是會輟學,還是會成功完成學業;自動檢測學生的學習投入程度、情感、學習策略,以更好地達到個性化;給教師和其他相關人員提供更好的報告;教育科學的基礎研究和發現。
他認為,個性化教育至少要做到三件事情:
1、確定學生的有關數據;
2、了解對於學生的學習來說什麼是真正重要的;
3、有針對性地為學生提供合適的教學。
而通過教育數據挖掘,我們可以推斷很多事情:
學生的元認知和求助。比如,這個學生有多自信?當他需要幫助時,有沒有在尋求幫助?他有沒有在給自己解釋問題,有沒有思考這個答案是正確的還是錯誤的?最重要的,當他面臨挑戰時,能否堅持下去?
沒有投入學習的行為。比如,「玩弄」系統,為了找到正確的答案,有的學生會試各種不同的答案,從「1」試到「38」。粗心,本身會做,但是不用心,最後給出的答案是錯的。有些孩子會做非常難以解釋的行為,比如不用方程符號,而是畫了一個笑臉。
學生情感。Baker的研究團隊和其他研究團隊,已經創造了研究模型,可以根據數據推斷,學生是否感到厭倦、沮喪、困惑、好奇、興奮、快樂,是否投入,等等。
長期的學習結果。比如,學生能夠記住剛才他學的東西嗎?學生准備好學習下一個主題、下一個知識沒有?中學生能上大學嗎?他會從大學畢業還是輟學?
Ryan Baker表示,要獲得這樣的推斷,只需要學生與系統交互的數據,不需要學生戴上頭盔檢測器。目前,這些模型已經開始大規模應用於自適應學習,應用於幾十萬的美國學生。Ryan Baker列舉了一些自適應學習系統的案例。
Knewton
通過系統決定學生下一個要學習的問題是什麼,已在全球的多個領域多個學科中運用。
ALEKS-ALEKS
用的是先行知識結構和知識點模型,來選擇最適合學生的學習材料。比如,一個學生在學習上出現了問題,系統能夠檢測出來,是以前學的知識點出了問題,然後讓學生回到以前的知識點上去學習。ALEKS系統應用於美國高中、大學的數學、科學學科。
Cognitive Tutor
系統能自動檢測學生的知識,直到學生掌握為止。比如,系統不會讓學生學習下一步的知識,直到他展示出他已經學好了他現在正在學習的知識。系統能夠給學校提供數據報告,學校根據報告能夠更好地讓學生投入到學習中去。每年大約被50萬的美國初高中生用於數學學習。
論答
論答公司的系統與ALEKS的系統有些類似,也是用先行結構和知識點模型,選擇合適的學習材料。同時也是自動檢測學生的知識狀態直到學生掌握為止。應用領域目前包括數學和英語,完全針對中國學生開發。
Reasoning Mind
用各種自動檢測的模型來檢測老師的教學是否有效。通過數據生成報告給每個地區的教學管理員,讓他們找到方法幫助老師提高教學。主要是用於美國的小學數學。
Duolingo
自動檢測學生記憶,來決定什麼時候回顧已經學過的知識。在全世界范圍內應用於外語詞彙的學習。
其他的像Civitas,Course Signals,Zogotech都是地區供應商,運用風險預測模型提供行動信息預測。它們會對學生做出預測,可能學不好、會失敗,把報告提供給老師。已在世界范圍內的大學應用。
Ryan Baker指出,在這些系統中,有足夠的證據證明,至少以下兩個系統是非常好的。
1、胡祥恩教授在美國做了大量實證研究,證明ALEKS系統對於幫助學生學習是有效的。他的研究證明,ALEKS系統對於不同人群的學生是同樣有效的;特別值得提出的是,ALEKS可以幫助少數人群群體提高學習成績。
2、Ryan Baker本人領導的研究團隊與論答公司合作的研究表明,學生通過論答系統學習,比通過傳統的在線學習系統學習,效果更好。他們在中國3個不同的地區做的3次實證研究,都證明了論答系統的有效性。
Ryan Baker分析了教育大數據演算法模型的潛在發展方向。他認為,這些模型的長期潛力是,通過學生的知識和學習模型來確認,學生什麼時候需要更多的支持:
首先是「mastery learning」,學生在掌握一個知識前,不會讓他去學習下一個知識。當學生需要支持的時候,自動介入;同時告訴老師和父母,這個學生什麼時候需要支持。
通過學習投入程度模型判斷,學生什麼時候開始變得厭倦、沮喪了,並調整學習活動,讓厭倦的學生不再厭倦,讓沮喪的學生的學習變得更容易一些。
學習投入程度模型還可以檢測,在線學習中,什麼樣的學習活動,能讓學生更容易地投入進去,並最終發現,什麼樣的學習活動對學生更好、對什麼樣的學生更好。
這樣的模型也能告訴老師和父母,學生什麼時候開始變得不再投入學習了。
還可以運用學習模型確認,學生什麼時候沒有真正學會,需要更多支持。
最後,Ryan Baker指出,下一步的目標是優化之前已經驗證的經驗和方法,然後把它們運用到系統中,最終讓中國和世界上的數十億學生受益。
討論:「因材施教」的千年理想該如何照進現實?
王楓博士,論答公司(Learnta Inc.)創始人兼CEO
胡飛芳博士,美國喬治華盛頓大學(George Washington University)統計學終身教授,中國人民大學統計與大數據研究院的教授
胡祥恩博士,美國孟菲斯大學(University of Memphis)心理系、計算機科學系、計算機工程系終身教授,華中師范大學心理學院院長
馬鎮筠博士,論答公司聯合創始人兼首席數據科學家
辛濤博士,北京師范大學中國基礎教育質量監測協同創新中心常務副主任、博士生導師,兼任國家督學、教育部基礎教育課程教材專家工作委員會委員、中國教育學會學術委員會委員。
技術發展到今天,「因材施教」如何實現?
王楓:因材施教,我首先到的是,每位學生學習的內容都不一樣。如果有新的技術或者系統,系統應該像一個好老師一樣,不會頭疼醫頭腳疼醫腳。比如說,一元二次方程做錯了,好老師不會簡單說一元二次方程做錯了,你繼續再做十道一元二次方程的題目,這其實是很差的老師,他沒有真正去全面評判學生,到底是哪些掌握好、哪些掌握不好。
一個好的老師可能會說,我全面地看了你整個學習,可能你的問題不是出在一元二次方程上面,老師看了你做的題目,一元一次方程沒有掌握好、因式分解也沒有掌握好,你繼續做一元二次方程是浪費時間。這就是從系統角度來說,系統做到了根據每個學生最基礎的先行知識點的結構,給你提供最適合你當前學習的知識點,題目也好、視頻也好、還有其他各種各樣的學習內容。
胡飛芳:因材施教是我們教育的理想狀態。孔子很早提出因材施教,在他當時的歷史環境裡面,因材施教可能更多是個體性的,因為那時學生少、老師也少,因材施教相對比較容易做到。
隨著歷史的發展,我們有更多的人需要教育時,我們做的一件事情是什麼呢?就是做了一個標准化。標准化做的是什麼?課堂教育。課堂教育從某種意義上來講是標准化。現在這個歷史階段,教育大數據可能真正要做到的就是因材施教,自適應學習本身想做的也是這個。
胡祥恩:因材施教事實上在學習理論里有兩個:一個是outerloop「學什麼」,一個是innerloop「怎麼學」。用技術來細化因材施教是教育產業走向成熟的一個標志。但是這個路非常非常難,因為「怎麼學」那個層次非常非常難。
馬鎮筠:「因材」代表認識到學生的個體化差異,「施教」指進行差異化教學,這是根本思想。但如果考慮到時代背景,孔夫子時代專注的是學生的職業發展方向,也就是說,把適合當政治家的培養成政治家,把適合當學者的培養成學者。現在再提因材施教,我們其實能做得更多、更精細化。
比如,「因材」,對「材」的分類不僅是職業方向,還會考慮到學生的學習狀態、學習目標、潛在能力、興趣偏好等。而且,傳統意義上的因材施教考慮的是學生個體間的差異,沒有重視學生本身狀態是在發生變化的,學生在不斷學習,狀態甚至興趣各方面都可能發生變化。
但這些是自適應學習能夠做到,甚至比傳統的因材施教做得更好的地方。再說到「施教」,現在我們能做的幾件事,包括學習路徑推薦,給不同的學生匹配他最合適的學習內容,這種非常精細化的層面,我們已經有了一定的技術積累。
怎麼判斷一個產品做到了真正的自適應?
馬鎮筠:大多數產品的學習過程可以分為測、學、練,可以從這三個環節去看這個產品做到什麼程度。
測,各種學習機構都有測評。但是國內只有論答團隊第一個做出來能夠在幾十道題內,精準判斷你一百個知識點,哪21個沒掌握,哪79個掌握了。市場上大部分競品,只會告訴你,知識點掌握率或者分數,79分或者知識掌握率達到79%;或者一些其他維度的總結,比如邏輯思維能力比較強、閱讀的磨煉技巧比較好、學習動力哪方面稀缺。他們做了降維,本來很復雜的學習狀態這樣說出來,相對比較容易實現。但如果要做到具體告訴你,哪些知識點掌握、哪些知識點沒掌握,這個難度就高很多了。
關於學習路徑推薦的話,很多題庫類的軟體,知識點學完之後,會給一些題目推薦,但真正實現路徑推薦的很少很少。路徑推薦也是很核心的,有20個知識點沒掌握,先學哪個知識點,後學哪個知識點,學習順序是非常關鍵的,必須遵循循序漸進的原則,哪些知識點是前提知識點,哪些知識點是後續知識點,隨機給你知識點去學習的話不能起到最好效果。真正到了練或學的環節,推薦什麼樣的視頻,先推視頻還是先推文字講義,推簡單題、中等難度題還是復雜題目,都需要根據學生實際情況來決定。
剛才只是舉了幾個例子,具體涉及到背後的演算法、整個系統跟學習內容的結合以及整個教學流程的實現,中間很多環節必須要打通,形成一個閉環,才能對最終的結果負責。
辛濤:我的研究領域是教育和心理學的測量和評價。我個人的學術觀察,基本上在現代這領域是兩個類型。一個是心理測量領域,有一套成熟的方法,包括早期的IRT(Item Response Theory)和現在的ADT。另外一個是人工智慧檢測。心理測量系統,是一小群人在做;人工智慧化是大的方向,現在是顯學,給大家提供了明顯的可能性。重要的是,那些背後的演算法,能夠在企業里真正實現出來。現在可能很多演算法已經在那兒了,大體上路徑是通的。
自適應學習基本上是把學習和評價聯動起來了。因為,要自適應學習,必須有一個系統隨時看到學生學到什麼程度,這個完全是評價。但是,評價完了之後有一個新的呈現。這一塊現在已經有一些很成熟的一些東西了,但不是一時半時可以說得特別具體的。
我做教育的測量和心理測量,人工智慧那塊我不熟。但是,從教育測量角度來說,在自適應學習和新技術結合之前,很大一塊還是自適應考試,CAT(computer adaptive test)。系列化產生一個CAT變成了一個自適應學習的過程。總的來說,使用最簡單、最機械化的方法,連續的CAT實際上是可以破解一個學習過程的。
測評本身經歷了好幾個階段,通常用三個應用介詞表示。
accessment to learning and teaching;
現在國家倡導的,accessment for learning and teaching,測評要對學習和教學有幫助;
跟信息化結合,accessment as learning and teaching,它是學習提供的完全融合的一個環節。
王楓:什麼樣的自適應學習系統才是真正的高級自適應學習系統?在中國的落地到底是怎麼樣才能真正落地?我在馬博士的基礎上想補充一點。
自適應系統如果一定要分級,也可以簡單分一下。一種最基礎的系統是基於規則的,比如說埋點。一個學生做10道一元二次方程題目,我預先埋好了,你做錯了,立馬給你推五道一元一次方程題目、五道因式分解題目。這個是埋點埋好了,這是規則,預先由老師或公式設置好了。
但這個規則有用性是非常有限的,因為每個學生不一樣,A學生是因為一元一次方程不會,B學生可能是因式分解不會,C學生可能連小學的乘法快速運算都不會,這個沒法預先直接埋點准備好。
所以自適應系統真正到了更高級一點的話,一定是真正通過大數據、根據演算法模型來分析學生的學習數據,匹配下一步應該學什麼。
在中國,自適應學習有效應用於教學有三個前提條件。做到這三點,自適應學習在中國的教育裡面前途無限。
好的產品。必須要有針對中國本土化的自適應學習產品,把它開發出來。像ALEKS系統的確演算法不錯,但裡面連一套國內的高考題都沒有,家長不會讓小孩子用這樣的系統,因為直接影響應試目標。真正本土化開發的話,沒有一成不變的演算法,世界上最好演算法就是沒有開發出來的。教育非常復雜,每個學科不一樣。比如數學後台有強大的關系,先行後續關系;英語沒達到數學這么強的相關性,但演算法是一樣可以應用的。
好的學生、家長、老師。有了好的產品,首先學生應該真正投入進去學習。像Ryan Baker教授講的,學生如果隨便學一下,再好的系統也沒用。第二,家長得督促孩子學習。第三,老師非常重要。老師應該做有價值的事情,比如給學生做個性化的輔導答疑,給學生針對性的講解,組織學習活動小組,鼓勵學生發揮創造能力,領導能力的培養。
學校以點帶面。學生大部分時間都在學校裡面學習。如果學校里最基本的、有效的在線教學產品都不應用的話,其實是有問題的。但是改變絕對不是簡單的行政命令可以解決的。一個好的產品,一定是從點到面,逐步推廣。自適應學習,更適合有明確目的的學習,像應試教育這塊可以做得更好。所以學校可以應用進去。
胡祥恩:我覺得大家做自適應也好、因材施教也好,比較好的例子大家可以看一看。教育這個領域有多大,自適應概念就該有多寬。所以說,實驗室裡面有很多小的做得非常非常好的東西,只是沒有到市場上面去,有很多非常非常巧妙的演算法、一些東西。你會發現很多歐洲的、美國的實驗室做的system,我每次看了都有種,自己是坐井觀天的感覺。
怎麼看待人工智慧在教育中的應用?
胡飛芳:AlphaGo跟master,谷歌做了一個非常好的廣告,人工智慧在某些方面可以做得非常好。但是,我現在給你們講另外一個谷歌自己不會去說的例子,但這也是事實。2008年、2009年的時候,谷歌推出一個免費產品,用各種搜集到的數據,預測美國的流感發展趨勢。開始時很成功,預測跟實際發生的情況很相似。但到2015年,他自動撤回去了,不再提供預測。因為在2012跟2013年預測的時候,預測結果跟實際情況相差非常遠。
這說明像這種不確定性的問題,人工智慧還有非常大的局限性。一旦有不確定的數據,就有噪音。數據量很大時,大數據可能產生大噪音。怎樣使噪音下降?2015年一個哈佛教授的研究團隊在谷歌的基礎上,用谷歌的數據去做同樣的預測。他用了什麼呢?就是用了模型,實際上模型在很多時候降噪是很有用的,用模型去預測,而不完全是人工智慧的方式去預測。結果,他做出來的預測基本都比較准。
人工智慧相對比較成功的,是比較確定的問題,所謂的確定是不管有多少種可能性,還是一個確定的東西。而流感很多時候是完全不確定的因素。
教育其實很多時候也是不確定的。同樣一個人,現在讓他回答這個問題,他可能思路清楚地回答出來;過了一個小時後,即使是同樣類型的問題,按道理他應該回答出來,結果他回答不出來。這是說,實際上有很多因素在干擾的時候,人工智慧的功能是不是會減少一點。把模型跟人工智慧加在一起,會彌補人工智慧在某些方面的弱點,這樣會更好。
怎樣促進商界和學界的交流,更好地把學界已經有的一些成果,運用到市場上來?
胡祥恩:教育產業應該是一個最大的產業,教育產業事實上是一個知識產業鏈。到目前為止,很多人認為自己要做一整套系統而在美國汽車業,最賺錢的是供應商,是做輪胎、做玻璃的。一旦標准化之後,一個人如果螺絲釘生產得最好,他就能夠養活幾家人、幾代人。
到目前為止,美國推的就是教育標准化,教育內容的標准化、教育技術的標准化。比如說97年的時候,就說怎麼樣把內容標准化,你做的東西我可以用。我只是做整個教育知識產業鏈裡面一個小塊,做得很好。教育整個的產業鏈,有可能發揮特別特別技巧的那些小的公司,就能夠在這個產業鏈裡面生存、可以做得很好。第一個是要標准化,第二個要理解整個教育是一個產業鏈。
F. 如何利用大數據及現代教育技術,輔助教師教學
無論你是在千禧年出生,還是在嬰兒潮時期降臨這個世界,今日的課堂與我們兒時的課堂相比,已經非常不同。
今日的小孩一上學就有平板電腦或者筆記本電腦,很多小孩拿到電腦時甚至還不能識字。一些國家為了讓學生適應基於電腦的標准化測試,要求二年級的學生必須具備每分鍾輸入60個單詞的能力。現在的小孩上學前就已經有姓名、住址、出生日期、醫學和行為記錄等數字記錄。
在課堂上應用技術和大數據的設想已經成為現實,並且正以非常快的速度在發展,快到我們都無法預測未來幾年內孩子們接受的規范教育將會變成怎樣。這是我們的生活已經離不開大數據的又一證據。但當這個事情發生在我們孩子的教育上時,到底是好事還是壞事呢?
形成反饋閉環和大數據在教育中的益處
就教育而言,最重要的地方一直都是形成反饋閉環。教師提出一個問題,然後學生嘗試去解決問題。從學生嘗試解決問題的行為中,教師可以發現學生理解了哪些內容,以及哪些內容是不理解的,然後再基於此對教學行為作出相應的調整。同樣的,學生在嘗試解決問題的過程中,也能加深對問題的理解。
這個閉環在一對一或者是師生人數比率較低的情況下,非常有效,但是當學生數量過多,同時不同學生之間的水平存在差異之時,要想創建這種有效的閉環就變得異常困難。這時大數據和技術就可以發揮作用了。
任何一名教師都可以帶著學生學一門課程,但是要做到對每個學生具體的問題進行精準定位,就沒有那麼容易了,尤其是在班級學生數量較大的情況下。一家名為Knewton的大數據公司開發了鋒顫一個數字平台,該平台分析了幾百萬學生(從幼兒園到大學)的學習過程,並基於這一分析來設計更加合理的測試題目和更加個性化課程目標。最近,該公司與Houghton Mifflin Harcourt建立了合作關系,開發出了K-12階段的個性化數學課程,同時還與法國創業公司Gutenberg Technology一道,開發了智能數字教科書。
簡單來說,這些課程和教科書能夠適應每個學生的差異。該程序可以根據學生的表現,判斷當前的題目的難度是否過大,是否太容易,還是剛剛好?然後,基於判斷實時的改變題目的難度。學生可以按照自己的節奏來控制學習進度,而不會受到周圍其他學生的行為的影響。然後,系統會給教師一個反饋,告知哪個學生在哪個方面有困難,同時給出全班學生的表現的整體分析數據。
那麼,這種教學方法有什麼缺點嗎?
大數據教育的阻礙
與其它所有使用大數據的應用一樣,在教育中使用大數據也有人表示出不理解和擔憂。人們最常擔心的問題就是數據泄露,而且這種事情已經發生過了。2009年的時候,美國田納西州的一個學區由於疏忽,將18000名K-12階段學生的姓名、住址、出生日期和完整的社旁基嫌保號碼暴露在了一個不安全的伺服器上,而且整個過程持續了數月。
人們的另一個擔憂是,這些數據會像以前學校曾經使用的神秘的「永久性檔案」一樣,一直伴隨學生的整個教育生涯。畢竟,一個學生在小學時被標記為「搗蛋鬼」,並不運手代表他上了中學之後還是「搗蛋鬼」,反而可能會變成另外一個完全不一樣的人。但是,由於他的數字檔案里依然標記其為「搗蛋鬼」,學校當局和老師可能會基於這個過去的評價來對待已經改變的學生,這顯然不合適。
另外一些團體還擔心,這些學生的數據將被用於商業營銷。理論上講,學校和大數據軟體開發商確實可以在特定的領域,向學生精準投放個性化廣告。或許,學生寫了一篇關於棒球的論文,然後就會收到關於當地棒球比賽的門票廣告。
教師角色的轉變
所有涉及數據的領域,從財經到零售業都會遇到這些擔憂和阻礙,但是在教育領域使用大數據還有另外一個問題——教師角色的轉變。隨著越來越多的技術和數據應用投入的教學中,教師的角色也應該隨之發生轉變,即由教學角色向數據驅動的管理角色轉變。然而,這是一個非常困難的過程。
優秀的教師選擇成為教師,主要是因為他們熱衷於教育學生。他們喜歡看到學生理解了一個問題之後,兩眼放光的樣子。他們也喜歡學生沉浸在一個知識點的時候,釋放出的熱情。不幸的是,這些優秀的教師對於讓演算法接管這一切感到不樂意,他們也不願意做一些數據輸入和管理工作,雖然這一切或許最終都能幫助學生走向卓越。
因此,大數據和技術或許並不是解決教育問題的靈丹妙葯。我相信,我們應該開發出一些應用來輔助優秀的教師進行教學,而不是用大數據和數據分析替代他們。最終,理解和應用數據及其分析過程,將像在其他行業一樣,讓學生和教師都從中獲得益處。
不知道各位如何看待這個問題,我們應該用數據記錄和分析學生在課堂上的一切表現嗎?還是我們應該保持傳統教學方式,讓大數據靠邊站?