導航:首頁 > 網路數據 > 大數據學生畫像

大數據學生畫像

發布時間:2023-05-27 07:52:11

1. 大數據來告訴你如何成為學霸

大數據來告訴你如何成為學霸

目前,川內各所大學即將開學。對於新入校的學生來說,大學生活該怎樣合理安排?如何才能在大學里煉成一個學霸?

別擔心,有大數據來告訴你!這不,由國內大數據領域的領軍專家、電子科技大學教授周濤等人共同研發的「學生畫像」系統,通過數據整合、分析,挖掘出每個學生的學習、生活狀態,預測出學生的掛科危險以及可能出現的「特殊狀況」。這個系統已經覆蓋電子科大兩萬余名本科生。

記者從電子科大教育大數據研究所了解到了「學生畫像」所統計出來的一些數據,那麼,現在我們就來看下,在大學里怎樣才能成為一個學霸。

排名均值越小,成績越好。

1 新奇的發現

打水次數減少35次學生成績相應降低了26名

電子科大教育大數據研究所成立於去年,數十名師生共同承擔著我國多項教育研究課題。周濤曾介紹研究所說,數據中心集中了學校上萬名學子的行為、消費等匿名信息,研究所基於這些數據,進行整合、分析與運用。

據介紹,目前學生的數據包括出入寢室的時間、進出圖書館的次數、借閱書籍的種類、在教學樓打水的次數、去澡堂洗澡的時間等。「學生畫像」的研究團隊首先會根據這些數據與實際行為的關聯性,「計算」出每名學生的學習、生活狀態,從而預測學生是否有掛科的可能,甚至還有輔導學生更好規劃自己學業的可能。

通過這一年時間的大數據統計,可以看出,在電子科技大學:總體上,女生平均成績好於男生;大二上學期,成績兩極化最為明顯。

同時,還總結出一個規律,學生成績波動之前,生活模式會先發生變化。比如,一名學生第一學期在教室打水的次數為53,他的成績在565位同學中排名200;第二學期,這名學生的打水次數減少了35次,他的成績也相應降低了26名。

2 如何成為學霸?

生活有規律多與成績好的學生做朋友

通過大數據研究,其實可以發現,學霸也是有規律可循的。這不,教育大數據研究所根據這些數據,繪制出了「學霸」和「學渣」的學習生活軌跡。來,一起看下,想要成為學霸,你要做些什麼?

一、去圖書館和教學樓次數越多,成績越好

在大數據研究所提供的圖表一上,記者可以看到橋擾,第一學期,成績最好的學生進入圖書館的次數為55次,成績最差的學生進入圖書館的次數為35次;到了第四學期,成績最好的學生進入圖書館的次數為61次,成績最差的學生進入圖書館的次數為18次。

正如圖表所顯示的,「學生畫像」的研究團隊通過大數據分析,發現出入圖書館次數比較多的學生,成績要優於出入圖書館次數比較少的學生。而同一名學生,隨著出入圖書館次數的增多或減少,成績排名在上下浮動。

同樣的情況也存在教學樓,學生去教學樓飲水機上打水次數越多,就說明學生長期在教學樓歷譽里活動。第三學期的數據顯示(圖二),成績最好的學生在教學樓打水近80次,成績最差的學生在教學樓打水不到10次。這也說明,經常在教學樓活動的學生,成績就越好。

二、生活、學習有規律的學生,成績更好

研究人員通過分析全校本科生進出宿舍、在食堂吃飯、去澡堂洗澡等記錄,發現成績好的學生除了在教學樓打水次數比較多之外,生活、學習等行為習慣比成績差的更有規律。

以吃早飯的次數為例(圖三),第二學期,成績最好的學生吃早餐次數在110次,成績最差的學生吃早餐次數僅為60次。也就是說,9點前出現在食堂吃早餐的同學,成績也相對更好。

除此之外,研究還發現,在固定時間進出宿舍,在宿舍的平均時長少的學生,成績遠遠高於經常宅在宿舍的學生。

三、身邊朋友成績較好,自身成績也相對較好

大數據顯示,學霸的身邊總是圍繞著學霸,身邊朋友成績較好,自身成績也相對較好。

電子科大教育大數據研究所有專門分析「朋友圈」的模塊,主要分析同校的朋友。「兩個朋友關系越親密,共同行動肢消段的概率就越大,而陌生人之間則不然,這是已經經過仔細驗證的結論。」基於此,研究所的專家們對學生們的共現頻率進行了統計分析,凡是兩兩間較短間隔內在同一場所,研究人員都進行了記錄,以此獲取兩人的關系親密程度,超過某一親密程度的則為朋友,以此獲取每個人的朋友圈信息。此後,研究人員再結合學生基本信息,獲取學生與朋友之間的標識,如室友、同班、同學院等,進而進一步分析學生的交際能力與偏好。

研究人員在分析了學生和朋友們之間的成績之後,得出一個研究結果:學生自身成績與身邊朋友的成績具有很強的相關性。

3 科研人員建議

大學新生們 這樣做你也能成為「學霸」

基於以上的研究成果,教育大數據研究所也給出了一定的建議:

生活習慣很重要,請注意保持生活的規律性,早上6點起床跑步讀書吃早餐而不是8點起床飛奔去上課,你這一天的感覺會完全不一樣;

一定要抽時間鍛煉身體,不要天天宅,睡懶覺和打游戲不如出去跑跑步,打打球;

不要迷戀網路游戲;入學就打好學習基礎;多去教室圖書館學習。

4 掛科預警

推送給輔導員及時調整學生的學習狀態

除了教你如何成為「學霸」之外,「學生畫像」還可以幫學生預測成績,發出「掛科預警」。

據介紹,掛科預警就是通過學生學習基礎以及由日常行為特徵體現出的努力程度,綜合分析提前預測學生掛科可能性,並將掛科可能性較高的群體發送給輔導員,幫助他們提前引導,有效提升學生的學習成績。

研究人員告訴記者,掛科預警主要從三個方面分析:一是刻畫學生生活與學習的規律性。比如,如果某學生最近幾個月作息極不規律,那麼他的成績就會有下滑的可能;二是分析課程相關性,先導課程的掌握程度對後續課程的成績有大的影響。比如,如果某學生微積分—I分數在及格邊緣,那麼後續課程微積分—II就有較高的掛科可能性。三是計算學生在該課程上付出的精力。比如,如果發現該生在圖書館從未借閱與微積分課程相關的圖書,那麼他在該課上掛科的可能性會進一步提高。

依據這些分析,系統便可計算出學生的掛科可能性,類似於「電磁場與波有87.5%的可能性掛科」這樣的信息就會推送給輔導員,由輔導員介入調整學生的學習狀態。

5 如何保護隱私?

不強調個人情況對異常狀況提供人文關懷

通過數據挖掘獲知學生在校行為記錄,這是否意味著學生的行蹤被監控,侵犯了學生的隱私權?

其實不然。教育大數據研究所副所長連德富強調,如今,「大數據」已滲透到生活的各個領域。學校做數據收集,不會去強調每個人的情況,而是察看學生整體的學習生活狀況,及時預測預警學生異常狀況,為學校的決策提供數據支撐。比如,根據學生就業能力情況,學校及時開展個性化引導,提升學生就業水平;根據學生實際消費情況,找出隱性困難學生,提升學校人文關懷等。

2. 大數據精描幼兒畫像為評價賦能

但是,如何科學合理地捕捉碎片化的行為,通過對幼兒行為的研究,進而總結幼兒學習、生活、興趣等方面的特徵和規律,成為擺在學前教育研究者和實踐者面前的重要課題。

隨著大數據技術在教育領域的廣泛應用,基於證據和大數據的教育決策機制逐步形成。利用大數據技術分析幼兒學習行為,有利於改進評價工作、提升保教質量。

對接五大領域,把握評價設計的內涵與要素,促進幼兒評價的全面性

幼兒教育領域內利用大數據技術分析幼兒學習行為,通過學習者建模、學習行為預測、學習評價等學習技術和系統的應用,能夠幫助教師合理配置教學資源、改進教學策略。近年來,用戶畫像的概念也初步出現在教育領域,稱作學習者畫像。作為一種數據分析工具,在大數據技術基礎上,將用戶的屬性特徵分為自然屬性、 社會 屬性、心理屬性等,建立用戶數據的數學模型,對收集到的用戶數據進行統計分析,從而以標簽的形式表示出用戶的「全貌」。

《3—6歲兒童學習與發展指南》從 健康 、語言、 社會 、科學、藝術五個領域描述幼兒的學習與發展,每個領域按照幼兒學習與發展最基本、最重要的內容劃分為若干方面。幼兒發展對應這五大領域,支持幼兒發展的評價也應基於這五大領域,自然地、完整地貫穿教育過程的整體進行,這樣才有可能全面、准確地刻畫幼兒發展的質量,為幼兒教育發展質量提供評價參考。

幼兒畫像利用AI音視頻分析、物聯網、大數據、雲計算等技術,建立幼兒、教師、家長、幼兒園之間信息無縫互聯通道,推動幼兒園現代化與信息化建設與改造。根據幼兒園的需求,將幼兒在園內各種行為數據捕捉以後自動統計歸檔,從評價入手,深描幼兒,形成幼兒畫像。

《綱要》在關於對幼兒發展狀況評估的指導要點上指出:「在日常活動與教育教學過程中採用自然的方法進行。平時觀察所獲的具有典型意義的幼兒行為表現和所積累的各種作品等,是評價的重要依據。」 因此,基於《綱要》和《指南》,建立幼兒畫像標簽體系,將幼兒一日在園活動的學習行為進行數據收集、數據存儲、數據標注、數據處理與數據開采,能夠全面、系統地反映出幼兒的行為規律和特徵,形成幼兒畫像。

例如,對 健康 領域的幼兒畫像,可以通過長期捕捉幼兒在園的生活習慣與行為習慣,將其歸類於 健康 標簽上,結合人口統計學要素及場景描述,可以呈現每個幼兒的用戶畫像。

此外,還可以將畫像技術運用於幼兒在園學習活動中,利用多種校園數據對幼兒進行綜合分析。採集幼兒在集體教學、戶外運動等方面的實時數據,對幼兒問題行為等進行預警與反饋,及時推送信息給教師和家長,有助於教師和家長把握幼兒的活動動態,表揚鼓勵積極向上的行為,對不良行為習慣及時進行糾正,引導幼兒向正確的、積極 健康 的行為發展。

基於大數據的幼兒畫像技術能夠更科學、更精準地了解幼兒學習動態,豐富幼兒行為表現評價手段,提升幼兒管理水平,進而促進幼兒全面 健康 成長,也為教育教學、教育管理的決策和規劃提供更加可靠的依據。

強化系統對接,助推評價結果的整合與應用,完善幼兒評價的協同性

教師基於幼兒畫像可以更加深入地了解幼兒在戶外、室內集體學習、區角活動的動向,把握幼兒學習的興趣點,以便從幼兒出發設計真實而富有趣味的情境,開展有效的教育教學活動。

如在區角活動中,在對已有區角活動學習資源配置策略分析的基礎上,以幼兒進出區域的頻次與停留時間,判定幼兒對區域的偏好。此外,基於對幼兒與區域內學習資源交互的學習行為數據分析,結合區域活動發展目標,建立學習行為影響學習資源優化的因素模型。採用機器學習的方法對幼兒區域活動視頻進行目標檢測,形成幼兒和學習資源交互的 歷史 記錄。使用模式識別的方法從交互的 歷史 記錄中發現隱藏的學習行為模式或幼兒對學習資源的偏好,進而優化學習資源配置,形成對幼兒各個階段不同區域發展目標的學習行為分析模型。

幼兒畫像還能提升家園共育水平。對於家長而言,基於幼兒畫像分析技術可以清楚了解孩子在園的情況,如出勤、 健康 、興趣、學習等。基於孩子在園真實情況,家長和教師可以在各自觀念和利益表達的基礎上,就某個共同目標或分歧進行有效協商,更好地實現家園合作、家園共育。

與此同時,幼兒畫像技術可以助力構建家園互信的良好環境。近年來,涉及家園矛盾事件的新聞報道頻發,影響了家長對幼兒園的信任。幼兒園應提升園所的軟硬體設施,想家長之所想,減少家園矛盾事件的發生。幼兒畫像技術提供幼兒在園的海量數據,對於提升家長對幼兒園的信任程度,構建家園互信的良好環境,必然具有促進作用。

(作者單位:南京師范大學教育科學學院)

《中國教育報》2020年11月22日第2版

作者:劉曉紅 趙麗

3. 有哪些軟體可以做大數據畫像

TempoBI可以做大數據畫像,給你看一個用他做的員工與學生畫像截圖。

4. 大數據里的青年是什麼樣子

90後海歸研製的馬桶能智能體檢;南京餐飲業求職者7成是90後,平均薪資排全國第二;00後們其實很認同傳統美德,九成認為成功要靠自己奮斗……昨天(5月4日)是五四青年節,QQ、淘寶、口碑、58等多家互聯網機構出台了各種角度關於年輕人的大數據畫像,讓我們來看看這里有沒有你熟悉的年輕人。

畫像三

南京餐飲業平均薪資6447元,求職者七成是90後

「四千塊你就想請個服務員?你想多了吧!」這個前兩年流傳的段子或許正在變成現實。58英才招聘研究院聯合口碑剛剛發布的今年1至4月全國重點城市餐飲業用工分析報告顯示,北上廣深、南京等一二線城市餐飲用工缺口巨大,餐飲人員供不應求直接拉高了餐飲企業薪資水平,服務員薪水最高的重點城市依次是北京、南京、廣州、上海等。其中,南京餐飲企業平均支付薪資水平已達6447元。

數據顯示,2018年1-4月,餐飲業企業招聘量城市前十位依次是北京、廣州、深圳、上海、成都、杭州、重慶、武漢、西安、蘇州。餐飲行業員工流動性較大,一直是用工需求最大的行業之一,招人難、留人難已成為絕大多數餐飲企業面臨的問題。

統計數據還顯示,餐飲業企業支付薪資水平城市前十位依次是北京、南京、廣州、上海、深圳、杭州、合肥、蘇州、西安、武漢。其中,北京的餐飲業企業薪資標准居全國第一,為7656元,其次是南京、廣州、上海、深圳,分別為6447元、6377元、6331元和6196元。值得一提的是,南京的餐飲業平均薪資超過了廣州、上海、深圳等一線城市,僅次於北京。

什麼樣的人應聘餐飲業最多?58英才招聘研究院數據顯示,餐飲業求職者中,90後佔比最高,達到72.5%。

以上內容來自:揚子晚報

5. 大數據告訴你:學霸是怎樣煉成的!

大數據告訴你:學霸是怎樣煉成的!

近日,國內大數據領域領軍專家、電子科技大學周濤教授與有著近十年學工部長教育 經驗 的呂紅胤研究員,花費了近大半年的時間,聯合研發出一套「大數據」系統——「學生畫像」。

該系統利用校園一卡通追蹤學生行為軌跡,通過對學生吃飯、打水、出行、消費行為記錄,「算」出每名學生的 學習 、生活狀態。更厲害的是,通過對學生日常學習狀態的追蹤,該系統還會對學生的期末成績乃至 大學四年 後的 就業 情況作出預警——

註:系統用排名均值來計量學生成績的優異。排名均值=學生在所在專業的年級排名/本專業的總人數,排名均值越接近0,代表該學生的成績越好。

學霸是如何煉成的?

學霸出門時間通常比較固定

研究人員分析了近半年的 宿舍 門禁、吃飯、進出圖 書 館等刷卡記錄,發現成績較好的學生作息時間比成績差的更規律。

例如,某 專業排名 第3的小雪,幾乎每天固定在8點、12點、14點三個時間點出門,留在宿舍的總時長低於專業平均水平。而該專業成績排名第61的小石每天進出宿舍的時間很隨機,而且通常每次外出的時長不超過2小時,「宅指數」明顯高於專業平均水平。

此外,研究人員還發現,9點前出現在食堂吃早餐的同學,成績也相對更好。

學霸最愛在晚上10-11點洗澡

上圖中,橫軸代表了時間點,豎軸則代表了在當前的時間點下,學生的洗澡概率。電子科大的澡堂是全天開放的,但研究團隊發現,晚上10——11點,學習好的學生與學習差的學生洗澡概率出現了較大的差異。簡言之,集中在晚上10到11點之間洗澡的學生成績更優異。

不管是出門時間還是洗澡時間,抑或是相對固定的早餐時間,都是學生作息規律的具體體現。研究人員發現,較有規律的學生群體,除了成績上的優勢外, 考研 成功 率以及 出國留學 獲得獎學金的概率均高於一般學生。這也從側面印證了生活的規律性對於成績有正面影響的結論。

學霸愛泡圖書館和自習室

在樣本量足夠龐大的情況下,學生在一定時期內的行為追蹤確實可以反映他的學習和生活狀態。比如,如果一個學生的打卡記錄顯示,他長期在教學樓的飲水機上打水,那一定程度上就說明了,教學樓是他的長期活動地點。

「學生畫像」的研究團隊,通過大數據分析,發現了出入圖書館次數多少與學習成績的好壞存在著一定的相關性,即:出入圖書館次數比較多的學生,成績要仔碼優於出入圖書館次數比較少的學生。同一個學生,隨著他出入圖書館次數的增多或減少,他的成績排名在上銷戚仔下浮動。如圖↓↓

這樣的相關性,同樣適用於學校的教學樓↓↓(註:在教室打水代表該學生出現在了教學樓~)

學霸也扎推?

現實中,每個人都會受到種種環境的影響。無疑,處於校園之中,身邊人的學習狀態,自然也會影響到學生自身的成績好壞。

研究團隊發現,如果一個 大學生 ,他身邊的朋友成績比較好,那他自身的成績也相對較好!

想要成為一枚學霸?先找個學霸好友吧——

期末會不會掛科?算一下吧

在這項研究中,研究團隊專門設計出了一系列輔助學生更好完成大學學業的功能模塊——「掛科預警」。

想知道你學期末會不會掛科?那就算一算嘍!

掛科率= 努力 程度 + 學習基礎;

努力程度依據:教學樓打水頻率+進出圖書館的時間與次數;

學習基礎:用已考科目成績、已考與將考科目之間的關聯性算出;

一旦你的掛科率觸碰到了預警紅線,那系統便會自動為負責你學習的輔導員推送預警信息!

「前方高能預警,您的掛科率有偏高趨勢,請好好學習——」自從有了「掛科預警」系統,媽媽再也不用擔心我掛科了——

四年後,你會成為失業大軍中的一員嗎?

如今,就業形勢一年比一年緊張。作為學生,你在擔心 畢業 即失業?作為高校的管理者,你會困惑於如何幫虧汪助學生突破重圍嗎?嗯,好消息來了!

「學生畫像」研究團隊通過大量的數據分析,研究得出了一個學生的畢業去向與他在校期間的生活規律有著一定的關聯性。

電子科技大學教育大數據研究所副所長、原微軟亞洲研究院的連德富教授在接受中國青年報(ID:zqbcyol)采訪時表示,通過對比往屆 畢業生 的畢業去向,他們發現,就業困難學生群體身上確實存在某些相似的行為特徵。比如,與其他同學相比,就業困難學生在校期間的生活普遍不太規律。此外,就業困難學生在圖書館的借閱書目也更偏向於懸疑科幻小說以及與游戲相關的 書籍 。

近年來,越來越多的大學生畢業後選擇 創業 。麥可思研究院研究發現,包括本科畢業生和高職專院校畢業生在內的中國大學生畢業後選擇自主創業的比例基本呈逐年上升的趨勢:2007年1.2%,2008年1%,2009年1.2%,2010年1.5%,2011年1.6%,2012年2%,2013年2.3%,2014年2.9%。

在連德富教授看來,大學里的創業一族也有「大數據」特點。偏好創業的學生跑市區的頻率要高於普通學生。

6. 什麼是大數據畫像

大數據畫像是指,在大數據時代,企業通過對海量數據信息進行清洗、聚類、分析,將數據抽象成標簽,再利用這些標簽將用戶形象具體化的過程。

用戶畫像的建立能夠幫助企業更好地為用戶提供針對性的服務。與之相應,越來越多的第三方大數據公司,也開始依託自身的數據積累,為客戶提供用戶畫像的服務。

比如個推旗下的用戶畫像產品,能夠對用戶線上和線下行為進行大數據分析,幫助APP開發者和運營者構建全面、精準、多維的用戶畫像體系。用戶畫像的形成需要經歷四個過程,數據積累、數據清洗、數據建模分析、數據產出。

其中,數據清洗和數據建模統稱數據處理。在經過數據處理之後,個推產出獨特的冷、熱、溫數據維度,並分析用戶的線上興趣偏好和線下行為場景,形成用戶畫像。

為什麼需要用戶畫像

用戶畫像的核心工作是為用戶打標簽,打標簽的重要目的之一是為了讓人能夠理解並且方便計算機處理,如,可以做分類統計:喜歡紅酒的用戶有多少?喜歡紅酒的人群中,男、女比例是多少?

也可以做數據挖掘工作:利用關聯規則計算,喜歡紅酒的人通常喜歡什麼運動品牌?利用聚類演算法分析,喜歡紅酒的人年齡段分布情況?

大數據處理,離不開計算機的運算,標簽提供了一種便捷的方式,使得計算機能夠程序化處理與人相關的信息,甚至通過演算法、模型能夠「理解」 人。

7. 教育大數據是什麼教育大數據作用有哪些

本文主要內容是介紹教育大數據的定義與作用,在了解教育大數據前我們首先要了解什麼是大數據。大數據技術是21世紀最具時代標志的技術之一。國務院發布的《促進大數據發展行動綱要》中提出「大數據是以容量大、類型多、存取速度快、應用價值高為主要特徵的數據集合」。簡單的說,大數據就是將海量碎片化的信息數據能夠及時地進行篩選、分析,並最終歸納、整理出我們需要的資訊。

教育大數據,顧名思義就是教育行業的數據分析應用。

而大數據,則需要具備5V的特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。

其中的「大」主要指的是 Volume(大量),我們現階段用的數據分析,大部分情況下的數據量還達不到這個「大」的級別。

教育行業在數據分析的應用方面,主要痛點有以下四個方面:

1.數據涉及面窄

數據主要來源為數字化校園系統產生的,其他教學管理的數據多為手工錄入非結構化數據

數據維度少,數據來源不足。

2.數據介面不完善

內部信息系統的教務系統、一卡通系統、圖書館系統、財務系統等數據都不規范一致,數據結構也不一樣,各業務系統介面對接難度大

業務介面與數據結構還不規范

3.缺乏統一的數據管理平台

沒有統一的數據處理中心對數據進行管理,沒有人力維護各系統的接入

有效數據量少,數據質量差,達不到大數據處理分析要求

在具體的應用方面,即數據分析體系搭建上,可以在以下四個方面開展。

1.教務管理

在這方面可以進行招生分析、就業分析、住宿分析、圖書館分析、資產數據統計分析等。

2.教學創新

在這里可以進行教學質量評估、上網行為分析、學生成績分析、學生特長能力分析

3.應用創新

可以進行學生軌跡分析、學生畫像、學生輿情監控

4.科研支撐

可以開展科研成果分析統計、科研項目研究、科研經費跟蹤研究,對整個科研情況有全面的了解和掌握。

1.大數據或把老師從作業批改中解放

在線教育除了能以優質教育資源為學生提供幫助外,對廣大家長、老師和學校也大有裨益。蘇靜以作業幫家長版的「口算批改」功能為例介紹,家長或老師只需要用手機對著學生作業一掃,就能立刻對作業完成智能批改,顯示出批改結果,能夠大大節省老師和家長批改作業的時間。

事實上,隨著人工智慧等新興技術的深入應用,在線教育平台能夠為家長、老師、學校提供更有效的教學輔助。

2.因材施教,將更有的放矢

「人工智慧+大數據精準教育」系統能利用大數據技術,完成對學生學習進度、學力、習慣的跟蹤和分析,系統後台能夠准確對用戶進行用戶畫像,找到他們的知識薄弱點,形成用戶學情報告,這可以幫助老師和學校更細致地了解每一個學生的情況,並有的放矢地制定更精準的學生學習計劃。

8. 如何利用大數據進行個人畫像

首先要知道,社 交網 站、購物網 站包括你使用的蘋 果、安 卓手機,是沒有權 限竊 聽你的電話或者盜 取你的搜 索資料的,只是你的行為數據讓你的手機意識到了你具體想要什麼。再例如,你注 冊一個賬號,需要輸入自己的名字;手機號;性 別;所在地;這些是微不足道的基礎數據。當然還有你的消費記錄;打 車頻率;瀏 覽的公 眾號類型;玩過的游戲...這些行為最後統統會變成幾千個事實標 簽,成為你行為數 據的一環節。採集標簽的目的,就是為了構 建用戶畫 像,從雜 亂的標簽當中,最終模 擬一個和你興趣、愛好、思想相近的「你」。例如,你玩手機看到一篇內容標簽為「美 女」的文章,而這並不表明你真的喜歡美 女,也可能是手 滑點的。因此,手機判 斷你的興趣喜好還要根據瀏 覽的停 留時間、搜 索次數、是否評 論轉 發等等。當然,這關繫到一個初級的內容標簽 權 重演算法:興殲襪態趣標簽( 美 女 )權 重 = 行為權 重 x 訪問時長 x 衰 減因子行為權 重:什好判么都不幹 1 分,評 論 + 0.5,點 贊 + 0.5,轉 發 + 2,收 藏 + 1時長權 重:10S 以內權重為 0.5,10S-60S 為 1,60S 以上為 2衰 減因子:0 - 3 天內權 重為 1,3 - 7 天權 重為 0.85,7 - 15 天權 重為 0.7,15 - 30 天權 重為 0.5,30 天以上權 重為 0.1。興趣標簽權 重和你的閱讀時長、評 論、點 贊、轉 發收 藏有著密 切關系,並氏源且不同操作有著不同的加分數值,最終累 積成行為權 重。這點有點類 似網 易 雲在私 人FM為你推 薦的歌曲類 似。停留時間越長,時間權 重也隨之越高。你經常瀏 覽美 女,評 論關於美 女的文章,看關於美 女的視頻,手機會將你一段時間內所有關於美 女的興趣權 重累 加,再以S形函數標准化,最終得到一個從0到10的興趣標簽值。這個數值越高,你就對含有美 女的內容越感興趣。不僅僅局 限於內容興趣,這種算 法還能夠根據你的消費能力、消費興趣、社交習慣等多個維 度建立用 戶畫 像,並計算你的喜好。之後,這些喜好會被轉換成特 征向 量,比如你的美 女興趣標簽值是8,消費能力是5,社 交偏 好是2,那麼向量表示為r(8,5,2)。我們可以將特 征向 量想像成一個多 維空 間的一個坐 標點,通過每個用戶的向 量坐標去帶入余 弦公式或距離公式中,就能計算出和你相 似的人,進而把用 戶分類。這是一個大工程。但是行為數 據只能計算出你的喜好,而無法判 斷出你的性 別、學歷等深入的個 人屬 性。這需要將已知性 別和學 歷的用戶作為樣 本,一些用來訓練模 型,一些用來測 試精 准 度。現如今,各大平 台對於用戶性 別的預 測准 確 度達到90%以上。因此,你的手機就能夠得到大致這樣一個用戶畫 像,它包含了你的各項興趣權 重:所以說,A P P根 據這個畫 像,便根據類 似的廣告信息,找到對應的消費 者。

9. 華雲數據為合肥財經學院量身定做了哪些大數據解決方案

合肥財經學院數據分散,需要建設大數據管理平台,

10. 大數據計算你和學霸的距離

大數據計算你和學霸的距離

在成都最冷的20天里還能堅持早起吃早餐;總是在晚上10點到11點之間洗澡;在教學樓打水近80次……正值開學季,電子科技大學教育大數據研究所的數據顯示,普通的你,和學霸之間,恐怕就差了這些「微不足道」的行為。

這個頗有意思的發現,來源於覆蓋了電子科大兩萬余名本科生的大數據系統——「學生畫像」,其將每名學生幾乎所有的在校活動軌跡與成績之間建立了關聯。利用這些數據,不僅能預算出學生的學習狀況,研究者還希望依此引導他們更好地規劃各自的學業和就業方向。

學霸的生活軌跡

傳統教育認為,學生有規律的生活,是學生提高成績的重要保證。

「普遍情況下,良好的行為習慣與學習成績是呈正相關的,這基本是得到公認的。」21世紀教育研究院副院長熊丙奇表示,這些行為習慣,有的與成績變動直接相關,例如學生按時上下課,常去圖書館等;還有一些與成績的變動是間接相關的,比如養成早起的習慣,經常洗衣服,有規律的打水等。「雖然不直接作用於學生的學習,但是,好的生活習慣,反映的是學生積極的狀態,說明學生自我管理的能力較強。那麼,這些學生用在學習上的時間也相對有保證,也就勢必會對學習成績產生影響。」

不過,必須承認,這個被普遍接受的結論很難被定量描述。「如果我們能定量地證明已有的依據,並提出科學的可參照的建議,這項研究就是有價值的。」電子科技大學教育大數據研究所副所長連德富這樣解釋這項研究的初衷。

如今,研究團隊已經花了一年多的時間記錄學生的校內行為,包括吃飯、購物、打水、進出圖書館、借閱圖書、宿舍門禁、洗澡、使用洗衣機、乘坐公交等。結果發現,學霸有著與一般學生完全不同的學習生活軌跡。

以某專業排名第3的學生為例,她幾乎每天固定在8點、12點、14點三個時間點出門,留在宿舍的總時長低於專業平均水平。而該專業成績排名第61的小石每天進出宿舍的時間很隨機,而且通常每次外出的時長不超過2小時,「宅指數」明顯高於專業平均水平。

此外,成績最好的學生吃早餐次數在110次,成績最差的學生吃早餐次數僅為60次。9點前出現在食堂吃早餐的同學,成績相對更好。成績較好的學生集中在晚上10到11點之間洗澡,而成績較差的學生,洗澡時間無明顯規律。

除作息規律以外,進出圖書館次數也是重要指標。第一學期,成績最好的學生進入圖書館的次數為55次,成績最差的學生進入圖書館的次數為35次;到了第四學期,成績最好的學生進入圖書館的次數為61次,成績最差的學生進入圖書館的次數為18次。

同樣的情況還存在於教學樓。學生去教學樓飲水機上打水次數越多,就說明學生長期在教學樓里活動。第三學期的數據顯示,成績最好的學生在教學樓打水近80次,成績最差的學生在教學樓打水不到10次。

尤其讓連德富印象深刻的是,不同成績的學生在借閱圖書的種類上也有明顯的區別。他發現,《蝴蝶公墓》《變態心理學》等帶有懸疑色彩的圖書,借閱者的成績普遍不理想。

過去,要想清楚地知道不同成績水平的學生群體與他們的行為特徵之間一一的對應關系是非常困難的,但有了大數據的幫助,一切變得簡單起來。

「學生畫像」還能做什麼

僅僅根據學生行為習慣的數據統計,就可以制定出學霸路線嗎?

要想精確刻畫一個人需要用無數的數據,但連德富認為,校園就是一個擁有豐富數據的很小的社會系統,只要這些數據能與目標聯系起來,就有一定的指示作用。

事實上,「學生畫像」的首要功能,就是算出每名學生的學習、生活狀態,並設計出一系列輔助他們更好規劃各自學業的功能模塊。目前已經實現的是掛科預警。

據了解,研究團隊設計了一個針對掛科率的公式,即過去的學習基礎+一段時期內的努力程度。學習基礎是根據已考科目成績、已考與將考科目之間的關聯性計算得出的,而努力程度則主要依據教學樓打水頻率、進出圖書館的時間與次數等。

如果有學生正處於掛科率高風險的邊緣,系統就會自動向負責該名學生的輔導員發送預警信息。而在過去,只有當學生已經出現掛科的情況,輔導員才能得知,即便如此,事後也很難分析學生掛科的具體原因。

「目前,教育大數據暫時的定位還是輔助傳統教育,管理、引導學生。」連德富表示。

除了關注學生成績,他相信,現在的校園里依然充滿了像當初的自己那樣對未來迷茫的人。「我們都曾迷茫過,不知道自己喜歡什麼,可以做什麼。」

如何利用「學生畫像」幫助學生找到適合自己的路,是研究團隊正在努力的方向。目前,資料庫不僅有現有學生的行為軌跡,還有已經畢業的學長們的行為軌跡。連德富告訴《中國科學報》記者,最終選擇考研、出國或者創業的學生,在生活、學習方式上是存在一些差異的。

比如,打算出國的學生在選修課程、借閱圖書時都會偏向語言方面的內容,而偏好創業的學生則與一項很有意思的數據產生關聯。由於電子科大在成都郊區,學生進市區需要乘坐一趟班車,有的學生去市區的頻率明顯要高於其他同學,這也意味著他們的社交行為可能更為豐富。

「學生畫像」可以將現有學生的行為軌跡與已經畢業的學長們的行為軌跡進行比對,如果在選課、借閱圖書、參加社團活動等方面的軌跡與某類去向的畢業學生比較相似,學校就可以提供相關方面的建議、指導。

對此,21世紀教育研究院副院長熊丙奇也表示,傳統的大學教育對學生的管理是比較鬆散的,因此,通過對學生生活、學習的數據分析,掌握學生的目標動向,有助於學校對學生進行合理的引導,無論是學習還是參與社會活動,都能夠有的放矢地幫助學生作進一步規劃。

中科院心理所研究員尹文剛則將關注點瞄準了當下大學生的心理健康問題。

「學生從高壓的中學時期,進入完全需要自我管理的大學生活,一時間無法適應,容易出現心理問題。一旦受挫,通常選擇迴避的態度,甚至會出現抑鬱的情況,更嚴重的可能危及生命。」尹文剛直言,近年來,大學生頻繁曝出跳樓、傷害同學事件,都與心理健康密切相關。

他認為,通過教育大數據,可以及時掌握學生的行為習慣特徵,一旦發生明顯異常,比如長期獨處、很少參與公共生活等情況,學校就可以適當關注學生的心理健康問題,採取相應對策。

研究團隊正在挖掘「學生畫像」在關注學生心理健康方面的作用。他們可以根據學生的行為習慣來量化「孤獨」。

性格孤僻、有強烈的孤獨感,往往被認為是抑鬱易感人群具有的一些共性特徵。他們發現,學校最孤獨的一群人出現心理問題的概率比普通人高一個數量級。因此,研究團隊正在設計演算法,依據「30天內,兩個素不相識的人,有兩次或兩次以上前後腳打水、打飯、進公寓、進出圖書館或坐公交車經歷的概率,不超過十二萬分之一」的結論,可算出每名學生的「在校朋友圈」,以此量化學生孤獨的程度。

在尹文剛看來,預知大學生的行為習慣所隱含的心理問題,特別是關注學生的變化,對於開展學生工作是非常有幫助的。

從這些角度看,大數據在教育領域的應用是有一定價值的。

如何保護學生隱私

打水刷卡、進圖書館刷卡、進宿舍房間刷卡……在校園逐步實施一卡通的時代,學生大數據已經變得易得而且可控。學校一方面依靠大數據加強對學生的管理,一方面也要照顧到學生的隱私,尊重學生的行為習慣。因此,如何合理使用大數據,同時又保護學生隱私,就成為了一個重要的問題。

「如果讓學生感覺生活在學校的監控下,那麼即使學校的出發點是好的,希望能夠對學生的行為及心理進行合理引導,這種舉措也無疑會讓學生反感。」熊丙奇特別提示學校在運用大數據的時候,要考慮到學生的隱私及習慣。

對此,連德富表示,「學生畫像」在保護數據隱私方面是非常謹慎的。

「設計系統功能時,很重要的一方面是數據PK。」連德富介紹說,希望每名學生除了能在系統上看到自己的「畫像」外,還能看到自己與同專業同學比較後的相對優勢和劣勢。「但是,比較的根本目的是找到學習的模板,而不是與具體的某個個體比高下。」

因此,在申請PK時,系統是存在強許可權管理的。發起比對的學生必須經過對方的允許,才能看到對方的畫像。但是連德富透露,由於該功能涉及的數據隱私比較敏感,目前並沒有向學生端開放。

而已有的面向輔導員的埠,所涉及的數據經過嚴格的加密處理,系統不保存學生的真實姓名及學號,只有出現重要預警信息,才會自動給相應的輔導員進行簡訊推送。這意味著,任何一個技術人員都看不到學生個人的信息,而輔導員最多能夠掌握自己負責學生可能出現的重大問題。

連德富堅持認為,教育大數據不會刻意強調每個個體的情況,而是反映學生整體的生活、學習狀況,以及時預測預警學生的異常狀況,從而為學校的決策提供數據支撐。

以上是小編為大家分享的關於大數據計算你和學霸的距離的相關內容,更多信息可以關注環球青藤分享更多干貨

閱讀全文

與大數據學生畫像相關的資料

熱點內容
macbookair怎麼關閉程序 瀏覽:485
有道機器人編程課怎麼樣 瀏覽:791
商業銀行app如何查看銀行卡號 瀏覽:522
貴港市直播app開發怎麼樣 瀏覽:674
iphone6畫面同步電腦 瀏覽:801
adf上傳文件 瀏覽:772
微信撩妹表情包 瀏覽:935
作息app 瀏覽:24
29星卡哪些app免流 瀏覽:842
如何查找歷史地震數據 瀏覽:315
iphone6港版和國行哪個好 瀏覽:760
word錄制新宏 瀏覽:939
官方航班app有哪些 瀏覽:836
jssubstring中文 瀏覽:463
讀取小米路由器文件 瀏覽:739
win10玩孤島驚魂4 瀏覽:844
微信jssdk配置 瀏覽:89
蘋果系統光碟機怎麼存儲文件 瀏覽:722
把文件夾發送 瀏覽:681
win7升級到專業版 瀏覽:282

友情鏈接