导航:首页 > 网络数据 > 大数据学生画像

大数据学生画像

发布时间:2023-05-27 07:52:11

1. 大数据来告诉你如何成为学霸

大数据来告诉你如何成为学霸

目前,川内各所大学即将开学。对于新入校的学生来说,大学生活该怎样合理安排?如何才能在大学里炼成一个学霸?

别担心,有大数据来告诉你!这不,由国内大数据领域的领军专家、电子科技大学教授周涛等人共同研发的“学生画像”系统,通过数据整合、分析,挖掘出每个学生的学习、生活状态,预测出学生的挂科危险以及可能出现的“特殊状况”。这个系统已经覆盖电子科大两万余名本科生。

记者从电子科大教育大数据研究所了解到了“学生画像”所统计出来的一些数据,那么,现在我们就来看下,在大学里怎样才能成为一个学霸。

排名均值越小,成绩越好。

1 新奇的发现

打水次数减少35次学生成绩相应降低了26名

电子科大教育大数据研究所成立于去年,数十名师生共同承担着我国多项教育研究课题。周涛曾介绍研究所说,数据中心集中了学校上万名学子的行为、消费等匿名信息,研究所基于这些数据,进行整合、分析与运用。

据介绍,目前学生的数据包括出入寝室的时间、进出图书馆的次数、借阅书籍的种类、在教学楼打水的次数、去澡堂洗澡的时间等。“学生画像”的研究团队首先会根据这些数据与实际行为的关联性,“计算”出每名学生的学习、生活状态,从而预测学生是否有挂科的可能,甚至还有辅导学生更好规划自己学业的可能。

通过这一年时间的大数据统计,可以看出,在电子科技大学:总体上,女生平均成绩好于男生;大二上学期,成绩两极化最为明显。

同时,还总结出一个规律,学生成绩波动之前,生活模式会先发生变化。比如,一名学生第一学期在教室打水的次数为53,他的成绩在565位同学中排名200;第二学期,这名学生的打水次数减少了35次,他的成绩也相应降低了26名。

2 如何成为学霸?

生活有规律多与成绩好的学生做朋友

通过大数据研究,其实可以发现,学霸也是有规律可循的。这不,教育大数据研究所根据这些数据,绘制出了“学霸”和“学渣”的学习生活轨迹。来,一起看下,想要成为学霸,你要做些什么?

一、去图书馆和教学楼次数越多,成绩越好

在大数据研究所提供的图表一上,记者可以看到桥扰,第一学期,成绩最好的学生进入图书馆的次数为55次,成绩最差的学生进入图书馆的次数为35次;到了第四学期,成绩最好的学生进入图书馆的次数为61次,成绩最差的学生进入图书馆的次数为18次。

正如图表所显示的,“学生画像”的研究团队通过大数据分析,发现出入图书馆次数比较多的学生,成绩要优于出入图书馆次数比较少的学生。而同一名学生,随着出入图书馆次数的增多或减少,成绩排名在上下浮动。

同样的情况也存在教学楼,学生去教学楼饮水机上打水次数越多,就说明学生长期在教学楼历誉里活动。第三学期的数据显示(图二),成绩最好的学生在教学楼打水近80次,成绩最差的学生在教学楼打水不到10次。这也说明,经常在教学楼活动的学生,成绩就越好。

二、生活、学习有规律的学生,成绩更好

研究人员通过分析全校本科生进出宿舍、在食堂吃饭、去澡堂洗澡等记录,发现成绩好的学生除了在教学楼打水次数比较多之外,生活、学习等行为习惯比成绩差的更有规律。

以吃早饭的次数为例(图三),第二学期,成绩最好的学生吃早餐次数在110次,成绩最差的学生吃早餐次数仅为60次。也就是说,9点前出现在食堂吃早餐的同学,成绩也相对更好。

除此之外,研究还发现,在固定时间进出宿舍,在宿舍的平均时长少的学生,成绩远远高于经常宅在宿舍的学生。

三、身边朋友成绩较好,自身成绩也相对较好

大数据显示,学霸的身边总是围绕着学霸,身边朋友成绩较好,自身成绩也相对较好。

电子科大教育大数据研究所有专门分析“朋友圈”的模块,主要分析同校的朋友。“两个朋友关系越亲密,共同行动肢消段的概率就越大,而陌生人之间则不然,这是已经经过仔细验证的结论。”基于此,研究所的专家们对学生们的共现频率进行了统计分析,凡是两两间较短间隔内在同一场所,研究人员都进行了记录,以此获取两人的关系亲密程度,超过某一亲密程度的则为朋友,以此获取每个人的朋友圈信息。此后,研究人员再结合学生基本信息,获取学生与朋友之间的标识,如室友、同班、同学院等,进而进一步分析学生的交际能力与偏好。

研究人员在分析了学生和朋友们之间的成绩之后,得出一个研究结果:学生自身成绩与身边朋友的成绩具有很强的相关性。

3 科研人员建议

大学新生们 这样做你也能成为“学霸”

基于以上的研究成果,教育大数据研究所也给出了一定的建议:

生活习惯很重要,请注意保持生活的规律性,早上6点起床跑步读书吃早餐而不是8点起床飞奔去上课,你这一天的感觉会完全不一样;

一定要抽时间锻炼身体,不要天天宅,睡懒觉和打游戏不如出去跑跑步,打打球;

不要迷恋网络游戏;入学就打好学习基础;多去教室图书馆学习。

4 挂科预警

推送给辅导员及时调整学生的学习状态

除了教你如何成为“学霸”之外,“学生画像”还可以帮学生预测成绩,发出“挂科预警”。

据介绍,挂科预警就是通过学生学习基础以及由日常行为特征体现出的努力程度,综合分析提前预测学生挂科可能性,并将挂科可能性较高的群体发送给辅导员,帮助他们提前引导,有效提升学生的学习成绩。

研究人员告诉记者,挂科预警主要从三个方面分析:一是刻画学生生活与学习的规律性。比如,如果某学生最近几个月作息极不规律,那么他的成绩就会有下滑的可能;二是分析课程相关性,先导课程的掌握程度对后续课程的成绩有大的影响。比如,如果某学生微积分—I分数在及格边缘,那么后续课程微积分—II就有较高的挂科可能性。三是计算学生在该课程上付出的精力。比如,如果发现该生在图书馆从未借阅与微积分课程相关的图书,那么他在该课上挂科的可能性会进一步提高。

依据这些分析,系统便可计算出学生的挂科可能性,类似于“电磁场与波有87.5%的可能性挂科”这样的信息就会推送给辅导员,由辅导员介入调整学生的学习状态。

5 如何保护隐私?

不强调个人情况对异常状况提供人文关怀

通过数据挖掘获知学生在校行为记录,这是否意味着学生的行踪被监控,侵犯了学生的隐私权?

其实不然。教育大数据研究所副所长连德富强调,如今,“大数据”已渗透到生活的各个领域。学校做数据收集,不会去强调每个人的情况,而是察看学生整体的学习生活状况,及时预测预警学生异常状况,为学校的决策提供数据支撑。比如,根据学生就业能力情况,学校及时开展个性化引导,提升学生就业水平;根据学生实际消费情况,找出隐性困难学生,提升学校人文关怀等。

2. 大数据精描幼儿画像为评价赋能

但是,如何科学合理地捕捉碎片化的行为,通过对幼儿行为的研究,进而总结幼儿学习、生活、兴趣等方面的特征和规律,成为摆在学前教育研究者和实践者面前的重要课题。

随着大数据技术在教育领域的广泛应用,基于证据和大数据的教育决策机制逐步形成。利用大数据技术分析幼儿学习行为,有利于改进评价工作、提升保教质量。

对接五大领域,把握评价设计的内涵与要素,促进幼儿评价的全面性

幼儿教育领域内利用大数据技术分析幼儿学习行为,通过学习者建模、学习行为预测、学习评价等学习技术和系统的应用,能够帮助教师合理配置教学资源、改进教学策略。近年来,用户画像的概念也初步出现在教育领域,称作学习者画像。作为一种数据分析工具,在大数据技术基础上,将用户的属性特征分为自然属性、 社会 属性、心理属性等,建立用户数据的数学模型,对收集到的用户数据进行统计分析,从而以标签的形式表示出用户的“全貌”。

《3—6岁儿童学习与发展指南》从 健康 、语言、 社会 、科学、艺术五个领域描述幼儿的学习与发展,每个领域按照幼儿学习与发展最基本、最重要的内容划分为若干方面。幼儿发展对应这五大领域,支持幼儿发展的评价也应基于这五大领域,自然地、完整地贯穿教育过程的整体进行,这样才有可能全面、准确地刻画幼儿发展的质量,为幼儿教育发展质量提供评价参考。

幼儿画像利用AI音视频分析、物联网、大数据、云计算等技术,建立幼儿、教师、家长、幼儿园之间信息无缝互联通道,推动幼儿园现代化与信息化建设与改造。根据幼儿园的需求,将幼儿在园内各种行为数据捕捉以后自动统计归档,从评价入手,深描幼儿,形成幼儿画像。

《纲要》在关于对幼儿发展状况评估的指导要点上指出:“在日常活动与教育教学过程中采用自然的方法进行。平时观察所获的具有典型意义的幼儿行为表现和所积累的各种作品等,是评价的重要依据。” 因此,基于《纲要》和《指南》,建立幼儿画像标签体系,将幼儿一日在园活动的学习行为进行数据收集、数据存储、数据标注、数据处理与数据开采,能够全面、系统地反映出幼儿的行为规律和特征,形成幼儿画像。

例如,对 健康 领域的幼儿画像,可以通过长期捕捉幼儿在园的生活习惯与行为习惯,将其归类于 健康 标签上,结合人口统计学要素及场景描述,可以呈现每个幼儿的用户画像。

此外,还可以将画像技术运用于幼儿在园学习活动中,利用多种校园数据对幼儿进行综合分析。采集幼儿在集体教学、户外运动等方面的实时数据,对幼儿问题行为等进行预警与反馈,及时推送信息给教师和家长,有助于教师和家长把握幼儿的活动动态,表扬鼓励积极向上的行为,对不良行为习惯及时进行纠正,引导幼儿向正确的、积极 健康 的行为发展。

基于大数据的幼儿画像技术能够更科学、更精准地了解幼儿学习动态,丰富幼儿行为表现评价手段,提升幼儿管理水平,进而促进幼儿全面 健康 成长,也为教育教学、教育管理的决策和规划提供更加可靠的依据。

强化系统对接,助推评价结果的整合与应用,完善幼儿评价的协同性

教师基于幼儿画像可以更加深入地了解幼儿在户外、室内集体学习、区角活动的动向,把握幼儿学习的兴趣点,以便从幼儿出发设计真实而富有趣味的情境,开展有效的教育教学活动。

如在区角活动中,在对已有区角活动学习资源配置策略分析的基础上,以幼儿进出区域的频次与停留时间,判定幼儿对区域的偏好。此外,基于对幼儿与区域内学习资源交互的学习行为数据分析,结合区域活动发展目标,建立学习行为影响学习资源优化的因素模型。采用机器学习的方法对幼儿区域活动视频进行目标检测,形成幼儿和学习资源交互的 历史 记录。使用模式识别的方法从交互的 历史 记录中发现隐藏的学习行为模式或幼儿对学习资源的偏好,进而优化学习资源配置,形成对幼儿各个阶段不同区域发展目标的学习行为分析模型。

幼儿画像还能提升家园共育水平。对于家长而言,基于幼儿画像分析技术可以清楚了解孩子在园的情况,如出勤、 健康 、兴趣、学习等。基于孩子在园真实情况,家长和教师可以在各自观念和利益表达的基础上,就某个共同目标或分歧进行有效协商,更好地实现家园合作、家园共育。

与此同时,幼儿画像技术可以助力构建家园互信的良好环境。近年来,涉及家园矛盾事件的新闻报道频发,影响了家长对幼儿园的信任。幼儿园应提升园所的软硬件设施,想家长之所想,减少家园矛盾事件的发生。幼儿画像技术提供幼儿在园的海量数据,对于提升家长对幼儿园的信任程度,构建家园互信的良好环境,必然具有促进作用。

(作者单位:南京师范大学教育科学学院)

《中国教育报》2020年11月22日第2版

作者:刘晓红 赵丽

3. 有哪些软件可以做大数据画像

TempoBI可以做大数据画像,给你看一个用他做的员工与学生画像截图。

4. 大数据里的青年是什么样子

90后海归研制的马桶能智能体检;南京餐饮业求职者7成是90后,平均薪资排全国第二;00后们其实很认同传统美德,九成认为成功要靠自己奋斗……昨天(5月4日)是五四青年节,QQ、淘宝、口碑、58等多家互联网机构出台了各种角度关于年轻人的大数据画像,让我们来看看这里有没有你熟悉的年轻人。

画像三

南京餐饮业平均薪资6447元,求职者七成是90后

“四千块你就想请个服务员?你想多了吧!”这个前两年流传的段子或许正在变成现实。58英才招聘研究院联合口碑刚刚发布的今年1至4月全国重点城市餐饮业用工分析报告显示,北上广深、南京等一二线城市餐饮用工缺口巨大,餐饮人员供不应求直接拉高了餐饮企业薪资水平,服务员薪水最高的重点城市依次是北京、南京、广州、上海等。其中,南京餐饮企业平均支付薪资水平已达6447元。

数据显示,2018年1-4月,餐饮业企业招聘量城市前十位依次是北京、广州、深圳、上海、成都、杭州、重庆、武汉、西安、苏州。餐饮行业员工流动性较大,一直是用工需求最大的行业之一,招人难、留人难已成为绝大多数餐饮企业面临的问题。

统计数据还显示,餐饮业企业支付薪资水平城市前十位依次是北京、南京、广州、上海、深圳、杭州、合肥、苏州、西安、武汉。其中,北京的餐饮业企业薪资标准居全国第一,为7656元,其次是南京、广州、上海、深圳,分别为6447元、6377元、6331元和6196元。值得一提的是,南京的餐饮业平均薪资超过了广州、上海、深圳等一线城市,仅次于北京。

什么样的人应聘餐饮业最多?58英才招聘研究院数据显示,餐饮业求职者中,90后占比最高,达到72.5%。

以上内容来自:扬子晚报

5. 大数据告诉你:学霸是怎样炼成的!

大数据告诉你:学霸是怎样炼成的!

近日,国内大数据领域领军专家、电子科技大学周涛教授与有着近十年学工部长教育 经验 的吕红胤研究员,花费了近大半年的时间,联合研发出一套“大数据”系统——“学生画像”。

该系统利用校园一卡通追踪学生行为轨迹,通过对学生吃饭、打水、出行、消费行为记录,“算”出每名学生的 学习 、生活状态。更厉害的是,通过对学生日常学习状态的追踪,该系统还会对学生的期末成绩乃至 大学四年 后的 就业 情况作出预警——

注:系统用排名均值来计量学生成绩的优异。排名均值=学生在所在专业的年级排名/本专业的总人数,排名均值越接近0,代表该学生的成绩越好。

学霸是如何炼成的?

学霸出门时间通常比较固定

研究人员分析了近半年的 宿舍 门禁、吃饭、进出图 书 馆等刷卡记录,发现成绩较好的学生作息时间比成绩差的更规律。

例如,某 专业排名 第3的小雪,几乎每天固定在8点、12点、14点三个时间点出门,留在宿舍的总时长低于专业平均水平。而该专业成绩排名第61的小石每天进出宿舍的时间很随机,而且通常每次外出的时长不超过2小时,“宅指数”明显高于专业平均水平。

此外,研究人员还发现,9点前出现在食堂吃早餐的同学,成绩也相对更好。

学霸最爱在晚上10-11点洗澡

上图中,横轴代表了时间点,竖轴则代表了在当前的时间点下,学生的洗澡概率。电子科大的澡堂是全天开放的,但研究团队发现,晚上10——11点,学习好的学生与学习差的学生洗澡概率出现了较大的差异。简言之,集中在晚上10到11点之间洗澡的学生成绩更优异。

不管是出门时间还是洗澡时间,抑或是相对固定的早餐时间,都是学生作息规律的具体体现。研究人员发现,较有规律的学生群体,除了成绩上的优势外, 考研 成功 率以及 出国留学 获得奖学金的概率均高于一般学生。这也从侧面印证了生活的规律性对于成绩有正面影响的结论。

学霸爱泡图书馆和自习室

在样本量足够庞大的情况下,学生在一定时期内的行为追踪确实可以反映他的学习和生活状态。比如,如果一个学生的打卡记录显示,他长期在教学楼的饮水机上打水,那一定程度上就说明了,教学楼是他的长期活动地点。

“学生画像”的研究团队,通过大数据分析,发现了出入图书馆次数多少与学习成绩的好坏存在着一定的相关性,即:出入图书馆次数比较多的学生,成绩要仔码优于出入图书馆次数比较少的学生。同一个学生,随着他出入图书馆次数的增多或减少,他的成绩排名在上销戚仔下浮动。如图↓↓

这样的相关性,同样适用于学校的教学楼↓↓(注:在教室打水代表该学生出现在了教学楼~)

学霸也扎推?

现实中,每个人都会受到种种环境的影响。无疑,处于校园之中,身边人的学习状态,自然也会影响到学生自身的成绩好坏。

研究团队发现,如果一个 大学生 ,他身边的朋友成绩比较好,那他自身的成绩也相对较好!

想要成为一枚学霸?先找个学霸好友吧——

期末会不会挂科?算一下吧

在这项研究中,研究团队专门设计出了一系列辅助学生更好完成大学学业的功能模块——“挂科预警”。

想知道你学期末会不会挂科?那就算一算喽!

挂科率= 努力 程度 + 学习基础;

努力程度依据:教学楼打水频率+进出图书馆的时间与次数;

学习基础:用已考科目成绩、已考与将考科目之间的关联性算出;

一旦你的挂科率触碰到了预警红线,那系统便会自动为负责你学习的辅导员推送预警信息!

“前方高能预警,您的挂科率有偏高趋势,请好好学习——”自从有了“挂科预警”系统,妈妈再也不用担心我挂科了——

四年后,你会成为失业大军中的一员吗?

如今,就业形势一年比一年紧张。作为学生,你在担心 毕业 即失业?作为高校的管理者,你会困惑于如何帮亏汪助学生突破重围吗?嗯,好消息来了!

“学生画像”研究团队通过大量的数据分析,研究得出了一个学生的毕业去向与他在校期间的生活规律有着一定的关联性。

电子科技大学教育大数据研究所副所长、原微软亚洲研究院的连德富教授在接受中国青年报(ID:zqbcyol)采访时表示,通过对比往届 毕业生 的毕业去向,他们发现,就业困难学生群体身上确实存在某些相似的行为特征。比如,与其他同学相比,就业困难学生在校期间的生活普遍不太规律。此外,就业困难学生在图书馆的借阅书目也更偏向于悬疑科幻小说以及与游戏相关的 书籍 。

近年来,越来越多的大学生毕业后选择 创业 。麦可思研究院研究发现,包括本科毕业生和高职专院校毕业生在内的中国大学生毕业后选择自主创业的比例基本呈逐年上升的趋势:2007年1.2%,2008年1%,2009年1.2%,2010年1.5%,2011年1.6%,2012年2%,2013年2.3%,2014年2.9%。

在连德富教授看来,大学里的创业一族也有“大数据”特点。偏好创业的学生跑市区的频率要高于普通学生。

6. 什么是大数据画像

大数据画像是指,在大数据时代,企业通过对海量数据信息进行清洗、聚类、分析,将数据抽象成标签,再利用这些标签将用户形象具体化的过程。

用户画像的建立能够帮助企业更好地为用户提供针对性的服务。与之相应,越来越多的第三方大数据公司,也开始依托自身的数据积累,为客户提供用户画像的服务。

比如个推旗下的用户画像产品,能够对用户线上和线下行为进行大数据分析,帮助APP开发者和运营者构建全面、精准、多维的用户画像体系。用户画像的形成需要经历四个过程,数据积累、数据清洗、数据建模分析、数据产出。

其中,数据清洗和数据建模统称数据处理。在经过数据处理之后,个推产出独特的冷、热、温数据维度,并分析用户的线上兴趣偏好和线下行为场景,形成用户画像。

为什么需要用户画像

用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,如,可以做分类统计:喜欢红酒的用户有多少?喜欢红酒的人群中,男、女比例是多少?

也可以做数据挖掘工作:利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌?利用聚类算法分析,喜欢红酒的人年龄段分布情况?

大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。

7. 教育大数据是什么教育大数据作用有哪些

本文主要内容是介绍教育大数据的定义与作用,在了解教育大数据前我们首先要了解什么是大数据。大数据技术是21世纪最具时代标志的技术之一。国务院发布的《促进大数据发展行动纲要》中提出“大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合”。简单的说,大数据就是将海量碎片化的信息数据能够及时地进行筛选、分析,并最终归纳、整理出我们需要的资讯。

教育大数据,顾名思义就是教育行业的数据分析应用。

而大数据,则需要具备5V的特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

其中的“大”主要指的是 Volume(大量),我们现阶段用的数据分析,大部分情况下的数据量还达不到这个“大”的级别。

教育行业在数据分析的应用方面,主要痛点有以下四个方面:

1.数据涉及面窄

数据主要来源为数字化校园系统产生的,其他教学管理的数据多为手工录入非结构化数据

数据维度少,数据来源不足。

2.数据接口不完善

内部信息系统的教务系统、一卡通系统、图书馆系统、财务系统等数据都不规范一致,数据结构也不一样,各业务系统接口对接难度大

业务接口与数据结构还不规范

3.缺乏统一的数据管理平台

没有统一的数据处理中心对数据进行管理,没有人力维护各系统的接入

有效数据量少,数据质量差,达不到大数据处理分析要求

在具体的应用方面,即数据分析体系搭建上,可以在以下四个方面开展。

1.教务管理

在这方面可以进行招生分析、就业分析、住宿分析、图书馆分析、资产数据统计分析等。

2.教学创新

在这里可以进行教学质量评估、上网行为分析、学生成绩分析、学生特长能力分析

3.应用创新

可以进行学生轨迹分析、学生画像、学生舆情监控

4.科研支撑

可以开展科研成果分析统计、科研项目研究、科研经费跟踪研究,对整个科研情况有全面的了解和掌握。

1.大数据或把老师从作业批改中解放

在线教育除了能以优质教育资源为学生提供帮助外,对广大家长、老师和学校也大有裨益。苏静以作业帮家长版的“口算批改”功能为例介绍,家长或老师只需要用手机对着学生作业一扫,就能立刻对作业完成智能批改,显示出批改结果,能够大大节省老师和家长批改作业的时间。

事实上,随着人工智能等新兴技术的深入应用,在线教育平台能够为家长、老师、学校提供更有效的教学辅助。

2.因材施教,将更有的放矢

“人工智能+大数据精准教育”系统能利用大数据技术,完成对学生学习进度、学力、习惯的跟踪和分析,系统后台能够准确对用户进行用户画像,找到他们的知识薄弱点,形成用户学情报告,这可以帮助老师和学校更细致地了解每一个学生的情况,并有的放矢地制定更精准的学生学习计划。

8. 如何利用大数据进行个人画像

首先要知道,社 交网 站、购物网 站包括你使用的苹 果、安 卓手机,是没有权 限窃 听你的电话或者盗 取你的搜 索资料的,只是你的行为数据让你的手机意识到了你具体想要什么。再例如,你注 册一个账号,需要输入自己的名字;手机号;性 别;所在地;这些是微不足道的基础数据。当然还有你的消费记录;打 车频率;浏 览的公 众号类型;玩过的游戏...这些行为最后统统会变成几千个事实标 签,成为你行为数 据的一环节。采集标签的目的,就是为了构 建用户画 像,从杂 乱的标签当中,最终模 拟一个和你兴趣、爱好、思想相近的“你”。例如,你玩手机看到一篇内容标签为“美 女”的文章,而这并不表明你真的喜欢美 女,也可能是手 滑点的。因此,手机判 断你的兴趣喜好还要根据浏 览的停 留时间、搜 索次数、是否评 论转 发等等。当然,这关系到一个初级的内容标签 权 重算法:兴歼袜态趣标签( 美 女 )权 重 = 行为权 重 x 访问时长 x 衰 减因子行为权 重:什好判么都不干 1 分,评 论 + 0.5,点 赞 + 0.5,转 发 + 2,收 藏 + 1时长权 重:10S 以内权重为 0.5,10S-60S 为 1,60S 以上为 2衰 减因子:0 - 3 天内权 重为 1,3 - 7 天权 重为 0.85,7 - 15 天权 重为 0.7,15 - 30 天权 重为 0.5,30 天以上权 重为 0.1。兴趣标签权 重和你的阅读时长、评 论、点 赞、转 发收 藏有着密 切关系,并氏源且不同操作有着不同的加分数值,最终累 积成行为权 重。这点有点类 似网 易 云在私 人FM为你推 荐的歌曲类 似。停留时间越长,时间权 重也随之越高。你经常浏 览美 女,评 论关于美 女的文章,看关于美 女的视频,手机会将你一段时间内所有关于美 女的兴趣权 重累 加,再以S形函数标准化,最终得到一个从0到10的兴趣标签值。这个数值越高,你就对含有美 女的内容越感兴趣。不仅仅局 限于内容兴趣,这种算 法还能够根据你的消费能力、消费兴趣、社交习惯等多个维 度建立用 户画 像,并计算你的喜好。之后,这些喜好会被转换成特 征向 量,比如你的美 女兴趣标签值是8,消费能力是5,社 交偏 好是2,那么向量表示为r(8,5,2)。我们可以将特 征向 量想象成一个多 维空 间的一个坐 标点,通过每个用户的向 量坐标去带入余 弦公式或距离公式中,就能计算出和你相 似的人,进而把用 户分类。这是一个大工程。但是行为数 据只能计算出你的喜好,而无法判 断出你的性 别、学历等深入的个 人属 性。这需要将已知性 别和学 历的用户作为样 本,一些用来训练模 型,一些用来测 试精 准 度。现如今,各大平 台对于用户性 别的预 测准 确 度达到90%以上。因此,你的手机就能够得到大致这样一个用户画 像,它包含了你的各项兴趣权 重:所以说,A P P根 据这个画 像,便根据类 似的广告信息,找到对应的消费 者。

9. 华云数据为合肥财经学院量身定做了哪些大数据解决方案

合肥财经学院数据分散,需要建设大数据管理平台,

10. 大数据计算你和学霸的距离

大数据计算你和学霸的距离

在成都最冷的20天里还能坚持早起吃早餐;总是在晚上10点到11点之间洗澡;在教学楼打水近80次……正值开学季,电子科技大学教育大数据研究所的数据显示,普通的你,和学霸之间,恐怕就差了这些“微不足道”的行为。

这个颇有意思的发现,来源于覆盖了电子科大两万余名本科生的大数据系统——“学生画像”,其将每名学生几乎所有的在校活动轨迹与成绩之间建立了关联。利用这些数据,不仅能预算出学生的学习状况,研究者还希望依此引导他们更好地规划各自的学业和就业方向。

学霸的生活轨迹

传统教育认为,学生有规律的生活,是学生提高成绩的重要保证。

“普遍情况下,良好的行为习惯与学习成绩是呈正相关的,这基本是得到公认的。”21世纪教育研究院副院长熊丙奇表示,这些行为习惯,有的与成绩变动直接相关,例如学生按时上下课,常去图书馆等;还有一些与成绩的变动是间接相关的,比如养成早起的习惯,经常洗衣服,有规律的打水等。“虽然不直接作用于学生的学习,但是,好的生活习惯,反映的是学生积极的状态,说明学生自我管理的能力较强。那么,这些学生用在学习上的时间也相对有保证,也就势必会对学习成绩产生影响。”

不过,必须承认,这个被普遍接受的结论很难被定量描述。“如果我们能定量地证明已有的依据,并提出科学的可参照的建议,这项研究就是有价值的。”电子科技大学教育大数据研究所副所长连德富这样解释这项研究的初衷。

如今,研究团队已经花了一年多的时间记录学生的校内行为,包括吃饭、购物、打水、进出图书馆、借阅图书、宿舍门禁、洗澡、使用洗衣机、乘坐公交等。结果发现,学霸有着与一般学生完全不同的学习生活轨迹。

以某专业排名第3的学生为例,她几乎每天固定在8点、12点、14点三个时间点出门,留在宿舍的总时长低于专业平均水平。而该专业成绩排名第61的小石每天进出宿舍的时间很随机,而且通常每次外出的时长不超过2小时,“宅指数”明显高于专业平均水平。

此外,成绩最好的学生吃早餐次数在110次,成绩最差的学生吃早餐次数仅为60次。9点前出现在食堂吃早餐的同学,成绩相对更好。成绩较好的学生集中在晚上10到11点之间洗澡,而成绩较差的学生,洗澡时间无明显规律。

除作息规律以外,进出图书馆次数也是重要指标。第一学期,成绩最好的学生进入图书馆的次数为55次,成绩最差的学生进入图书馆的次数为35次;到了第四学期,成绩最好的学生进入图书馆的次数为61次,成绩最差的学生进入图书馆的次数为18次。

同样的情况还存在于教学楼。学生去教学楼饮水机上打水次数越多,就说明学生长期在教学楼里活动。第三学期的数据显示,成绩最好的学生在教学楼打水近80次,成绩最差的学生在教学楼打水不到10次。

尤其让连德富印象深刻的是,不同成绩的学生在借阅图书的种类上也有明显的区别。他发现,《蝴蝶公墓》《变态心理学》等带有悬疑色彩的图书,借阅者的成绩普遍不理想。

过去,要想清楚地知道不同成绩水平的学生群体与他们的行为特征之间一一的对应关系是非常困难的,但有了大数据的帮助,一切变得简单起来。

“学生画像”还能做什么

仅仅根据学生行为习惯的数据统计,就可以制定出学霸路线吗?

要想精确刻画一个人需要用无数的数据,但连德富认为,校园就是一个拥有丰富数据的很小的社会系统,只要这些数据能与目标联系起来,就有一定的指示作用。

事实上,“学生画像”的首要功能,就是算出每名学生的学习、生活状态,并设计出一系列辅助他们更好规划各自学业的功能模块。目前已经实现的是挂科预警。

据了解,研究团队设计了一个针对挂科率的公式,即过去的学习基础+一段时期内的努力程度。学习基础是根据已考科目成绩、已考与将考科目之间的关联性计算得出的,而努力程度则主要依据教学楼打水频率、进出图书馆的时间与次数等。

如果有学生正处于挂科率高风险的边缘,系统就会自动向负责该名学生的辅导员发送预警信息。而在过去,只有当学生已经出现挂科的情况,辅导员才能得知,即便如此,事后也很难分析学生挂科的具体原因。

“目前,教育大数据暂时的定位还是辅助传统教育,管理、引导学生。”连德富表示。

除了关注学生成绩,他相信,现在的校园里依然充满了像当初的自己那样对未来迷茫的人。“我们都曾迷茫过,不知道自己喜欢什么,可以做什么。”

如何利用“学生画像”帮助学生找到适合自己的路,是研究团队正在努力的方向。目前,数据库不仅有现有学生的行为轨迹,还有已经毕业的学长们的行为轨迹。连德富告诉《中国科学报》记者,最终选择考研、出国或者创业的学生,在生活、学习方式上是存在一些差异的。

比如,打算出国的学生在选修课程、借阅图书时都会偏向语言方面的内容,而偏好创业的学生则与一项很有意思的数据产生关联。由于电子科大在成都郊区,学生进市区需要乘坐一趟班车,有的学生去市区的频率明显要高于其他同学,这也意味着他们的社交行为可能更为丰富。

“学生画像”可以将现有学生的行为轨迹与已经毕业的学长们的行为轨迹进行比对,如果在选课、借阅图书、参加社团活动等方面的轨迹与某类去向的毕业学生比较相似,学校就可以提供相关方面的建议、指导。

对此,21世纪教育研究院副院长熊丙奇也表示,传统的大学教育对学生的管理是比较松散的,因此,通过对学生生活、学习的数据分析,掌握学生的目标动向,有助于学校对学生进行合理的引导,无论是学习还是参与社会活动,都能够有的放矢地帮助学生作进一步规划。

中科院心理所研究员尹文刚则将关注点瞄准了当下大学生的心理健康问题。

“学生从高压的中学时期,进入完全需要自我管理的大学生活,一时间无法适应,容易出现心理问题。一旦受挫,通常选择回避的态度,甚至会出现抑郁的情况,更严重的可能危及生命。”尹文刚直言,近年来,大学生频繁曝出跳楼、伤害同学事件,都与心理健康密切相关。

他认为,通过教育大数据,可以及时掌握学生的行为习惯特征,一旦发生明显异常,比如长期独处、很少参与公共生活等情况,学校就可以适当关注学生的心理健康问题,采取相应对策。

研究团队正在挖掘“学生画像”在关注学生心理健康方面的作用。他们可以根据学生的行为习惯来量化“孤独”。

性格孤僻、有强烈的孤独感,往往被认为是抑郁易感人群具有的一些共性特征。他们发现,学校最孤独的一群人出现心理问题的概率比普通人高一个数量级。因此,研究团队正在设计算法,依据“30天内,两个素不相识的人,有两次或两次以上前后脚打水、打饭、进公寓、进出图书馆或坐公交车经历的概率,不超过十二万分之一”的结论,可算出每名学生的“在校朋友圈”,以此量化学生孤独的程度。

在尹文刚看来,预知大学生的行为习惯所隐含的心理问题,特别是关注学生的变化,对于开展学生工作是非常有帮助的。

从这些角度看,大数据在教育领域的应用是有一定价值的。

如何保护学生隐私

打水刷卡、进图书馆刷卡、进宿舍房间刷卡……在校园逐步实施一卡通的时代,学生大数据已经变得易得而且可控。学校一方面依靠大数据加强对学生的管理,一方面也要照顾到学生的隐私,尊重学生的行为习惯。因此,如何合理使用大数据,同时又保护学生隐私,就成为了一个重要的问题。

“如果让学生感觉生活在学校的监控下,那么即使学校的出发点是好的,希望能够对学生的行为及心理进行合理引导,这种举措也无疑会让学生反感。”熊丙奇特别提示学校在运用大数据的时候,要考虑到学生的隐私及习惯。

对此,连德富表示,“学生画像”在保护数据隐私方面是非常谨慎的。

“设计系统功能时,很重要的一方面是数据PK。”连德富介绍说,希望每名学生除了能在系统上看到自己的“画像”外,还能看到自己与同专业同学比较后的相对优势和劣势。“但是,比较的根本目的是找到学习的模板,而不是与具体的某个个体比高下。”

因此,在申请PK时,系统是存在强权限管理的。发起比对的学生必须经过对方的允许,才能看到对方的画像。但是连德富透露,由于该功能涉及的数据隐私比较敏感,目前并没有向学生端开放。

而已有的面向辅导员的端口,所涉及的数据经过严格的加密处理,系统不保存学生的真实姓名及学号,只有出现重要预警信息,才会自动给相应的辅导员进行短信推送。这意味着,任何一个技术人员都看不到学生个人的信息,而辅导员最多能够掌握自己负责学生可能出现的重大问题。

连德富坚持认为,教育大数据不会刻意强调每个个体的情况,而是反映学生整体的生活、学习状况,以及时预测预警学生的异常状况,从而为学校的决策提供数据支撑。

以上是小编为大家分享的关于大数据计算你和学霸的距离的相关内容,更多信息可以关注环球青藤分享更多干货

阅读全文

与大数据学生画像相关的资料

热点内容
数据ltc是什么意思 浏览:568
顺序表存储数据结构有哪些特点 浏览:891
苹果手机在微信怎么搜索文件 浏览:375
数据库服务怎么重启 浏览:841
苹果6s通话声音太小 浏览:517
什么是数据分析法 浏览:659
多页双面文件按顺序复印如何操作 浏览:772
diskgen硬盘工具 浏览:642
后端编程哪个好 浏览:540
编程哪个软件最简单 浏览:591
山西运城疫苗用哪个app预约 浏览:413
有线网络电视机顶盒如何看直播 浏览:909
linux挂载硬盘home 浏览:964
word2010全部接受修订 浏览:802
咋找文件管理中找下载路径 浏览:967
冒险小镇怎么快速升级 浏览:573
如何修改5g手机的5g网络 浏览:486
为什么网站查不到流量 浏览:215
微信录音怎么录音文件 浏览:450
iphone6显示无法满屏 浏览:747

友情链接