导航:首页 > 网络数据 > 大数据的画学生

大数据的画学生

发布时间:2023-01-15 09:04:49

A. 大数据里的青年是什么样子

90后海归研制的马桶能智能体检;南京餐饮业求职者7成是90后,平均薪资排全国第二;00后们其实很认同传统美德,九成认为成功要靠自己奋斗……昨天(5月4日)是五四青年节,QQ、淘宝、口碑、58等多家互联网机构出台了各种角度关于年轻人的大数据画像,让我们来看看这里有没有你熟悉的年轻人。

画像三

南京餐饮业平均薪资6447元,求职者七成是90后

“四千块你就想请个服务员?你想多了吧!”这个前两年流传的段子或许正在变成现实。58英才招聘研究院联合口碑刚刚发布的今年1至4月全国重点城市餐饮业用工分析报告显示,北上广深、南京等一二线城市餐饮用工缺口巨大,餐饮人员供不应求直接拉高了餐饮企业薪资水平,服务员薪水最高的重点城市依次是北京、南京、广州、上海等。其中,南京餐饮企业平均支付薪资水平已达6447元。

数据显示,2018年1-4月,餐饮业企业招聘量城市前十位依次是北京、广州、深圳、上海、成都、杭州、重庆、武汉、西安、苏州。餐饮行业员工流动性较大,一直是用工需求最大的行业之一,招人难、留人难已成为绝大多数餐饮企业面临的问题。

统计数据还显示,餐饮业企业支付薪资水平城市前十位依次是北京、南京、广州、上海、深圳、杭州、合肥、苏州、西安、武汉。其中,北京的餐饮业企业薪资标准居全国第一,为7656元,其次是南京、广州、上海、深圳,分别为6447元、6377元、6331元和6196元。值得一提的是,南京的餐饮业平均薪资超过了广州、上海、深圳等一线城市,仅次于北京。

什么样的人应聘餐饮业最多?58英才招聘研究院数据显示,餐饮业求职者中,90后占比最高,达到72.5%。

以上内容来自:扬子晚报

B. 教育大数据是什么教育大数据作用有哪些

本文主要内容是介绍教育大数据的定义与作用,在了解教育大数据前我们首先要了解什么是大数据。大数据技术是21世纪最具时代标志的技术之一。国务院发布的《促进大数据发展行动纲要》中提出“大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合”。简单的说,大数据就是将海量碎片化的信息数据能够及时地进行筛选、分析,并最终归纳、整理出我们需要的资讯。

教育大数据,顾名思义就是教育行业的数据分析应用。

而大数据,则需要具备5V的特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

其中的“大”主要指的是 Volume(大量),我们现阶段用的数据分析,大部分情况下的数据量还达不到这个“大”的级别。

教育行业在数据分析的应用方面,主要痛点有以下四个方面:

1.数据涉及面窄

数据主要来源为数字化校园系统产生的,其他教学管理的数据多为手工录入非结构化数据

数据维度少,数据来源不足。

2.数据接口不完善

内部信息系统的教务系统、一卡通系统、图书馆系统、财务系统等数据都不规范一致,数据结构也不一样,各业务系统接口对接难度大

业务接口与数据结构还不规范

3.缺乏统一的数据管理平台

没有统一的数据处理中心对数据进行管理,没有人力维护各系统的接入

有效数据量少,数据质量差,达不到大数据处理分析要求

在具体的应用方面,即数据分析体系搭建上,可以在以下四个方面开展。

1.教务管理

在这方面可以进行招生分析、就业分析、住宿分析、图书馆分析、资产数据统计分析等。

2.教学创新

在这里可以进行教学质量评估、上网行为分析、学生成绩分析、学生特长能力分析

3.应用创新

可以进行学生轨迹分析、学生画像、学生舆情监控

4.科研支撑

可以开展科研成果分析统计、科研项目研究、科研经费跟踪研究,对整个科研情况有全面的了解和掌握。

1.大数据或把老师从作业批改中解放

在线教育除了能以优质教育资源为学生提供帮助外,对广大家长、老师和学校也大有裨益。苏静以作业帮家长版的“口算批改”功能为例介绍,家长或老师只需要用手机对着学生作业一扫,就能立刻对作业完成智能批改,显示出批改结果,能够大大节省老师和家长批改作业的时间。

事实上,随着人工智能等新兴技术的深入应用,在线教育平台能够为家长、老师、学校提供更有效的教学辅助。

2.因材施教,将更有的放矢

“人工智能+大数据精准教育”系统能利用大数据技术,完成对学生学习进度、学力、习惯的跟踪和分析,系统后台能够准确对用户进行用户画像,找到他们的知识薄弱点,形成用户学情报告,这可以帮助老师和学校更细致地了解每一个学生的情况,并有的放矢地制定更精准的学生学习计划。

C. 有哪些软件可以做大数据画像

TempoBI可以做大数据画像,给你看一个用他做的员工与学生画像截图。

D. 大数据时代,做顶级数据专家的学生是怎样一种体验

一问未来的学校什么样?

学校仍会存在,但功能会发生重大改变

Q1:您在书中谈到,今天的学校和几百年前的学校相比没什么变化,而校园外的世界早已变得几乎面目全非。在您看来,一所典型的大数据时代的学校,应该是什么样的?

舍恩伯格:首先我必须说,我的答案并不是完美的答案。因为我们人类很难预测未来,我们的视野会被我们已经见到的东西局限住。

我举个例子,欧洲一所大学里,一群学建筑的学生被要求设计出2050年的学校。这些25-30岁的年轻人设计的作品都包括教室、黑板、图书馆、实验室等现在的学校里有的东西,甚至还有一间专门的电脑室。这些设计中没有wifi,没有平板电脑——人们很难预见未来。

就我个人的观点,我认为未来的学校不会完全转移到线上,未来的学校仍旧会有物理性的存在,但是,学校的功能将发生重大改变。

现在的学校是一个学生接受信息的空间,但未来学生们将在家里通过观看网上等形式接受信息,然后到学校去和老师、同学就自己学习的内容进行讨论。学校将变成一个社会性的场所,是一个互相讨论,互相学习的所在。

二问未来的老师怎么当?

教师核心技能从宣讲知识变为组织讨论、个别引导

Q:大数据时代,翻转课堂会削弱老师在学习过程中的重要性吗?

舍恩伯格:不会!

大数据只会帮助老师的工作。以前老师不知道哪些部分的内容是学生面临困难的,哪些学习材料是学生感兴趣的,接下来的教授重点应该是什么。大数据可以帮助老师,提供这些信息。

我举个例子,我的《大数据时代》这本书出版之后,我并不知道读者的确切反馈,直到我们把电子书的版权卖给了。

读者们在kindle上阅读这本书,我就可以从获取很多信息:某个读者花费多少时间读完这一本书,甚至花费多少时间在某一页上;读者们在哪些部分画了下划线以突出这些字句。

我告诉你一个秘密,统计了全书中被读者们画出下划线次数最多的十个句子,我一个都没有猜中!

同样,大数据可以帮助老师们更深入了解学生的学习兴趣和学习风格。

当然,翻转课堂需要老师们的教学技能发生改变。以前照本宣科的传授、宣讲知识的技能,要让位于组织学生讨论的技能;要让位于从数据中获取学生学习信息的技能;要让位于根据数据对学生进行个别引导的技能。

这确实有些困难,但如果老师们掌握了这些技能,学校将比现在的更美好。

Q:随着数据处理技术的进一步发展,如果发展到一定程度可以自动处理数据并生成自适应的教育内容,技术是否会取代老师?

舍恩伯格:不会!

有两方面的原因。一是数据处理无法生成内容,它可以筛选、排序、组合内容,但无法生成内容。而且,即使是翻转课堂,中教授知识的也仍是老师。

第二个原因是学习是一个社会性的过程,我们面对人沟通时比面对书本学习得更快也更好。

三问未来的学习如何变?

大数据将重塑学习的三个主要特征

Q:您的新书《与大数据同行——学习与教育的未来》中文版即将问世,能否概括一下,大数据对教育和学习究竟将带来哪些方面的改变?

舍恩伯格:大数据将重塑学习的三个主要特征,我将之称为“反馈、个性化和概率预测”。

首先说反馈。在正规教育中,从幼儿园到大学,反馈随处可见,最常见的就是考试。然而,这种教育反馈系统的几乎所有方面都存在很大的缺陷:我们并不是总在收集正确的信息,即便是,我们所有收集的数量也远远不足。

大数据正在改变这一现状。我们能够收集到过去无法获取的学习数据,并用于学习过程的处理。我们还能用新的方式组合数据,并充分发挥起作用以提高学习理解和学业表现,同时分享给教师和管理者以改善教育系统。

我刚才举的通过获得的读者反馈就是一例。

然后是个性化。学习一直以来都是个人行为,但大多数正规学校的教育,在其设计时考虑的是处于平均水平的学生——比坐在前排的神童学得慢,但比教室后排的笨蛋学得快的一种虚构的生物。而现实中,并没有归属于这一类别的学生。

我们需要的是“一个尺寸适合一个人”的方式。既然我们可以截取、混合最爱的音乐并将之刻录到iPods播放器中,那为什么不能对我们的学习做出同样的操作呢?

在未来,学习决不会是按照一本给定的教科书、一门科目或课程,以同样的顺序和步调进行,而将会是有数千种不同的组合方式。

最后说说概率预测。通过大数据,我们能够对人们的整体学习状况和个体的知识掌握情况产生独到的见解。然而这些见解并不是完美的。我们“对学习的学习”可是说只是一种“可能性”。

我们可以基于高度的可能性,对个体为提高其学业成绩需要实施的行为作出预测。比如,选择最有效的教材、教学风格和反馈机制。但这仅仅是概率预测。

四问:大数据可能带来教育领域哪些危险?

用数据贴标签和限制学习自由

Q:除了这些正面的影响,大数据对于教育和学习有没有什么负面的影响?

舍恩伯格:是的。其危险有两个,一个是“永久的过去”,一个是“决定了的未来”。

所谓“永久的过去”是指,我们作为个人不断地成长、发展、变化,而那些多年来收集的全面的教育数据却始终保持不变。

想象一下,某个学生的活动记录被存储下来,并在25年后他找工作的时候被提供给未来的雇主,这将会是怎样的情形?

因此,全面教育数据带来的首个重大威胁,并不是信息的发布不当,而是束缚我们的过去、否定我们进步、成长和改变的能力,而且目前尚无抵御这一威胁的可靠措施。

所谓“决定了的未来”是指,以所有人为对象收集到的全面教育数据,将用于对未来进行预测;但是系统也可能带来一些恶性的后果。假如系统预测某个学生不太可能在一个学科领域(如生物信息学)取得良好成绩,于是引导他转入护理之类的其他专业,我们应该如何看待系统的决策?

诸如此类的概率预测将会限制我们的“学习自由”,并有可能最终威胁到我们对生活中的机遇的获取。比如大学可以很容易利用大数据选拔出学习能力最强的学生,毕竟教育最聪明的10个学生很容易,而提高普通学生的成绩却难得多,但也有意义的多。

在我看来,大数据蕴含的巨大潜力在于推进个性化学习、改善教材和教学、并最终提高学生的成绩。数据应该被视为促进产品改良的反馈,而不是对产品使用者进行简单评价的依据。

Q:我们该如何避免这些状况的发生?

舍恩伯格:依靠法律。我认为应该对大数据的使用立法,明确规定哪些数据可以收集和使用,哪些数据不能收集和使用;哪些数据可以在哪些领域中加以使用等等。

E. “人工智能”,“大数据”+教育如何驱动教育的未来

近日,由论答公司主办的教育大数据研讨会在北京举行,讨论会主题为“大数据+教育,有哪些可能性?”。本次研讨会主要关注数据在教育领域的应用,具体包括自适应学习、学习数据分析和教育数据挖掘。来自宾夕法尼亚大学、人民大学、华中师范大学的专家和企业界代表,共同探讨了教育大数据和自适应学习领域的技术趋势和产业机会
Ryan Baker是国际教育数据挖掘协会(International Ecational Data Mining Society)的创始人、《教育数据挖掘》杂志(Journal Ecational Data Mining)主编,在各类期刊和会议发表了260余篇学术论文,先后主持了美国科学基金会(National Science Foundation)、盖茨基金会(Gates Foundation)等研究基金的多项重大项目,累计获得研究经费超过1600万美元。
他也在哥伦比亚大学教育学院和爱丁堡大学同时担任教职,他在Coursera和edX上开设的“Big Data in Ecation(教育大数据)”课程,有来自100多个国家和地区的学生注册。
研讨会现场,Ryan Baker通过远程视频,分享了他对教育大数据的体验和应用。据他介绍,目前在教育大数据领域主要有四大研究组织,分别研究人工智能与教育、教育数据挖掘、学习数据分析和大规模学习。
Ryan Baker表示,在教育领域广泛应用大数据的时代正在到来。教育数据挖掘有很多的应用方向,包括:预测学生是会辍学,还是会成功完成学业;自动检测学生的学习投入程度、情感、学习策略,以更好地达到个性化;给教师和其他相关人员提供更好的报告;教育科学的基础研究和发现。
他认为,个性化教育至少要做到三件事情:
1、确定学生的有关数据;
2、了解对于学生的学习来说什么是真正重要的;
3、有针对性地为学生提供合适的教学。
而通过教育数据挖掘,我们可以推断很多事情:
学生的元认知和求助。比如,这个学生有多自信?当他需要帮助时,有没有在寻求帮助?他有没有在给自己解释问题,有没有思考这个答案是正确的还是错误的?最重要的,当他面临挑战时,能否坚持下去?
没有投入学习的行为。比如,“玩弄”系统,为了找到正确的答案,有的学生会试各种不同的答案,从“1”试到“38”。粗心,本身会做,但是不用心,最后给出的答案是错的。有些孩子会做非常难以解释的行为,比如不用方程符号,而是画了一个笑脸。
学生情感。Baker的研究团队和其他研究团队,已经创造了研究模型,可以根据数据推断,学生是否感到厌倦、沮丧、困惑、好奇、兴奋、快乐,是否投入,等等。
长期的学习结果。比如,学生能够记住刚才他学的东西吗?学生准备好学习下一个主题、下一个知识没有?中学生能上大学吗?他会从大学毕业还是辍学?
Ryan Baker表示,要获得这样的推断,只需要学生与系统交互的数据,不需要学生戴上头盔检测器。目前,这些模型已经开始大规模应用于自适应学习,应用于几十万的美国学生。Ryan Baker列举了一些自适应学习系统的案例。
Knewton
通过系统决定学生下一个要学习的问题是什么,已在全球的多个领域多个学科中运用。
ALEKS-ALEKS
用的是先行知识结构和知识点模型,来选择最适合学生的学习材料。比如,一个学生在学习上出现了问题,系统能够检测出来,是以前学的知识点出了问题,然后让学生回到以前的知识点上去学习。ALEKS系统应用于美国高中、大学的数学、科学学科。
Cognitive Tutor
系统能自动检测学生的知识,直到学生掌握为止。比如,系统不会让学生学习下一步的知识,直到他展示出他已经学好了他现在正在学习的知识。系统能够给学校提供数据报告,学校根据报告能够更好地让学生投入到学习中去。每年大约被50万的美国初高中生用于数学学习。
论答
论答公司的系统与ALEKS的系统有些类似,也是用先行结构和知识点模型,选择合适的学习材料。同时也是自动检测学生的知识状态直到学生掌握为止。应用领域目前包括数学和英语,完全针对中国学生开发。
Reasoning Mind
用各种自动检测的模型来检测老师的教学是否有效。通过数据生成报告给每个地区的教学管理员,让他们找到方法帮助老师提高教学。主要是用于美国的小学数学。
Duolingo
自动检测学生记忆,来决定什么时候回顾已经学过的知识。在全世界范围内应用于外语词汇的学习。
其他的像Civitas,Course Signals,Zogotech都是地区供应商,运用风险预测模型提供行动信息预测。它们会对学生做出预测,可能学不好、会失败,把报告提供给老师。已在世界范围内的大学应用。
Ryan Baker指出,在这些系统中,有足够的证据证明,至少以下两个系统是非常好的。
1、胡祥恩教授在美国做了大量实证研究,证明ALEKS系统对于帮助学生学习是有效的。他的研究证明,ALEKS系统对于不同人群的学生是同样有效的;特别值得提出的是,ALEKS可以帮助少数人群群体提高学习成绩。
2、Ryan Baker本人领导的研究团队与论答公司合作的研究表明,学生通过论答系统学习,比通过传统的在线学习系统学习,效果更好。他们在中国3个不同的地区做的3次实证研究,都证明了论答系统的有效性。
Ryan Baker分析了教育大数据算法模型的潜在发展方向。他认为,这些模型的长期潜力是,通过学生的知识和学习模型来确认,学生什么时候需要更多的支持:
首先是“mastery learning”,学生在掌握一个知识前,不会让他去学习下一个知识。当学生需要支持的时候,自动介入;同时告诉老师和父母,这个学生什么时候需要支持。
通过学习投入程度模型判断,学生什么时候开始变得厌倦、沮丧了,并调整学习活动,让厌倦的学生不再厌倦,让沮丧的学生的学习变得更容易一些。
学习投入程度模型还可以检测,在线学习中,什么样的学习活动,能让学生更容易地投入进去,并最终发现,什么样的学习活动对学生更好、对什么样的学生更好。
这样的模型也能告诉老师和父母,学生什么时候开始变得不再投入学习了。
还可以运用学习模型确认,学生什么时候没有真正学会,需要更多支持。
最后,Ryan Baker指出,下一步的目标是优化之前已经验证的经验和方法,然后把它们运用到系统中,最终让中国和世界上的数十亿学生受益。
讨论:“因材施教”的千年理想该如何照进现实?
王枫博士,论答公司(Learnta Inc.)创始人兼CEO
胡飞芳博士,美国乔治华盛顿大学(George Washington University)统计学终身教授,中国人民大学统计与大数据研究院的教授
胡祥恩博士,美国孟菲斯大学(University of Memphis)心理系、计算机科学系、计算机工程系终身教授,华中师范大学心理学院院长
马镇筠博士,论答公司联合创始人兼首席数据科学家
辛涛博士,北京师范大学中国基础教育质量监测协同创新中心常务副主任、博士生导师,兼任国家督学、教育部基础教育课程教材专家工作委员会委员、中国教育学会学术委员会委员。
技术发展到今天,“因材施教”如何实现?
王枫:因材施教,我首先到的是,每位学生学习的内容都不一样。如果有新的技术或者系统,系统应该像一个好老师一样,不会头疼医头脚疼医脚。比如说,一元二次方程做错了,好老师不会简单说一元二次方程做错了,你继续再做十道一元二次方程的题目,这其实是很差的老师,他没有真正去全面评判学生,到底是哪些掌握好、哪些掌握不好。
一个好的老师可能会说,我全面地看了你整个学习,可能你的问题不是出在一元二次方程上面,老师看了你做的题目,一元一次方程没有掌握好、因式分解也没有掌握好,你继续做一元二次方程是浪费时间。这就是从系统角度来说,系统做到了根据每个学生最基础的先行知识点的结构,给你提供最适合你当前学习的知识点,题目也好、视频也好、还有其他各种各样的学习内容。
胡飞芳:因材施教是我们教育的理想状态。孔子很早提出因材施教,在他当时的历史环境里面,因材施教可能更多是个体性的,因为那时学生少、老师也少,因材施教相对比较容易做到。
随着历史的发展,我们有更多的人需要教育时,我们做的一件事情是什么呢?就是做了一个标准化。标准化做的是什么?课堂教育。课堂教育从某种意义上来讲是标准化。现在这个历史阶段,教育大数据可能真正要做到的就是因材施教,自适应学习本身想做的也是这个。
胡祥恩:因材施教事实上在学习理论里有两个:一个是outerloop“学什么”,一个是innerloop“怎么学”。用技术来细化因材施教是教育产业走向成熟的一个标志。但是这个路非常非常难,因为“怎么学”那个层次非常非常难。
马镇筠:“因材”代表认识到学生的个体化差异,“施教”指进行差异化教学,这是根本思想。但如果考虑到时代背景,孔夫子时代专注的是学生的职业发展方向,也就是说,把适合当政治家的培养成政治家,把适合当学者的培养成学者。现在再提因材施教,我们其实能做得更多、更精细化。
比如,“因材”,对“材”的分类不仅是职业方向,还会考虑到学生的学习状态、学习目标、潜在能力、兴趣偏好等。而且,传统意义上的因材施教考虑的是学生个体间的差异,没有重视学生本身状态是在发生变化的,学生在不断学习,状态甚至兴趣各方面都可能发生变化。
但这些是自适应学习能够做到,甚至比传统的因材施教做得更好的地方。再说到“施教”,现在我们能做的几件事,包括学习路径推荐,给不同的学生匹配他最合适的学习内容,这种非常精细化的层面,我们已经有了一定的技术积累。
怎么判断一个产品做到了真正的自适应?
马镇筠:大多数产品的学习过程可以分为测、学、练,可以从这三个环节去看这个产品做到什么程度。
测,各种学习机构都有测评。但是国内只有论答团队第一个做出来能够在几十道题内,精准判断你一百个知识点,哪21个没掌握,哪79个掌握了。市场上大部分竞品,只会告诉你,知识点掌握率或者分数,79分或者知识掌握率达到79%;或者一些其他维度的总结,比如逻辑思维能力比较强、阅读的磨炼技巧比较好、学习动力哪方面稀缺。他们做了降维,本来很复杂的学习状态这样说出来,相对比较容易实现。但如果要做到具体告诉你,哪些知识点掌握、哪些知识点没掌握,这个难度就高很多了。
关于学习路径推荐的话,很多题库类的软件,知识点学完之后,会给一些题目推荐,但真正实现路径推荐的很少很少。路径推荐也是很核心的,有20个知识点没掌握,先学哪个知识点,后学哪个知识点,学习顺序是非常关键的,必须遵循循序渐进的原则,哪些知识点是前提知识点,哪些知识点是后续知识点,随机给你知识点去学习的话不能起到最好效果。真正到了练或学的环节,推荐什么样的视频,先推视频还是先推文字讲义,推简单题、中等难度题还是复杂题目,都需要根据学生实际情况来决定。
刚才只是举了几个例子,具体涉及到背后的算法、整个系统跟学习内容的结合以及整个教学流程的实现,中间很多环节必须要打通,形成一个闭环,才能对最终的结果负责。
辛涛:我的研究领域是教育和心理学的测量和评价。我个人的学术观察,基本上在现代这领域是两个类型。一个是心理测量领域,有一套成熟的方法,包括早期的IRT(Item Response Theory)和现在的ADT。另外一个是人工智能检测。心理测量系统,是一小群人在做;人工智能化是大的方向,现在是显学,给大家提供了明显的可能性。重要的是,那些背后的算法,能够在企业里真正实现出来。现在可能很多算法已经在那儿了,大体上路径是通的。
自适应学习基本上是把学习和评价联动起来了。因为,要自适应学习,必须有一个系统随时看到学生学到什么程度,这个完全是评价。但是,评价完了之后有一个新的呈现。这一块现在已经有一些很成熟的一些东西了,但不是一时半时可以说得特别具体的。
我做教育的测量和心理测量,人工智能那块我不熟。但是,从教育测量角度来说,在自适应学习和新技术结合之前,很大一块还是自适应考试,CAT(computer adaptive test)。系列化产生一个CAT变成了一个自适应学习的过程。总的来说,使用最简单、最机械化的方法,连续的CAT实际上是可以破解一个学习过程的。
测评本身经历了好几个阶段,通常用三个应用介词表示。
accessment to learning and teaching;
现在国家倡导的,accessment for learning and teaching,测评要对学习和教学有帮助;
跟信息化结合,accessment as learning and teaching,它是学习提供的完全融合的一个环节。
王枫:什么样的自适应学习系统才是真正的高级自适应学习系统?在中国的落地到底是怎么样才能真正落地?我在马博士的基础上想补充一点。
自适应系统如果一定要分级,也可以简单分一下。一种最基础的系统是基于规则的,比如说埋点。一个学生做10道一元二次方程题目,我预先埋好了,你做错了,立马给你推五道一元一次方程题目、五道因式分解题目。这个是埋点埋好了,这是规则,预先由老师或公式设置好了。
但这个规则有用性是非常有限的,因为每个学生不一样,A学生是因为一元一次方程不会,B学生可能是因式分解不会,C学生可能连小学的乘法快速运算都不会,这个没法预先直接埋点准备好。
所以自适应系统真正到了更高级一点的话,一定是真正通过大数据、根据算法模型来分析学生的学习数据,匹配下一步应该学什么。
在中国,自适应学习有效应用于教学有三个前提条件。做到这三点,自适应学习在中国的教育里面前途无限。
好的产品。必须要有针对中国本土化的自适应学习产品,把它开发出来。像ALEKS系统的确算法不错,但里面连一套国内的高考题都没有,家长不会让小孩子用这样的系统,因为直接影响应试目标。真正本土化开发的话,没有一成不变的算法,世界上最好算法就是没有开发出来的。教育非常复杂,每个学科不一样。比如数学后台有强大的关系,先行后续关系;英语没达到数学这么强的相关性,但算法是一样可以应用的。
好的学生、家长、老师。有了好的产品,首先学生应该真正投入进去学习。像Ryan Baker教授讲的,学生如果随便学一下,再好的系统也没用。第二,家长得督促孩子学习。第三,老师非常重要。老师应该做有价值的事情,比如给学生做个性化的辅导答疑,给学生针对性的讲解,组织学习活动小组,鼓励学生发挥创造能力,领导能力的培养。
学校以点带面。学生大部分时间都在学校里面学习。如果学校里最基本的、有效的在线教学产品都不应用的话,其实是有问题的。但是改变绝对不是简单的行政命令可以解决的。一个好的产品,一定是从点到面,逐步推广。自适应学习,更适合有明确目的的学习,像应试教育这块可以做得更好。所以学校可以应用进去。
胡祥恩:我觉得大家做自适应也好、因材施教也好,比较好的例子大家可以看一看。教育这个领域有多大,自适应概念就该有多宽。所以说,实验室里面有很多小的做得非常非常好的东西,只是没有到市场上面去,有很多非常非常巧妙的算法、一些东西。你会发现很多欧洲的、美国的实验室做的system,我每次看了都有种,自己是坐井观天的感觉。
怎么看待人工智能在教育中的应用?
胡飞芳:AlphaGo跟master,谷歌做了一个非常好的广告,人工智能在某些方面可以做得非常好。但是,我现在给你们讲另外一个谷歌自己不会去说的例子,但这也是事实。2008年、2009年的时候,谷歌推出一个免费产品,用各种搜集到的数据,预测美国的流感发展趋势。开始时很成功,预测跟实际发生的情况很相似。但到2015年,他自动撤回去了,不再提供预测。因为在2012跟2013年预测的时候,预测结果跟实际情况相差非常远。
这说明像这种不确定性的问题,人工智能还有非常大的局限性。一旦有不确定的数据,就有噪音。数据量很大时,大数据可能产生大噪音。怎样使噪音下降?2015年一个哈佛教授的研究团队在谷歌的基础上,用谷歌的数据去做同样的预测。他用了什么呢?就是用了模型,实际上模型在很多时候降噪是很有用的,用模型去预测,而不完全是人工智能的方式去预测。结果,他做出来的预测基本都比较准。
人工智能相对比较成功的,是比较确定的问题,所谓的确定是不管有多少种可能性,还是一个确定的东西。而流感很多时候是完全不确定的因素。
教育其实很多时候也是不确定的。同样一个人,现在让他回答这个问题,他可能思路清楚地回答出来;过了一个小时后,即使是同样类型的问题,按道理他应该回答出来,结果他回答不出来。这是说,实际上有很多因素在干扰的时候,人工智能的功能是不是会减少一点。把模型跟人工智能加在一起,会弥补人工智能在某些方面的弱点,这样会更好。
怎样促进商界和学界的交流,更好地把学界已经有的一些成果,运用到市场上来?
胡祥恩:教育产业应该是一个最大的产业,教育产业事实上是一个知识产业链。到目前为止,很多人认为自己要做一整套系统而在美国汽车业,最赚钱的是供应商,是做轮胎、做玻璃的。一旦标准化之后,一个人如果螺丝钉生产得最好,他就能够养活几家人、几代人。
到目前为止,美国推的就是教育标准化,教育内容的标准化、教育技术的标准化。比如说97年的时候,就说怎么样把内容标准化,你做的东西我可以用。我只是做整个教育知识产业链里面一个小块,做得很好。教育整个的产业链,有可能发挥特别特别技巧的那些小的公司,就能够在这个产业链里面生存、可以做得很好。第一个是要标准化,第二个要理解整个教育是一个产业链。

F. 大数据应用之“画像”

随着大数据技术的备受关注,有关“用户画像”、“商品画像”、“产品画像”、“资产画像”……的讨论就不绝于耳。那么,究竟什么是画像?又如何进行画像建设与画像分析呢?我们就从以下几个方面,着重探讨一下。

1、什么是画像?

用户画像,被定义为一种抽象出用户信息全貌的手段。

举个简单的例子,某个客户的特征描述为:500强企业,媒体行业,旗下产品覆盖网站、APP、微博、微信等端口,拥有受众9亿+,这就是一个典型的用户画像,我们据以便可以知道其存在大数据方面的需求。如果用一句话来描述,即:用户信息标签画。

大数据的时代背景下,画像被认作为企业应用大数据的根基,并直接跟企业经营能力、竞争优势的打造联系在一起。

有评论指出,要看一家企业的数据化运营程度,首当其冲地要看其“画像”构建情况:是否建设了“画像”?“画像”体系构建程度如何?针对什么对象进行了画像?构建画像的各种标签与指标情况如何?有没针对已建立起来的”画像”的应用?应用情况如何?等等

2、为什么要进行用户画像

这跟用户行为识别及数据应用直接相关。

各行各业都期待着,用户能主动告诉我们,他们的行为偏好。然而,事实既总非如愿,技术实现也非如此简单:首先,用户用以描述兴趣的自然语言很难为自然语言理解技术所理解;其次,用户的 兴趣是不断变化的,无法不停地提供兴趣描述;最后,很多时候用户并不知道自己喜欢什么,或很难清楚描述出自己喜欢什么。

于是,我们需要通过算法自动发掘用户行为数据,从用 户的行为中推测出用户的兴趣,从而给用户推荐满足他们兴趣的产品和服务,而画像,就是其中最重要的应用之一。

画像,通过为用户打标签的方式,使计算机能够程序化处理与人相关的信息。

如用户信息的分类统计:喜欢魅族的用户有多少?喜欢魅族的人群中,男、女比例是多少?如用户数据的挖掘工作:利用关联规划计算,购买该种商品的用户还购买了什么产品?利用聚类算法分析,喜欢该种产品的人年龄段分布情况如何等等?

3、构建用户画像的关键是什么?

从画像与标签的关系也可以窥见一斑,标签是画像建设的关键。同时,它也是大数据技术场景化的关键,因为如果没有针对场景构建出来标签,大数据的应用往往就很难“落地“。

一个标签通常是人为规定的高度精炼的特征指标,如年龄段标签:25-35岁;地域标签:北京、上海;设备标签:PC、移动;性别标签:男、女等等。

标签呈现出明显的语义化与短文本的特征:语义化,人能很方便地理解每个标签含义,使得用户画像模型具备实际意义,能够较好的满足业务需求;短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。

制定标签要遵循一定的规则,既要涵盖重要信息,又要方便机器做标签提取、聚合分析。

案例:用户的商品价格偏好标签建设过程

以某公司构建用户消费偏好画像为例,我们需要根据具体场景下用户的选择行为,将用户偏好画像拆分成几个不同数据标签:品牌、价格、购买时间、购买方式等

取用户历史购买消费记录,统计用户历史购买商品的价格,然后对价格进行区间划分。看用户购买的价格带主要集中在哪个区间中(价格带偏爱应该是一个相对动态的标签,更新频率可能一个月需要定期更,而且选择的时间段也应该是过去某个时间,不应该选择过长时间段。大家想想为什么?)。如何进行价格区间划分?

方法一:按统计学的方法

1、按分位数进行。例如:25%,50%,75%

2、按等箱原则。划分几等分

3、看数据的分布。

4、……

方法二:按业务知识经验

把价格带按业务经验,行业经验进行划分。

通过数据统计出来,我们可以看用户是否商品单价是否集中的某个区间范围内。例如,某用户购买的商品价格主要集中在30到40这个区间内,根据历史显示可以说,用户可能偏好于购买这个价格带的商品。当未来我们需要做促销商品推荐的时候,可以向该用户重点推荐打折后在这个价格区间的商品。

通过用户购买的价格区间,以及结合商品所归属的品类,可以看这个价格区间在这个品类中属于什么级别的。可以进一步给用户打上:注重品牌、注重高性价比等标签。

例如:如果某个品类商品的价格范围是(5,40],该用户购物商品主要集中(30,40]这个商品价格区间,用户在这个品类的消费上都是最高价格区间,说明这个用户在购买这个品类主要购买的高端商品。这样又可以为这个用户打上在这个品类的消费特征标签:品类高端用户。

4、构建用户画像的方法

从上面案例中,我们可以抽象出构建用户画像的方法,即用户画像模型的构建方法。

一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户、在什么时间、在什么地点、做了什么事。

其中用户的属性识别关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。时间的属性包括两个重要信息:时间戳和时间长度,时间戳指的是标识用户行为的时间点,通常精确到秒;时间长度指的是标识用户的停留时间。地点的属性也就是用户接触点,在互联网上,用户的接触点就包括了网址和内容两个重要信息。

用户行为属性有不同的类型,结合接触点的内容产生的标签信息,具有不同的权重。用户画像的数据模型可以概括为这样一个公式:用户标识+时间+行为类型+接触点(网址+内容),某个用户在某个时间、某个地点做了什么事情,就会被打上一个既定的标签。而用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子,行为类型、网址决定了权重,内容决策了标签,可以认为公式转变为标签权重=衰减因子×行为权重×网址子权重。

通过这样的计算才能够构建用户画像模型,进而能够逐步细化模型,从而最终制作出一个精准的用户模型。而每一个精准的用户模型都能够根据用户不断调整的互联网行为进行更新,从而精准把握用户心理,为每一个用户提供最完美的精细化服务,全面提升客户感知,最终实现客户满意度的不断提升。

G. 学校如何用大数据查看学生

学校通过学生手机号码、身份信息等用大数据查看学生。根据查询相关资料信息,学校用大数据可以查到学生的学籍信息以及教师的联系方式。大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理。

H. 大数据在教育方面的应用

大数据成为了这两年非常重要的一项技术,使用的地方也越来越多,在教育方面现在也有了很多的应用,下面就一起来看看大数据在教育中的使用。

1、个性化教育。通过运用大数据技术,教师可以关注学生个体的多方位的表现,可以通过对学生及时性的行为进行记录,使得数据有效整合,为教师提供真实个性的学生特点数据。

4、更新教育理念,创新教育思维。大数据时代下教育大数据扭转传统落后的教育理念与思维方式。在新时期教育领域到处充满了信息与数据,师生的一言一行以及学校的各类事物都能够转化为信息或数据。

随着智能化设备的广泛普及每位学生都可以运用计算机进行终端学习,有助于提高学生的学习积极性。

I. 如何用大数据的方法绘制知觉图

如何用大数据的方法绘制知觉图
统研究时代,知觉图(perceptual map)是一个简洁直观解析品牌定位的经典工具。然而随着大数据时代的降临,传统的数据获取方法受到了不断的冲击,原来使用焦点小组(Focus Group) 或调研问卷获得数据变成了一项费时费力,且耗费成本的工作。
大数据背景下,可不可以有更简单,更快捷的方式获知品牌及其竞争对手的定位?可不可以快速评价品牌定位是否达到目标位置?可不可以全面检验修正品牌传播策略正确与否?
这些问题都值得我们来探讨。
知觉图是什么?
先来说说知觉图的含义:
知觉图是消费者对某一系列产品或品牌的知觉和偏好的形象化表述。目的是尝试将消费者或潜在消费者的感知用直观的、形象化的图像表达出来。特别是用在产品、产品系列、品牌的定位方面,也会用于描述企业与竞争对手的相对位置方面。
知觉图可以是多维的,但通常的情形是二维的。
下图通过两维展示了消费者心目中笔记本电脑品牌在用户导向/标准配置,创意设计/经济实用方面的品牌定位。此例中,消费者认为,苹果品牌代表了创新设计及用户导向的特性。而三星笔记本则代表了经济实用和标准配置。

*非真实数据,仅用于展示
如何用大数据的方法绘制知觉图?
绘制知觉图,涉及到至少6个步骤:
确定研究方向:
作为咨询研究公司,研究方向往往是通过对消费者的研究,获取其对于客户某产品及其竞争对手产品的感觉或偏好。这时我们要选择符合该产品的一系列变量指标以及想要研究的目标品牌。
通常来说, 品牌和变量指标之间存在一个理想的比例关系,即1.3-1.6倍,也就是说如果研究8-10个品牌,大致需要14-15个变量。在传统研究时代,通过问卷获取消费者认知的阶段中,对于品牌的研究一般不超过20个,否则可能导致调查对象的疲倦,最终影响调研结果。而在大数据获取的背景下,数据是本身的获取是相对客观的,并不存在这个问题。这也算是大数据绘制知觉图的优势之一。
获取数据
本次介绍的大数据获取用户感知数据的方式,主要来自电商评论数据的获取。与传统途径相比,它具有采集快速,数据量大的特点。
在HCR最新的研究项目中,仅6个月内关于几大剃须刀品牌的商品评论数据就采集33万条之多,而采集时间却仅用了一天。省去了问卷设计,调研对象邀约,答题,统计等多个环节,最终获取到多于问卷调研对象百倍的原始数据。
当然这种大数据的采集方式,也会存在短板,比如评价不同品牌的个体不相同,个人评论的尺度的不同可能会影响最终的结果。但通过大量级的数据收集,可以将这种误差控制在可控范围内。任何一项研究都可能存在误差,而传统问卷抽样所导致的误差问题可能更明显。
确定产品变量
传统问卷的采集形式中,确定产品维度的工作是在数据采集前完成的,即先确定需要考察的产品属性,之后体现在问卷设计当中向调查对象提问。
在大数据的研究方法中,在数据采集之后,可通过高频属性的方式,提炼出某产品最受关注的一系列属性。例如:物流,服务,促销,价格,外观,功能,质量,体验等。每一项指标分为正面,中性,负面。相当于以往问卷式研究中的1-3分量表,即负面等于1分表示不满意,中性等于2分表示一般,正面等于3分表示满意。
数据处理
计算每一条评价在不同的指标下的分数,汇总后取平均值,得到不同品牌在各项指标下的平均得分。此处以剃须刀为例(非真实数据):
用因子分析中的主成分分析法可以得出每个品牌及每项指标的两维(X,Y)值:
绘图
根据品牌及指标的X,Y值,绘制出知觉图。在绘制知觉图的时候,有一项工作是非常重要的。即坐标轴的命名。此处可根据轴两侧45%角内指标的特性,为X,Y轴命名。例如:X轴负半轴,可根据便携,价格和促销/赠品来命名,比如“经济实用”。如果遇到命名指标数量过少的情况,如Y轴负半轴,则可用正半轴相关指标的反义词来辅助命名。
图表解读:
位置越相近的品牌,说明他们的市场定位越接近。而同属一个象限的品牌,在本质上可以被聚类。例如博朗与松下;奔腾,科美及朗威;飞利浦与飞科。他们彼此形成强烈的竞争关系。对于这些品牌,可以通过知觉图检测品牌定位的正确与否,通过逐渐改变品牌定位的方法,迁移到理想的新位置。
大数据时代的到来,提供了我们更多,更大的数据。获取数据的时间缩短了,成本降低了。但对于传统研究方法的借鉴,仍然是一个值得关注的话题。都说大数据往往缺少深入洞察,但HCR一直致力于将丰富的调研分析经验融入到新时代的背景下,将大小数据融合,不断为客户创造更高价值。

J. 如何利用大数据技术构建用户画像

1、认识用户画像


用户画像简单来讲,就是用户信息标签化。即收集这个用户的各种数据和行为,从而得出这个用户的一些基本信息和典型特征,最后形成一个人物原型。一般用户画像会分析三个信息维度,分别是基本属性、消费购物以及社交圈。其中基本属性就是指用户的一些基本信息,比如年纪、性别、生日、学校、所在地等等。


2、利用大数据构建用户画像的好处


(1)精准营销:当企业和商家掌握了用户的一定信息后,就可以构建出清晰的用户画像,这样一来就可以根据用户的偏好、收入等标签,推荐给他们会感兴趣的商品和服务。


(2)用户统计:通过大数据我们可以对一些数据进行统计,比如我们经常会看到有一些APP的排行榜,甚至是渗透率、日活率这些具体数据都可以清晰统计出来。


(3)数据挖掘:构建智能推荐系统,利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌,利用聚类算法分析,喜欢红酒的人年龄段分布情况。


(4)进行效果评估:其实相当于市场调研、用户调研,迅速下定位服务群体,提供高水平的服务。比如你是一个买车的想要投放广告,但是不知道哪个渠道投放更好,就可以先尝试一下,看看数据反馈如何。


(5)私人订制:对服务或产品进行私人订制,然而不法商家也会利用用户画像来杀熟。


(6)业务经营分析:业务经营分析以及竞争分析,影响企业的商业决策,甚至发展战略。


3、构建用户画像的流程


(1)数据源端:一般来讲构建用户画像的数据来自于网站交易数据、用户行为数据、网络日志数据。当然也不仅限于这些数据,一些平台上还有个人征信数据。


(2)数据预处理:第一步是清洗,把一些杂乱无序的数据清洗一下,然后归纳为结构化的数据,最后是把信息标准化。我们可以把数据的预处理简单理解为把数据分类在一个表格中,这一步就是奠定数据分析的基石。


关于如何利用大数据技术构建用户画像,青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。

阅读全文

与大数据的画学生相关的资料

热点内容
安装黑苹果过程中黑屏 浏览:798
公积金网络贷款是什么 浏览:38
u盘文件夹变成乱码文件夹 浏览:50
p2p平台是什么app 浏览:171
银行app用户量排名 浏览:80
微信扫码应用宝一直加载 浏览:901
迷你编程教培版怎么样 浏览:828
苹果程序网络设置在哪里设置 浏览:916
文件30kb等于多少m 浏览:631
远程接入网络书籍 浏览:120
安卓配置API 浏览:142
linuxc语言执行shell 浏览:977
windows文件夹大小 浏览:967
黑暗破坏神3装备升级 浏览:510
2021年底文件币能升值多少 浏览:941
温州文件柜一般多少钱 浏览:499
空白文件可以占多少g 浏览:611
腾讯文件云空间多少g 浏览:828
大创项目文件大小不能超过多少 浏览:558
胎儿8周b超多少数据正常 浏览:492

友情链接