㈠ “大数据时代人群队列研究:现状及展望”学术研讨会在我校召开
大型人群队列研究是解决目前医学和健康重大问题的有效方法之一,是医学逐步走向精准提高效果的必经之路。国外已经累积了几十年的经验,近年来我国也掀起了大型人群队列研究的热潮。以中英合作的CKB前瞻性队列研究为代表的中国大型队列研究已在国际上崭露头角。如何契合我国的需要,进一步开展独特的队列研究,充分利用队列研究的成果,为我国卫生和临床决策提供关键依据,仍然是摆在我们面前的巨大任务。
4月13日,在春意盎然、生机勃勃的季节,在美丽的东莞松山湖畔,值此广东医科大学六十周年校庆之际,为了紧跟当前人群队列研究的学术前沿,提升我校在人群队列研究领域的科研能力,由我校主办、科技处和公共卫生学院承办的“大数据时代人群队列研究:现状及展望”学术研讨会在东莞校区行政报告厅召开。会议邀请了国内外公共卫生领域著名的专家学者前来,围绕大型人群队列建设的时代背景、必要性、建设现状、建设成果及面临的机遇和挑战等议题与我校师生共同讨论、分享和交流。
开幕式由学校丁元林副校长主持,学校党委副书记、副校长余学清教授和教育部国家督学、北京大学博雅讲席教授李立明教授分别致辞。
余学清副书记、副校长在致辞中代表学校欢迎各位知名专家学者、同仁朋友的到来,感谢各位专家对此次研讨会的鼎力支持。余校长在致辞中指出在精准医学和大数据时代的今天,复杂疾病的病因学研究迎来了前所未有的机遇与挑战,构建反映国人多样性的国家级人群大型健康队列,将各组学、大数据科学、分子影像等新技术有机整合,建立多层次精准医疗知识体系和生物医学大数据平台,对于精细解析复杂疾病的病因结构,进而提供重大疾病风险评估和预测、早筛分类、个体化治疗及疗效监测的整套解决方案具有重大战略意义。目前,大型人群队列研究已经是流行病学领域乃至公共卫生领域的主旋律之一。本次大会群贤毕至,人才荟萃,相信定能开启新的视角、激荡起新的思维、碰撞出新的火花,为广东医科大学人群队列研究的发展助力加油。
李立明教授在致辞中强调广东医科大学拥有特殊的区位优势具有巨大的发展潜力和前景;十九大以后健康中国的建设是每一位医药卫生从业者应担负起历史使命;大数据在医学领域有广阔的应用前景,此次研讨会恰逢其时,并将推动广东医科大学的科研工作以及全国类似研究的进步。随后,李立明教授带来了“中国慢性病前瞻性队列研究”的主题讲座,从人群健康角度以及国家战略高度,介绍了大型队列研究的必要性、国内外大规模队列研究的概况,指出队列研究在研究设计上具有独特的优势,队列研究尤其适用于发病率低的疾病以及尚待发掘的弱效应因素的病因研究,特别阐述了超大型人群队列(MegaCohort)的产生、发展及特点,随后介绍了中国50万队列研究的进展情况,强调了大型队列研究的随访流程,而且还分享了中国50万队列研究取得的一些重要研究成果。并将中国50万队列研究项目下的成果《大型人群队列随访标准》和《大型人群队列调查问卷标准》两部著作赠与我校。
华中科技大学潘安教授分享了“东风-同济队列”研究,该队列基于职业人群,具有研究对象稳定,随访率高,良好的职业环境监测资料,医疗记录和医疗保险系统基础好以及集团公司大力支持等特点,潘教授详细介绍了“东风-同济队列”的设计、进展、取得的研究成果以及后期设想,特别阐述了队列研究中样本代表性问题的思考和判别方法。
中山大学凌文华教授做了“广东冠心病人群队列研究”的主题报告,阐述了营养膳食与心血管疾病,膳食模式与代谢性疾病的关联,介绍了广东冠心病(CAD)队列的基本概况,CAD队列的相关标志物(体内)研究,如血糖与死亡风险、血清HDL-C与冠心病风险,分析了营养素、食物以及膳食模式与主要慢性病的关联,为营养流行病学在队列研究中的应用提供了借鉴依据。
余学清校长做了题为“肾脏病基因组学与队列研究”的主题报告,充分肯定了在大数据时代下开展队列研究的价值和意义,介绍了其课题组建立肾脏病患者队列的情况,并分享了其基于队列进行研究的进展和所取得的结果。
新加坡大学刘建军教授做了“Genetic Variation inGenomic Medicine: from susceptibility to treatment”的主题报告,介绍了生物标志物特别是遗传生物标志在麻风、系统性红斑狼疮等疾病中临床诊断意义及应用,指出遗传生物标志在流行病学病因分析中具有重要意义。
公共卫生学院院长倪进东教授向与会专家介绍了公共卫生学院的基本概况、发展历程及取得的教学科研成果。公共卫生学院的部分教授、博士就相关研究领域作了主题汇报,共同分享了各自研究领域的科研设计及科研发现。唐焕文教授汇报的题目是“PARP-1通路在氢醌诱导TK6细胞DNA损伤修复与转归中的作用”,倪进东教授报告的题目是“Tfh细胞在乙肝疫苗弱应答中的作用及其表观调控机制”,杨铮教授汇报的题目是“癌症患者报告结局研究”;黄志刚博士汇报了“胃癌相关分子标志物的发现及功能验证”,邹堂斌博士汇报了“虾青素经miR-29b/Bcl-2通路抑制LX-2细胞增殖和促进其凋亡”,刘小山博士汇报了“有机磷阻燃剂的内分泌干扰效应和机制研究”,他们报告的内容吸引了与会人员的浓厚兴趣。
中山大学余新炳教授、安徽医科大学叶冬青教授、香港中文大学唐金陵教授和中山大学郝元涛教授应邀担任了本次研讨会学术报告的主持。
此外,北京大学任涛教授、南方医科大学毛琛教授以及《中华流行病学杂志》编辑部王岚主任等应邀出席了本次会议。
本次研讨会公共卫生领域知名专家学者人才荟萃,学校将以此为契机,广纳队列研究中的真知灼见,广聚学术研究资源,广交学术人才,为我校即将开展的新生儿队列研究带来新思路,新途径。通过研讨会增进了与兄弟院校、同行专家学者的密切合作,为“健康中国”事业的发展贡献智慧和力量。(文/徐秀娟 图/廖莹 骆诗凌 张清青 梁蓉 陈桂兰 洪丹凤 王江瑶 王丽君 编/王丽君 审/蔡定彬)
㈡ “湖南省农业大数据”研讨会在哪里举行,有谁参加
湖南农科院彭选明、农科院信息化的刘学文,天闻数媒事业部韩钦等等。
㈢ 正确运用避免陷入大数据的“陷阱”
正确运用避免陷入大数据的“陷阱”
通常,对于新的IT关键词必定会出现“反对派”。最近,“大数据”就成为被攻击的对象,诸如“大数据失败论”等论调也明显增加。
业界对大数据抱着极大的期待,这一点从大量的大数据研讨会和展示会风潮就足以证明。这些年来,除了云计算浪潮,缺乏热烈话题的IT业界而言,大数据是期待已久的大型关键词,也许大数据会成为恢复业界活力的强心剂。
与此同时,日本政府提出新的IT战略--“将行政数据向民间开发,以便不断创造新商务”。也就是说,如何有效利用数据,推动商业成功,业已成为国家战略的一环。
虽然笔者既不是强烈的赞成派也不是反对派,但通过以往的采访经验,对处理数据的难度有着清醒的认识。更何况涉及到大数据,其难度显而易见。
笔者周边很多人对大数据也有着各种不同的看法,提出各种问题。当然这些对于IT业界的读者而言,都是理所当然的事情,笔者说这些也许是班门弄斧了。但是,正是这些众所周知的道理通常也是非常重要不可忽视的。因此,下面笔者将重新提出大数据的“陷阱”,探讨如何才能避免运用大数据的失败。
是否真正需要大量的数据
首先,必须明确的一点是,是否真正需要大量的数据。
在一次活动中,一位统计分析的专家在谈到大数据时说:“本来统计分析学是如何通过少量的取样,去了解事务整体的学问。例如,电视的收视率调查就是一个典型的事例,这类调查就是通过极少的样本,来掌握日本全国的收视状况。如果目的明确,并不需要大量的数据。”
由于上述言论出自目前作为“数据科学家”备受瞩目的统计分析方面的专家之口,让笔者不禁大吃一惊。这就是说,只要有一定量的数据,无关数据数量,分析的结果并不会有很大的差别。如果果真如此,不禁让人产生怀疑,即到底大数据是为何而存在。
听到上述观点,使人感到大数据所面临的矛盾的应当不仅仅是笔者一人。本以为通过大数据分析,满怀期待能够发现以往没有认识到的新的东西,但有时其结果不过是已有所知的事实而已。如果企业为系统开发投入数十亿日元,得出的不过是证明资深职员“经验”的结论,这也未免让人难以接受。
正因为如此,就有必要重新考虑为何需要大数据这一问题。例如,企业需要明确通过将有交易往来的公司和社交媒体等本企业外的大量数据进行组合,是为达到何种目的等,即有必要事先制定大数据的目标。
数据的“质量”有无问题
第二点是由谁来维护大量的数据,即数据的“质量”如何能够得到保障。
笔者曾听说这样一件事。某企业的总经理每个月都会收到有交易往来的IT供应商的宣传(PR)杂志,但收件人的头衔不是“总经理”,而是他曾经兼任公司CIO时的头衔“常务董事”。虽然将头衔搞错,但还是都能收到,因此并没有太在意。但当这家IT供应商的总经理到公司进行礼节性拜访时,就提出了希望改一下头衔的想法。
而这家IT供应商的新的卖点是大数据,公司的总经理当场表示回去马上会进行修改。起初以为这点事情对于运营大数据业务的IT供应商而言不过是举手之劳,一定会进行纠正。但是,等到下一个月他收到的的PR杂志时,发现收件人的头衔仍然是“常务董事”。这位总经理通过两本PR杂志感到仿佛看到了大数据的现状,因此他非常失望地说:“归根到底IT供应商并没有维护顾客数据库”。
上述例子虽然是顾客数据,而不仅仅是顾客数据,说到大数据必然还需要处理很多各种各样的企业外部的数据。但是,这些数据是否是最新数据,其数据的精确度又如何等数据的“质量”就会非常重要。分析出处不明的数据将毫无意义。如果顾客数据不能随时进行维护,也就不会产生任何价值。不应当将当初以为是宝山的大数据,变成一座堆满垃圾的山。
是否忽视了现场职工的工作干劲
第三点就是企业不仅应当努力培养数据科学家,同时也需要提升现场职员的分析数据的能力。如果在店头等现场直接接触顾客的员工变得“擅长数字”,他们也能够常常通过数据考虑事情并进行判断,这样的企业必定会强大起来。
例如,有一家超市的店头销售员就从与顾客的对话中得到启发,通过购进新的商品或是改变商品陈列的方法,提升了销售额。又比如,在特快列车上负责销售的员工,发现似乎“可吸烟座位的咖啡畅销”,当他整理出不同列车的销售业绩,结果发现确实是如此。于是决定在吸烟车厢集中推销咖啡,结果咖啡的销售量明显增加。
当然,通过现场增加的销售额,也许和利用大数据获得的销售数字相比很小,而且其分析能力也远远不及数据科学家。但是即便如此,如果通过将这种方式横向拓展到其他现场,积累的数字也会非常可观。同时,最为重要的是,这种方式能够提升现场员工的工作动力。
实际上,某零售企业自从将其销售分析统一由总公司实施后,店头员工就失去干劲,甚至出现退职的员工。这说明只依靠上级的指令,则会降低现场的职业道德。因此,这家公司决定给予现场员工自由分析判断的职能,由此店头又重新恢复了活力。虽然大数据非常重要,但是如果将权限集中在某些部门,则会导致现场丧失工作干劲。
以上三点实际上不仅仅对大数据而言非常重要,而且同时适用于整个信息系统。大数据是IT业界期待已久的关键词,为使其成长壮大,就需要脚踏实地的努力,而不应被其华丽的部分所束缚摆弄。正因为如此,笔者认为提出的上述三点需要重新铭记心中。
㈣ 第十七届中国高速公路信息化研讨会暨技术产品展示会简介与报名
这个我知道,我们公司报名了。给你一份邀请函吧,看了就知道怎么报名
致力于高速公路信息化的产业界朋友:
起步于1999年的“中国高速公路信息化研讨会暨技术产品展示会”,从关注我国高速公路机电工程建设到信息化建设,从小规模的技术交流到2014年第17届行业盛会,十几年来,为推动我国高速公路信息化的建设与发展发挥了积极的作用。
为进一步提高高速公路信息化建设、管理和服务水平,加强同行间的经验与技术交流,推广新技术与新产品应用,中国公路学会定于2015年3月19-20日在南昌举办第17届中国高速公路信息化研讨会暨技术产品展示会。
欢迎各有关企业和机构参会或参展。
一、会议内容
1、形势分析
物联网、大数据、云计算等新技术在高速公路应用前景分析;高速公路信息化发展展望与应用需求分析;高速公路信息化技术发展趋势分析;智慧高速公路发展展望等。
2、信息化管理
高速公路(网)运行监测;高速公路应急处置与指挥调度管理;高速公路绿色通道、养护及路政管理信息化;收费站与服务区管理信息化;高速公路机电设备维护维修与管理信息化;新技术在高速公路管理中的应用探讨等。
3、规划设计
省域路网中心的规划、建设与实施;高速公路机电工程设计理念的创新与发展;高速公路收费、通信、监控等系统设计中存在的问题与建议等。
4、综合技术
高速公路综合管理信息平台;高速公路综合监控与交通指挥调度;高速公路信息资源共享与出行服务;相邻省份高速公路信息互通;高速公路绿色通道检测;高速公路机电系统防雷;高速公路气象监测;高速公路视频会议系统;高速公路三维地理信息系统;高速公路紧急救援系统等。
5、联网收费
电子不停车收费(ETC):联网ETC运营管理中的问题与对策;ETC客服体系的标准化;跨省市联网ETC有关问题探讨等。
计重收费:计重收费运营管理及系统升级改造探讨;ETC环境下计重收费系统的应用等。
路径识别:高速公路联网收费多义性路径识别;路径识别与ETC系统的联动;牌照识别技术在路径识别中的应用与发展等。
新技术应用:自由流收费技术的研究与应用;便携式收费技术的实践;无人值守的高速公路自动发卡机的应用等。
6、联网监控
高速公路视频监控的网络化与智能化;高清视频监控、全程监控系统的建设与应用;视频联网改造与系统设计;视频事件检测与应急处置;无线移动视频监控系统的应用等。
7、专用通信
高速公路通信系统升级改造与扩容;无线通信技术在高速公路的应用与发展;智能光网络系统的建设与应用等。
8、高速公路运营节能
隧道通风、照明及供配电节能;照明灯具的选择及智能控制研究与应用;隧道、收费站与服务区照明节能实践等。
9、新技术新产品展示
二、参会对象
省(区、市)交通主管部门;高速公路建设、运营、管理等单位和部门;高速公路机电与信息化工程设计、施工、监理、科研等单位和部门;各级公路学会会员单位;高速公路系统集成商、产品供应商等。
三、商务活动
大会将同期举办第17届中国高速公路信息化技术产品展示会,并将推出形式多样的商务活动,欢迎企业积极参与(详见商务活动报价表)。
四、会议地点
地点:南昌国际展览中心主馆、A馆、B馆
五、会议组织
主办:中国公路学会
承办:《中国交通信息化》杂志
六、会务组通联
ph136、9157、4660----=Q;279/1866//326
㈤ “人工智能”,“大数据”+教育如何驱动教育的未来
近日,由论答公司主办的教育大数据研讨会在北京举行,讨论会主题为“大数据+教育,有哪些可能性?”。本次研讨会主要关注数据在教育领域的应用,具体包括自适应学习、学习数据分析和教育数据挖掘。来自宾夕法尼亚大学、人民大学、华中师范大学的专家和企业界代表,共同探讨了教育大数据和自适应学习领域的技术趋势和产业机会
Ryan Baker是国际教育数据挖掘协会(International Ecational Data Mining Society)的创始人、《教育数据挖掘》杂志(Journal Ecational Data Mining)主编,在各类期刊和会议发表了260余篇学术论文,先后主持了美国科学基金会(National Science Foundation)、盖茨基金会(Gates Foundation)等研究基金的多项重大项目,累计获得研究经费超过1600万美元。
他也在哥伦比亚大学教育学院和爱丁堡大学同时担任教职,他在Coursera和edX上开设的“Big Data in Ecation(教育大数据)”课程,有来自100多个国家和地区的学生注册。
研讨会现场,Ryan Baker通过远程视频,分享了他对教育大数据的体验和应用。据他介绍,目前在教育大数据领域主要有四大研究组织,分别研究人工智能与教育、教育数据挖掘、学习数据分析和大规模学习。
Ryan Baker表示,在教育领域广泛应用大数据的时代正在到来。教育数据挖掘有很多的应用方向,包括:预测学生是会辍学,还是会成功完成学业;自动检测学生的学习投入程度、情感、学习策略,以更好地达到个性化;给教师和其他相关人员提供更好的报告;教育科学的基础研究和发现。
他认为,个性化教育至少要做到三件事情:
1、确定学生的有关数据;
2、了解对于学生的学习来说什么是真正重要的;
3、有针对性地为学生提供合适的教学。
而通过教育数据挖掘,我们可以推断很多事情:
学生的元认知和求助。比如,这个学生有多自信?当他需要帮助时,有没有在寻求帮助?他有没有在给自己解释问题,有没有思考这个答案是正确的还是错误的?最重要的,当他面临挑战时,能否坚持下去?
没有投入学习的行为。比如,“玩弄”系统,为了找到正确的答案,有的学生会试各种不同的答案,从“1”试到“38”。粗心,本身会做,但是不用心,最后给出的答案是错的。有些孩子会做非常难以解释的行为,比如不用方程符号,而是画了一个笑脸。
学生情感。Baker的研究团队和其他研究团队,已经创造了研究模型,可以根据数据推断,学生是否感到厌倦、沮丧、困惑、好奇、兴奋、快乐,是否投入,等等。
长期的学习结果。比如,学生能够记住刚才他学的东西吗?学生准备好学习下一个主题、下一个知识没有?中学生能上大学吗?他会从大学毕业还是辍学?
Ryan Baker表示,要获得这样的推断,只需要学生与系统交互的数据,不需要学生戴上头盔检测器。目前,这些模型已经开始大规模应用于自适应学习,应用于几十万的美国学生。Ryan Baker列举了一些自适应学习系统的案例。
Knewton
通过系统决定学生下一个要学习的问题是什么,已在全球的多个领域多个学科中运用。
ALEKS-ALEKS
用的是先行知识结构和知识点模型,来选择最适合学生的学习材料。比如,一个学生在学习上出现了问题,系统能够检测出来,是以前学的知识点出了问题,然后让学生回到以前的知识点上去学习。ALEKS系统应用于美国高中、大学的数学、科学学科。
Cognitive Tutor
系统能自动检测学生的知识,直到学生掌握为止。比如,系统不会让学生学习下一步的知识,直到他展示出他已经学好了他现在正在学习的知识。系统能够给学校提供数据报告,学校根据报告能够更好地让学生投入到学习中去。每年大约被50万的美国初高中生用于数学学习。
论答
论答公司的系统与ALEKS的系统有些类似,也是用先行结构和知识点模型,选择合适的学习材料。同时也是自动检测学生的知识状态直到学生掌握为止。应用领域目前包括数学和英语,完全针对中国学生开发。
Reasoning Mind
用各种自动检测的模型来检测老师的教学是否有效。通过数据生成报告给每个地区的教学管理员,让他们找到方法帮助老师提高教学。主要是用于美国的小学数学。
Duolingo
自动检测学生记忆,来决定什么时候回顾已经学过的知识。在全世界范围内应用于外语词汇的学习。
其他的像Civitas,Course Signals,Zogotech都是地区供应商,运用风险预测模型提供行动信息预测。它们会对学生做出预测,可能学不好、会失败,把报告提供给老师。已在世界范围内的大学应用。
Ryan Baker指出,在这些系统中,有足够的证据证明,至少以下两个系统是非常好的。
1、胡祥恩教授在美国做了大量实证研究,证明ALEKS系统对于帮助学生学习是有效的。他的研究证明,ALEKS系统对于不同人群的学生是同样有效的;特别值得提出的是,ALEKS可以帮助少数人群群体提高学习成绩。
2、Ryan Baker本人领导的研究团队与论答公司合作的研究表明,学生通过论答系统学习,比通过传统的在线学习系统学习,效果更好。他们在中国3个不同的地区做的3次实证研究,都证明了论答系统的有效性。
Ryan Baker分析了教育大数据算法模型的潜在发展方向。他认为,这些模型的长期潜力是,通过学生的知识和学习模型来确认,学生什么时候需要更多的支持:
首先是“mastery learning”,学生在掌握一个知识前,不会让他去学习下一个知识。当学生需要支持的时候,自动介入;同时告诉老师和父母,这个学生什么时候需要支持。
通过学习投入程度模型判断,学生什么时候开始变得厌倦、沮丧了,并调整学习活动,让厌倦的学生不再厌倦,让沮丧的学生的学习变得更容易一些。
学习投入程度模型还可以检测,在线学习中,什么样的学习活动,能让学生更容易地投入进去,并最终发现,什么样的学习活动对学生更好、对什么样的学生更好。
这样的模型也能告诉老师和父母,学生什么时候开始变得不再投入学习了。
还可以运用学习模型确认,学生什么时候没有真正学会,需要更多支持。
最后,Ryan Baker指出,下一步的目标是优化之前已经验证的经验和方法,然后把它们运用到系统中,最终让中国和世界上的数十亿学生受益。
讨论:“因材施教”的千年理想该如何照进现实?
王枫博士,论答公司(Learnta Inc.)创始人兼CEO
胡飞芳博士,美国乔治华盛顿大学(George Washington University)统计学终身教授,中国人民大学统计与大数据研究院的教授
胡祥恩博士,美国孟菲斯大学(University of Memphis)心理系、计算机科学系、计算机工程系终身教授,华中师范大学心理学院院长
马镇筠博士,论答公司联合创始人兼首席数据科学家
辛涛博士,北京师范大学中国基础教育质量监测协同创新中心常务副主任、博士生导师,兼任国家督学、教育部基础教育课程教材专家工作委员会委员、中国教育学会学术委员会委员。
技术发展到今天,“因材施教”如何实现?
王枫:因材施教,我首先到的是,每位学生学习的内容都不一样。如果有新的技术或者系统,系统应该像一个好老师一样,不会头疼医头脚疼医脚。比如说,一元二次方程做错了,好老师不会简单说一元二次方程做错了,你继续再做十道一元二次方程的题目,这其实是很差的老师,他没有真正去全面评判学生,到底是哪些掌握好、哪些掌握不好。
一个好的老师可能会说,我全面地看了你整个学习,可能你的问题不是出在一元二次方程上面,老师看了你做的题目,一元一次方程没有掌握好、因式分解也没有掌握好,你继续做一元二次方程是浪费时间。这就是从系统角度来说,系统做到了根据每个学生最基础的先行知识点的结构,给你提供最适合你当前学习的知识点,题目也好、视频也好、还有其他各种各样的学习内容。
胡飞芳:因材施教是我们教育的理想状态。孔子很早提出因材施教,在他当时的历史环境里面,因材施教可能更多是个体性的,因为那时学生少、老师也少,因材施教相对比较容易做到。
随着历史的发展,我们有更多的人需要教育时,我们做的一件事情是什么呢?就是做了一个标准化。标准化做的是什么?课堂教育。课堂教育从某种意义上来讲是标准化。现在这个历史阶段,教育大数据可能真正要做到的就是因材施教,自适应学习本身想做的也是这个。
胡祥恩:因材施教事实上在学习理论里有两个:一个是outerloop“学什么”,一个是innerloop“怎么学”。用技术来细化因材施教是教育产业走向成熟的一个标志。但是这个路非常非常难,因为“怎么学”那个层次非常非常难。
马镇筠:“因材”代表认识到学生的个体化差异,“施教”指进行差异化教学,这是根本思想。但如果考虑到时代背景,孔夫子时代专注的是学生的职业发展方向,也就是说,把适合当政治家的培养成政治家,把适合当学者的培养成学者。现在再提因材施教,我们其实能做得更多、更精细化。
比如,“因材”,对“材”的分类不仅是职业方向,还会考虑到学生的学习状态、学习目标、潜在能力、兴趣偏好等。而且,传统意义上的因材施教考虑的是学生个体间的差异,没有重视学生本身状态是在发生变化的,学生在不断学习,状态甚至兴趣各方面都可能发生变化。
但这些是自适应学习能够做到,甚至比传统的因材施教做得更好的地方。再说到“施教”,现在我们能做的几件事,包括学习路径推荐,给不同的学生匹配他最合适的学习内容,这种非常精细化的层面,我们已经有了一定的技术积累。
怎么判断一个产品做到了真正的自适应?
马镇筠:大多数产品的学习过程可以分为测、学、练,可以从这三个环节去看这个产品做到什么程度。
测,各种学习机构都有测评。但是国内只有论答团队第一个做出来能够在几十道题内,精准判断你一百个知识点,哪21个没掌握,哪79个掌握了。市场上大部分竞品,只会告诉你,知识点掌握率或者分数,79分或者知识掌握率达到79%;或者一些其他维度的总结,比如逻辑思维能力比较强、阅读的磨炼技巧比较好、学习动力哪方面稀缺。他们做了降维,本来很复杂的学习状态这样说出来,相对比较容易实现。但如果要做到具体告诉你,哪些知识点掌握、哪些知识点没掌握,这个难度就高很多了。
关于学习路径推荐的话,很多题库类的软件,知识点学完之后,会给一些题目推荐,但真正实现路径推荐的很少很少。路径推荐也是很核心的,有20个知识点没掌握,先学哪个知识点,后学哪个知识点,学习顺序是非常关键的,必须遵循循序渐进的原则,哪些知识点是前提知识点,哪些知识点是后续知识点,随机给你知识点去学习的话不能起到最好效果。真正到了练或学的环节,推荐什么样的视频,先推视频还是先推文字讲义,推简单题、中等难度题还是复杂题目,都需要根据学生实际情况来决定。
刚才只是举了几个例子,具体涉及到背后的算法、整个系统跟学习内容的结合以及整个教学流程的实现,中间很多环节必须要打通,形成一个闭环,才能对最终的结果负责。
辛涛:我的研究领域是教育和心理学的测量和评价。我个人的学术观察,基本上在现代这领域是两个类型。一个是心理测量领域,有一套成熟的方法,包括早期的IRT(Item Response Theory)和现在的ADT。另外一个是人工智能检测。心理测量系统,是一小群人在做;人工智能化是大的方向,现在是显学,给大家提供了明显的可能性。重要的是,那些背后的算法,能够在企业里真正实现出来。现在可能很多算法已经在那儿了,大体上路径是通的。
自适应学习基本上是把学习和评价联动起来了。因为,要自适应学习,必须有一个系统随时看到学生学到什么程度,这个完全是评价。但是,评价完了之后有一个新的呈现。这一块现在已经有一些很成熟的一些东西了,但不是一时半时可以说得特别具体的。
我做教育的测量和心理测量,人工智能那块我不熟。但是,从教育测量角度来说,在自适应学习和新技术结合之前,很大一块还是自适应考试,CAT(computer adaptive test)。系列化产生一个CAT变成了一个自适应学习的过程。总的来说,使用最简单、最机械化的方法,连续的CAT实际上是可以破解一个学习过程的。
测评本身经历了好几个阶段,通常用三个应用介词表示。
accessment to learning and teaching;
现在国家倡导的,accessment for learning and teaching,测评要对学习和教学有帮助;
跟信息化结合,accessment as learning and teaching,它是学习提供的完全融合的一个环节。
王枫:什么样的自适应学习系统才是真正的高级自适应学习系统?在中国的落地到底是怎么样才能真正落地?我在马博士的基础上想补充一点。
自适应系统如果一定要分级,也可以简单分一下。一种最基础的系统是基于规则的,比如说埋点。一个学生做10道一元二次方程题目,我预先埋好了,你做错了,立马给你推五道一元一次方程题目、五道因式分解题目。这个是埋点埋好了,这是规则,预先由老师或公式设置好了。
但这个规则有用性是非常有限的,因为每个学生不一样,A学生是因为一元一次方程不会,B学生可能是因式分解不会,C学生可能连小学的乘法快速运算都不会,这个没法预先直接埋点准备好。
所以自适应系统真正到了更高级一点的话,一定是真正通过大数据、根据算法模型来分析学生的学习数据,匹配下一步应该学什么。
在中国,自适应学习有效应用于教学有三个前提条件。做到这三点,自适应学习在中国的教育里面前途无限。
好的产品。必须要有针对中国本土化的自适应学习产品,把它开发出来。像ALEKS系统的确算法不错,但里面连一套国内的高考题都没有,家长不会让小孩子用这样的系统,因为直接影响应试目标。真正本土化开发的话,没有一成不变的算法,世界上最好算法就是没有开发出来的。教育非常复杂,每个学科不一样。比如数学后台有强大的关系,先行后续关系;英语没达到数学这么强的相关性,但算法是一样可以应用的。
好的学生、家长、老师。有了好的产品,首先学生应该真正投入进去学习。像Ryan Baker教授讲的,学生如果随便学一下,再好的系统也没用。第二,家长得督促孩子学习。第三,老师非常重要。老师应该做有价值的事情,比如给学生做个性化的辅导答疑,给学生针对性的讲解,组织学习活动小组,鼓励学生发挥创造能力,领导能力的培养。
学校以点带面。学生大部分时间都在学校里面学习。如果学校里最基本的、有效的在线教学产品都不应用的话,其实是有问题的。但是改变绝对不是简单的行政命令可以解决的。一个好的产品,一定是从点到面,逐步推广。自适应学习,更适合有明确目的的学习,像应试教育这块可以做得更好。所以学校可以应用进去。
胡祥恩:我觉得大家做自适应也好、因材施教也好,比较好的例子大家可以看一看。教育这个领域有多大,自适应概念就该有多宽。所以说,实验室里面有很多小的做得非常非常好的东西,只是没有到市场上面去,有很多非常非常巧妙的算法、一些东西。你会发现很多欧洲的、美国的实验室做的system,我每次看了都有种,自己是坐井观天的感觉。
怎么看待人工智能在教育中的应用?
胡飞芳:AlphaGo跟master,谷歌做了一个非常好的广告,人工智能在某些方面可以做得非常好。但是,我现在给你们讲另外一个谷歌自己不会去说的例子,但这也是事实。2008年、2009年的时候,谷歌推出一个免费产品,用各种搜集到的数据,预测美国的流感发展趋势。开始时很成功,预测跟实际发生的情况很相似。但到2015年,他自动撤回去了,不再提供预测。因为在2012跟2013年预测的时候,预测结果跟实际情况相差非常远。
这说明像这种不确定性的问题,人工智能还有非常大的局限性。一旦有不确定的数据,就有噪音。数据量很大时,大数据可能产生大噪音。怎样使噪音下降?2015年一个哈佛教授的研究团队在谷歌的基础上,用谷歌的数据去做同样的预测。他用了什么呢?就是用了模型,实际上模型在很多时候降噪是很有用的,用模型去预测,而不完全是人工智能的方式去预测。结果,他做出来的预测基本都比较准。
人工智能相对比较成功的,是比较确定的问题,所谓的确定是不管有多少种可能性,还是一个确定的东西。而流感很多时候是完全不确定的因素。
教育其实很多时候也是不确定的。同样一个人,现在让他回答这个问题,他可能思路清楚地回答出来;过了一个小时后,即使是同样类型的问题,按道理他应该回答出来,结果他回答不出来。这是说,实际上有很多因素在干扰的时候,人工智能的功能是不是会减少一点。把模型跟人工智能加在一起,会弥补人工智能在某些方面的弱点,这样会更好。
怎样促进商界和学界的交流,更好地把学界已经有的一些成果,运用到市场上来?
胡祥恩:教育产业应该是一个最大的产业,教育产业事实上是一个知识产业链。到目前为止,很多人认为自己要做一整套系统而在美国汽车业,最赚钱的是供应商,是做轮胎、做玻璃的。一旦标准化之后,一个人如果螺丝钉生产得最好,他就能够养活几家人、几代人。
到目前为止,美国推的就是教育标准化,教育内容的标准化、教育技术的标准化。比如说97年的时候,就说怎么样把内容标准化,你做的东西我可以用。我只是做整个教育知识产业链里面一个小块,做得很好。教育整个的产业链,有可能发挥特别特别技巧的那些小的公司,就能够在这个产业链里面生存、可以做得很好。第一个是要标准化,第二个要理解整个教育是一个产业链。
㈥ 中国人民大学举办数据科学与工程学术报告会
中国人民大学重点实验室举办数据科学与工程学术报告会,此次报告会的目的是为了更好地了解工业界的实际需求以及平台的使用情况,加强同行之间的学术交流,促进中国人民大学计算机学科的发展,来自滴滴大数据与数据挖掘研究院的李佩博士、苏州大学的李直旭副教授、刘冠峰副教授和刘安副教授四位青年学者受邀作报告。
中国人民大学信息学院下设经济信息管理系、计算机科学与技术系、数学系,以及数据工程与知识工程研究所、管理科学与工程研究所,其中数据工程与知识工程研究所是教育部重点实验室。
李佩博士结合过去自己在LinkedIN公司的工作经验,给我们介绍了LinkedIN公司的大数据誉罩系统PYMK及其相关的生态系统。同时,也对当前流行的大数据处理平台Hadoop、Spark及各自的生态圈作了一个系统的介绍。此外,他还介绍了滴滴出行在大数据技术面临的机遇与挑战。最后,李佩博士结合自己在英属哥伦比亚大学的读博经历,向在校生推荐了大数据与机器学习领域必读的经典教材,并对他们未来的择业提出了一些中肯的建议。
李直旭副教授报告的题目是“借助Web大数据来处理数据质量问题”。李直旭副教授从六个维度( 错误数据、不一致性、丢失数据、过时数据、不适用、不确定性)介绍了数据质量问题普遍存在的一个基本事实,并简要地综述了围绕每一个维度处理数据质量问题的相关工作。结合其近年来的相关工作,以关系数据为依托,李直旭副教授分别介绍了如何借助Web中的大数据来进行记录连接(record linkage)和记录的补全工作。
刘冠峰副教授报告的题目是“社交网络与信任”。刘冠峰副教授首先介绍了社交网络及基于让芹社交网络的各类应用,并着重指出社交网络中参与人之间的信任关系是整个社交网络各类应用的基础。基于此前提,刘冠峰副教授对其发表在ICDE‘2015(数据库A类会议)上就如何快速有效地挖掘出符合参与人之间预设信任关系的方法进行了详细的阐述。
刘安副教授系统地介绍了加密轨迹数据上的相似性计算问题。除了阐述了加密轨迹数据上的相似性计算面临的挑战,其还详细地介绍了如何通过重写三个操作符(欧氏距离计算、最大最小选择、条件执行),来实现加密轨迹数据上的相似性计算,并从理论上证明了该方法的安全性和可靠性。
以最近开源的大数据处理系统Greenplum为背景,Greenplum系统开发团队的刘奎恩博士即兴分享了其在大数据时代进行数据库开源的背景与意义。
除了在校师生,中国人民大学举办的本次报告还吸引了来自工业界和学术界(包括CCF大数据协会、中科院、EMC/Pivotal公司、网络、先锋创投等)的相关人士近50人前来参会,大家提问踊跃,本次报告得到圆满的成功。
李佩博士:2010年硕士毕业于中国人民大学信息学院数据库与智能信息检索实验室,2014年底博士毕业于英属哥伦比亚大学计算机系数据管理与挖掘实验室。2013年6月到8月以及2015年初到9月,工作于美国加州山景城LinkedIn公司SNA(搜索、网络与分析)部门,担任关系推荐系统工程师,在大数据管理与挖掘第一线从事研发工作。2015年10月至今,在滴滴出行研究院负责数据挖掘项目。在知名国际期刊和学术庆滑闹会议上(包括KDD、ICDE等A类国际会议)发表论文近20篇,是数据挖掘知名会议SDM’10的最佳论文获得者。
李直旭副教授:2002-2009年就读于中国人民大学信息学院攻读计算机学士和相关证书。2013年毕业于澳大利亚昆士兰大学获计算机科学博士学位。2013-2014年就职于沙特阿卜杜拉国王科技大学(KAUST)做博士后研究员,并于2014年入职苏州大学计算机科学与技术学院。目前主要从事数据质量,大数据应用,数据挖掘与信息抽取等领域的研究工作。曾参与国内外多项科研基金项目的研发工作。在IEEE TKDE, EDBT, CIKM, WWWJ等顶级国际期刊与知名国际会议上发表论文30余篇。
刘冠峰副教授:2013年毕业于澳大利亚 Macquarie 大学,获得计算机博士学位。 博士论文获得当年澳大利亚最佳博士论文提名。2013年1月至2013年8月就职于Macquarie 大学 (Research Fellow) 和 悉尼科技大学 (Visiting Research Fellow),并于2013年9月入职苏州大学。目前主要从事可信计算、社交网络信息挖掘、图数据库等领域的研究工作。曾参与多项澳洲科研基金项目研究。在ICDE、AAAI、TSC、FGCS、WWWJ、ICWS,等重要国际期刊与知名国际会议上发表论文20余篇。
刘安副教授:2009年获得中国科学技术大学和香港城市大学联合培养博士学位,2009年至2013年在香港城大-中国科大联合高等研究中心担任Senior Research Associate,2013年底加入苏州大学。研究方向主要集中在数据管理与分析方面,包括时空数据库,数据安全与隐私,云计算与服务计算等。在国际期刊和学术会议上(包括IEEE Trans., CCF推荐的A/B类国际会议)发表论文50多篇。
考研政策不清晰?同等学力在职申硕有困惑?院校专业不好选?点击底部官网,有专业老师为你答疑解惑,211/985名校研究生硕士/博士开放网申报名中:https://www.87dh.com/yjs2/
㈦ 电力大数据的电力大数据技术
电力大数据技术满足电力数据飞速增长,满足各专业工作需要,满足提高电力工业发展需要,服务经济发展需要。电力大数据技术包括:高性能计算、数据挖掘、统计分析、数据可视化等。 数据挖掘技术是通过分析大量数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。
数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等等。 统计分析,常指对收集到的有关数据资料进行整理归类并进行解释的过程。 统计分析可分为描述统计和推断统计。
1、描述统计
描述统计是将研究中所得的数据加以整理、归类、简化或绘制成图表,以此描述和归纳数据的特征及变量之间的关系的一种最基本的统计方法。描述统计主要涉及数据的集中趋势、离散程度和相关强度,最常用的指标有平均数、标准差、相关系数等。
2、推断统计
推断统计指用概率形式来决断数据之间是否存在某种关系及用样本统计值来推测总体特征的一种重要的统计方法。推断统计包括总体参数估计和假设检验,最常用的方法有Z检验、T检验、卡方检验等 2012年7月10日,信通公司成功举办大数据开启智能电网新时代研讨会。本次研讨会作为公司大数据战略推进重要一环,总结公司大数据战略实施以来的重点工作,加深理解大数据对电力信息通信事业的意义,促进大数据生态环境建设,并展望公司及大数据未来发展方向。本次研讨会特别邀请了中国宽带资本基金董事长田溯宁博士、《证析》作者郑毅先生、浙江海盐供电局徐光年主任做专题演讲。
研讨会的成功举办,使大家进一步了解了大数据、信息通信技术在智能电网发展、未来科技发展的重要意义,同与会各位专家的交流也使大家开阔了视野、增长了知识。本次研讨会也标志了电力大数据战略将进入攻坚实战阶段,与会人员纷纷表示,要牢牢把握住电力信息通信引领智能电网飞速发展的宝贵机遇,以昂扬的斗志面对新的挑战! 2012电力行业信息化年会于2012年11月3-4日在北京举行。年会由中国电机工程学会电力信息化专业委员会、国网信息通信有限公司联合主办,南瑞集团国电通公司承办。国家电监会信息中心、国家电网公司信息化工作部、中国南方电网公司信息中心、中国电力建设集团公司信息中心、中国能源建设集团有限公司科技信息部以及各发电集团公司、各省电网公司信息部门等为会议的支持单位。
本次年会主题为“大数据与宽带中国”。“大数据”将给电力企业带来新一轮商业模式转变和价值创新,宽带中国战略更为电力信息化发展提速。来自国家电力监管委员会、国家电网公司、国网信息通信有限公司、辅业集团公司、发电集团公司、网省公司等单位的30多位专家和代表将围绕主题在年会上发言或演讲。
㈧ 我爱我家网的大事件
2015年12月18日,2015互联网家装研讨会暨我爱我家网全国供应商大会在上海召开,我爱我家网与50多家供应商达成战略合作,表示要共同打造最强供应链体系
2015年12月4-6日,2015中国家居业重塑产业链价值大会暨中国家居业领军企业家年会在北京园博园顺利举行,因在重塑供应链价值方面的杰出贡献,我爱我家网荣获中国家居电商十强称号。
2015年7月8日,第二届中国家居电商与诚信建设大会暨中国互联网家装与泛家居论坛在广州举行,我爱我家荣膺中国家居电商十大诚信品牌。
2015年7月3日,2015中国家居景气报告发布,我爱我家荣获“十大家居电商品牌”。
2015年4月10日,我爱我家完成股份制改造,上海鸿洋电子商务股份有限公司正式挂牌成立。
2015年3月26日,我爱我家全国家装平台(江苏)正式启动与运营,全面布局江苏。
2015年3月7日,我爱我家主办的“2015中国家居电子商务研讨会”在上海成功举行,众多行业大咖齐聚峰会,为行业发展注入了新活力。
2015年3月7日,我爱我家新年首秀正式拉开帷幕,两天实现有效签到数7176,下单数5648,销售额2406万,再创历史新高。
2014年11月28日,我爱我家与宝鹰股份、中建南方宣布共同建立工装供应链平台,一个目标总量过千亿的工程材料平台正呼之欲出
2014年11月18日,我爱我家全国家装O2O启动盛典暨装修宝APP发布会在上海盛大举行,全新家装平台重磅登场,移动互联网战略重大升级。
2014年5月1日,我爱我家首个异地展厅——苏州线下智能体验中心开业,我爱我家开始全国范围内的业务拓展。
2014年3月19日,上市企业报鹰股份1.08元入股我爱我家,我爱我家成功进行B论融资。
2013年11月27日,我爱我家召开供应商大会,业内首创“电商+店商+专业服务商”的新型O2O,引领行业发展新方向
2013年5月23日,举办第三届“家居电子商务高峰论坛暨我爱我家网9周年庆”,围绕“大数据”“O2O”“新媒体”等主题展开头脑风暴,引发多方媒体的关注与报道。
2013年,国内首家超万平米线下建材家居智能展厅在上海投入使用,我爱我家开启行业新时代。
2012年,首轮VC资金成功进入,我爱我家开始发力。
2011年,我爱我家顺利实现盈利,成为电商领域为数不多的赢利企业。
2011年,荣获“上海名牌”企业称号。
2010年,被互联网权威评测机构—艾瑞网评为行业网站第一名。
2009年,荣获上海市科委颁发的“上海市科技进步奖”。
2008年,被认定为上海市高新技术企业;同年被评为上海市电子商务应用领先示范企业。
2008年,开始加大商品经营种类,逐步转型B2C,我爱我家开始进入高速发展期。
2005年,转型B2B的网上销售建材
2003年,我爱我家网在上海创立