Ⅰ 为什么棒球第四棒是强棒
我的理解是,在现代职业棒球中,特别是在美国职业棒球大联盟中,四名棒球击球手无疑都很强,但有一种“弱化”的趋势,而队里最好的击球手也不会是第四名棒球。根据过去的经验,我们称3-6棒球为中心线。他们的远距离打球能力和打几圈的能力无疑是球队九个垒球中最好的先发球员。。当他处于危险中时,这降低了他的力量,而且没有秘密武器可用。第二,三板斧本身存在一定的缺陷,球场形势变化迅速,第二板斧可能面临两次出局/得分的局面,第四板斧可能面临空位,这就要求教练要考虑到自己球队的特点。里金线和其他投手全面展开,但不能。遵循一个简单的原则。例如,如果今天对手的先发球员是左撇子,你可以适当考虑右撇子在前面的位置;我们队的一个球员不能打滑杆(裁判是指你!)你可以考虑在遇到一个棘手的开始时回击他。尽管前段球拍的机会更多,但对于许多击球力量不均等的球队来说,把最强的球员放在一场、两场、三场或四场比赛中并不是一个好的选择。这将导致许多比赛中,对手可以很容易地选择交付故意,这是不容易形成打击字符串。团结一致。在后一部分中,盲枪被蝙蝠伏击,两个基地之间危险的快速腿可能对对手造成意想不到的打击。甚至还有一些例子表明,为了增强第二条腿的力量,最好的球员会回来。在投手非常强大的比赛中,打破僵局或制造混乱的能力非常重要。这就要求在中央打击线不能打开的情况下,前后的打击者仍能独立作战。
Ⅱ 关于大数据的作文
在第86届奥斯卡颁奖典礼上,莱昂纳多·迪卡普里奥又一次落选影帝的那一刻,你有没有为直播镜头中眼含泪光的他感到心疼?这已经是他第四次获得提名而希望落空了。
但你本没必要怀揣期待—莱昂纳多本人也是,因为微软纽约研究院的经济学家大卫·罗斯柴尔德在此前就宣布,最佳男主角花落《达拉斯买家俱乐部》主演马修·麦康纳的概率高达90.9%。
这个数字是在收集了赌博市场、好莱坞证券交易所、用户自动生成信息等大量公开数据后,建立的预测模型所分析出来的结果。事实证明,大数据赢了:在本届奥斯卡共24个奖项中,大卫预测中了21个,包括竞争最激烈的“最佳原创剧本奖”。
事实上,大卫去年就“猜”到了第85届奥斯卡的19个奖项;2012年,他用一个数据驱动模型正确预测了美国51个行政区中50个的总统大选结果;其他“业务”还包括预测一年一度的“超级碗”(美国国家橄榄球联盟年度冠军赛)赛事结果……以至于每当此类事件发生,人们都会去他的官方网站PredictWise上看看“先知”怎么说。
大数据时代,惊喜已死。
不过,相比于影迷和体育比赛观众,政客与商人更欢迎大数据。他们需要的不是惊喜,而是洞察力,然后“对症下药”。
最成功的案例大概是位于芝加哥的牛排连锁餐厅Morton。
当一位顾客开玩笑地通过Twitter要求它在自己乘飞机抵达纽约时准时送上外卖,一场品牌营销就开始了。首先分析推特数据,发现该顾客是本店常客,再根据以往的订单记录推测出其所乘的航班,然后派出一位身着燕尾服的侍者提前抵达机场,为客户呈上晚餐—一炮而红。
如此突破想象力而实用的技能,为数据分析师们带来了更多的工作机会。大数据领域最优秀的科学家们纷纷转行股票、期货,乃至赌博。如果你能准确预测九成英超足球联赛的比赛结果,情况会怎样?Betegy会告诉你:一夜暴富不再是梦想。这家波兰在线扑克游戏公司正将勃勃野心扩展到更广阔的博彩业,它为全球21个国家的职业联赛提供结果预测服务,并宣称对英超的预测准确率高达90%。
如何做到这一点?利用双层数据。第一层包括基本统计信息,如最近表现、两队对抗历史、阵容以及平均进球数。第二层则更深一步,将天气及其他可能影响球员发挥的因素考虑在内。不过,该公司对其他一些比赛的预测成功率仅有50%。
被称为美国“算法之神”、曾为棒球网站写比赛预测的奈特·西尔弗也给赌徒们泼了一盆冷水。他曾在采访中说:“我一般都在下注时赌相反的结果,因为其他人会按我说的来,如果我跟他们一样,估计赢不了。”
那么,被大数据夺走了“惊喜”的普通人,能获得怎样的补偿呢?或许奈特的这项研究比较易于操作—通过分析想要维持长期恋爱关系和想要一夜情的人在一周中不同时间外出约会的比例,他建议:想寻找刺激的话,在周三出去碰碰运气吧。
Ⅲ 自由数据告诉你,大数据分析哪个领域运用最多
大数据有很多奇妙得运用,帮助人们真正从中获益。社会中的大多数企业基本会受到大数据分析的影响,但大数据是是如何增加企业及其产品价值的呢?
下面让我们来看看9个大数据高效益运用的关键领域:
1.拓展客户,分析客户需求,提供客户需要的服务
这是大数据应用最普遍,也最广为人知的一个领域,其主要方向是企业通过大数据分析更好地了解自己客户的行为和喜好。为了更全面的获得这些信息,企业都热衷于手机社交媒体、浏览器日志、文本分析和传感器的相关数据。一切工作的总目标是创建预测模型,比如美国零售商Target通过大数据分析可以准确地预测客户什么时候想要小孩,沃尔玛可以更好地预测哪些产品将会热卖,而政府能更好的掌握政务与群众生活的相关性。
2.企业对内优化业务流程,提升工作效率
在很多领域中,大数据越来越多地用于业务流程的优化,主要手段是收集社交媒体数据、网络搜索趋势及天气预报等方面大数据信息,进行大数据分析,从中挖掘出有针对性的预测信息,使得包括零售商在内的大多企业可以准确精细的分析出自身业务流程的优势和不足,并根据大数据分析得出的结论找到合适的调整方式与业务模式。比如人力资源业务流程也能够通过使用大数据分析来改进,优化人才招聘,衡量企业文化和运功参与度等之类的问题。
3.机器和设备的性能优化
在大数据时代,机器和设备的发展趋势必然是更加智能和自主化,像被大数据工具运行的谷歌自驾车、GPS及强大的计算机和传感器,在未来的道路上,不再需要人工的干预。
4.国家提高安全和执法
信用卡安全、网络安全、犯罪活动等都是治安执法的不变的主题,警察可以使用大数据工具来捉住最烦,预测犯罪活动,而信用卡公司可以利用大数据工具来检测欺诈性交易。大数据被广泛运用于治安执法的过程中,提高了执法的灵敏性,增加了对犯罪和恐怖主义活动的可控、可预测性。
5.智慧城市建设和智能化转型
大数据在国家安全和执法中的运用,改善了安全和执法,同时也是城市与国家转型的必要工具。很多城市都在试点运用大数据分析技术,将交通和公共设施纳入智能化的范围,试图转变为智能城市。大数据分析技术基于城市的实时交通信息、社交媒体和天气数据,适时优化交通情况,汇总成实时交通讯息。除此之外,在城市和国家转向智能化的过程中,大数据工具和技术能提供的是一个不可或缺的平台和道路。
6.个人生活中息息相关的大数据
适用于政府和企业的大数据,其实也适用于个人的生活。当人工智能产品进入日常的生活(如智能手表),我们就可从穿戴设备的应用中生成数据,追踪个人的热量消耗、睡眠模式等。甚至大数据也能成为寻找爱情的好帮手,众多社交平台和网站都运用大数据工具和算法分析用户的属性等其他信息,帮助自己的用户寻找到最合适的对象。
7.大数据使医疗技术应用和研发更快捷、高效
如每个人能受益于智能产品一样,在医疗卫生领域,大数据也能帮助医生更好的研究、诊断和治疗疾病。目前,大数据技术已被用来监视早产婴儿以及患病婴儿,记录每次心跳,分析呼吸模式,医生能在任何不适症状出现之前预测24小时内的病情,使得患病婴儿得到更早的救助。未来的临床实验不仅局限于小样本,更会服务于每个人,并且使医护人员与研究人员能更好地理解和预测疾病模式,运用大数据分析的计算能力能在几分钟内解码整个DNA,缩短找到新治疗方法的周期。
8.全方位追踪运动员以获得更优的改进
在运动领域运用大数据分析技术已不占少数,这样的监测几乎渗透进了运动员生活的方方面面。比如网球鼻塞的TBM Slam Tracker工具,它使用视频分析追踪足球或棒球比赛中每个球员的表现。而若在运动器材中使用传感器技术,(如篮球或高尔夫俱乐部)则是通过获得鼻塞的数据,以分析结果为依据进行改进。除此之外,不少的精英运动队还利用智能技术追踪赛外运动员的活动,获得其营养状况及睡眠,甚至是社交对话等更日常、细节的信息监控其情感状况。
9.金融交易中使用,精准卖出和买入
金融行业应用大数据主要是在金融交易一块,尤其是高频交易(HFT)领域。大多数股权交易都是通过大数据算法进行的,这些算法越来越多地开始考虑社交媒体和新闻网站的影响因素,以此在几秒内作出买入和卖出的决定。
上述9个领域是目前应用大数据最多的领域,随着大数据工具越来越普及,还会有更多的其他应用领域,以及更多新的应用。
提供大数据工具和技术的平台也会随之增多,覆盖领域更广更全。作为国内优秀的企业数据定制服务平台之一, 自由数据 致力于为企业和开发者提供优质的数据资源、 API接口 和 数据定制服务 等,重点覆盖企业征信数据、 金融数据 、 社会舆情 、 生活数据 等领域。
Ⅳ 漫谈大数据的思想形成与价值维度
漫谈大数据的思想形成与价值维度
清华基于微博分析获得的大数据幸福指数发现人们周六最幸福,相信大家心情不错,因此今天不谈枯燥的技术。关于大数据的思维、理念、方法论已经被反复消费了,本来我想直接进入交互环节,继挺兄还是要求先有一部分规定动作,我就先自弹自唱几十分钟,既然是漫谈,也不见得扣题,说到哪里是哪里。各位有问题,我可以择时择机插入讨论。
先说大数据思想的形成吧。自从人类开始文字和数字,数据就开始产生。就数据增长曲线而言,极小的初值确实要经历漫长的过程达到人类能感知的曲线拐点。谷歌前CEO埃里克·施密特曾给出了一个有趣的数据:从人类文明曙光初现到2003年一共产生的数据,只相当于2010年两天产生的数据量。而一旦越过拐点,“大数据摩尔定律”的滚滚铁轮下,指数效应爆发:最近两年产生的数据量相当于之前产生的全部数据量。
在漫长的数据蓄水过程中,数学和统计学逐渐发展,人们开始注意对数据的量化分析,在人类进入信息时代以前这样的例子就不胜枚举。比如经济上,黄仁宇先生对宋朝经济的分析中发现了“数目字管理”(即定量分析)的广泛应用(可惜王安石变法有始无终)。又如军事,“向林彪学习数据挖掘”的桥段不论真假,其背后量化分析的思想无疑有其现实基础,而这一基础甚至可以回推到2000多年前,孙膑正是通过编造“十万灶减到五万灶再减到三万灶”的数据、利用庞涓的量化分析习惯对其进行诱杀。
到上世纪50-60年代,磁带取代穿孔卡片机,启动了数据存储的革命。磁盘驱动器随即发明,它带来的最大想象空间并不是容量,而是随机读写的能力,这一下子解放了数据工作者的思维模式,开始数据的非线性表达和管理。数据库应运而生,从层次型数据库(IBM为阿波罗登月设计的层次型数据库迄今仍在建行使用),到网状数据库,再到现在通用的关系数据库。与数据管理同时发源的是决策支持系统(DSS),80年代演变到商业智能(BI)和数据仓库,开辟了数据分析——也就是为数据赋予意义——的道路。
那个时代运用数据管理和分析最厉害的是商业。第一个数据仓库是为宝洁做的,第一个太字节的数据仓库是在沃尔玛。沃尔玛的典型应用是两个:一是基于retaillink的供应链优化,把数据与供应商共享,指导它们的产品设计、生产、定价、配送、营销等整个流程,同时供应商可以优化库存、及时补货;二是购物篮分析,也就是常说的啤酒加尿布。关于啤酒加尿布,几乎所有的营销书都言之凿凿,我告诉大家,是Teradata的一个经理编的,人类历史上从没有发生过,但是,先教育市场,再收获市场,它是有功的。
仅次于沃尔玛的乐购(Tesco),强在客户关系管理(CRM),细分客户群,分析其行为和意图,做精准营销。
这些都发生在90年代。00年代时,科研产生了大量的数据,如天文观测、粒子碰撞,数据库大拿吉姆·格雷等提出了第四范式,是数据方法论的一次提升。前三个范式是实验(伽利略从斜塔往下扔),理论(牛顿被苹果砸出灵感,形成经典物理学定律),模拟(粒子加速太贵,核试验太脏,于是乎用计算代替)。第四范式是数据探索。这其实也不是新鲜的,开普勒根据前人对行星位置的观测数据拟合出椭圆轨道,就是数据方法。但是到90年代的时候,科研数据实在太多了,数据探索成为显学。在现今的学科里,有一对孪生兄弟,计算XX学和XX信息学,前者是模拟/计算范式,后者是数据范式,如计算生物学和生物信息学。有时候计算XX学包含了数据范式,如计算社会学、计算广告学。
2008年克里斯·安德森(长尾理论的作者)在《连线》杂志写了一篇《理论的终结》,引起轩然大波。他主要的观点是有了数据,就不要模型了,或者很难获得具有可解释性的模型,那么模型所代表的理论也没有意义了。跟大家说一下数据、模型和理论。大家先看个粗糙的图。
首先,我们在观察客观世界中采集了三个点的数据,根据这些数据,可以对客观世界有个理论假设,用一个简化的模型来表示,比如说三角形。可以有更多的模型,如四边形,五边形。随着观察的深入,又采集了两个点,这时发现三角形、四边形的模型都是错的,于是确定模型为五边形,这个模型反映的世界就在那个五边形里,殊不知真正的时间是圆形。
大数据时代的问题是数据是如此的多、杂,已经无法用简单、可解释的模型来表达,这样,数据本身成了模型,严格地说,数据及应用数学(尤其是统计学)取代了理论。安德森用谷歌翻译的例子,统一的统计学模型取代了各种语言的理论/模型(如语法),能从英文翻译到法文,就能从瑞典文翻译到中文,只要有语料数据。谷歌甚至能翻译克莱贡语(StarTrek里编出来的语言)。安德森提出了要相关性不要因果性的问题,以后舍恩伯格(下面称之为老舍)只是拾人牙慧了。
当然,科学界不认同《理论的终结》,认为科学家的直觉、因果性、可解释性仍是人类获得突破的重要因素。有了数据,机器可以发现当前知识疆域里面隐藏的未知部分。而没有模型,知识疆域的上限就是机器线性增长的计算力,它不能扩展到新的空间。在人类历史上,每一次知识疆域的跨越式拓展都是由天才和他们的理论率先吹起的号角。
2010年左右,大数据的浪潮卷起,这些争论迅速被淹没了。看谷歌趋势,”bigdata”这个词就是那个时间一下子蹿升了起来。吹鼓手有几家,一家是IDC,每年给EMC做digitaluniverse的报告,上升到泽字节范畴(给大家个概念,现在硬盘是太字节,1000太=1拍,阿里、Facebook的数据是几百拍字节,1000拍=1艾,网络是个位数艾字节,谷歌是两位数艾字节,1000艾=1泽);一家是麦肯锡,发布《大数据:创新、竞争和生产力的下一个前沿》;一家是《经济学人》,其中的重要写手是跟老舍同著《大数据时代》的肯尼思?库克耶;还有一家是Gartner,杜撰了3V(大、杂、快),其实这3V在2001年就已经被编出来了,只不过在大数据语境里有了全新的诠释。
咱们国内,欢总、国栋总也是在2011年左右开始呼吁对大数据的重视。
2012年子沛的书《大数据》教育政府官员有功。老舍和库克耶的《大数据时代》提出了三大思维,现在已经被奉为圭臬,但千万别当作放之四海而皆准的真理了。
比如要数据全集不要采样。现实地讲,1.没有全集数据,数据都在孤岛里;2.全集太贵,鉴于大数据信息密度低,是贫矿,投入产出比不见得好;3.宏观分析中采样还是有用的,盖洛普用5000个样本胜过几百万调查的做法还是有实践意义;4.采样要有随机性、代表性,采访火车上的民工得出都买到票的结论不是好采样,现在只做固定电话采样调查也不行了(移动电话是大头),在国外基于Twitter采样也发现不完全具有代表性(老年人没被包括);5.采样的缺点是有百分之几的偏差,更会丢失黑天鹅的信号,因此在全集数据存在且可分析的前提下,全量是首选。全量>好的采样>不均匀的大量。
再说混杂性由于精确性。拥抱混杂性(这样一种客观现象)的态度是不错的,但不等于喜欢混杂性。数据清洗比以前更重要,数据失去辨识度、失去有效性,就该扔了。老舍引用谷歌PeterNovig的结论,少数高质量数据+复杂算法被大量低质量数据+简单算法打败,来证明这一思维。Peter的研究是Web文本分析,确实成立。但谷歌的深度学习已经证明这个不完全对,对于信息维度丰富的语音、图片数据,需要大量数据+复杂模型。
最后是要相关性不要因果性。对于大批量的小决策,相关性是有用的,如亚马逊的个性化推荐;而对于小批量的大决策,因果性依然重要。就如中药,只到达了相关性这一步,但它没有可解释性,无法得出是有些树皮和虫壳的因导致治愈的果。西药在发现相关性后,要做随机对照试验,把所有可能导致“治愈的果”的干扰因素排除,获得因果性和可解释性。在商业决策上也是一样,相关性只是开始,它取代了拍脑袋、直觉获得的假设,而后面验证因果性的过程仍然重要。
把大数据的一些分析结果落实在相关性上也是伦理的需要,动机不代表行为。预测性分析也一样,不然警察会预测人犯罪,保险公司会预测人生病,社会很麻烦。大数据算法极大影响了我们的生活,有时候会觉得挺悲哀的,是算法觉得了你贷不贷得到款,谷歌每调整一次算法,很多在线商业就会受到影响,因为被排到后面去了。
下面时间不多了,关于价值维度,我贴一些以前讲过的东西。大数据思想中很重要的一点是决策智能化之外,还有数据本身的价值化。这一点不赘述了,引用马云的话吧,“信息的出发点是我认为我比别人聪明,数据的出发点是认为别人比我聪明;信息是你拿到数据编辑以后给别人,而数据是你搜集数据以后交给比你更聪明的人去处理。”大数据能做什么?价值这个V怎么映射到其他3V和时空象限中?
再贴上解释。“见微”与“知著”在Volume的空间维度。小数据见微,作个人刻画,我曾用《一代宗师》中“见自己”形容之;大数据知著,反映自然和群体的特征和趋势,我以“见天地、见众生”比喻之。“著”推动“微”(如把人群细分为buckets),又拉动“微”(如推荐相似人群的偏好给个人)。“微”与“著”又反映了时间维度,数据刚产生时个人价值最大,随着时间decay最后退化为以集合价值为主。
“当下”和“皆明”在Velocity的时间维度。当下在时间原点,是闪念之间的实时智慧,结合过往(负轴)、预测未来(正轴),可以皆明,即获得perpetual智慧。《西游记》里形容真假孙悟空,一个是“知天时、通变化”,一个是“知前后、万物皆明”,正好对应。为达到皆明,需要全量分析、预测分析和处方式分析(prescriptiveanalytics,为让设定的未来发生,需要采取什么样的行动)。
“辨讹”和“晓意”在Variety的空间维度。基于大体量、多源异质的数据,辨讹过滤噪声、查漏补缺、去伪存真。晓意达到更高境界,从非结构数据中提取语义、使机器能够窥探人的思想境界、达到过去结构化数据分析不能达到之高度。
先看知著,对宏观现象规律的研究早已有之,大数据的知著有两个新特点,一是从采样到全量,比如央视去年“你幸福吗”的调查,是街头的采样,前不久《中国经济生活大调查》关于幸福城市排名的结论,是基于10万份问卷(17个问题)的采样,而清华行为与大数据实验室做的幸福指数(继挺兄、我、还有多位本群群友参与),是基于新浪微博数据的全集(托老王的福),这些数据是人们的自然表达(而不是面对问卷时的被动应对),同时又有上下文语境,因此更真实、也更有解释性。北上广不幸福,是因为空气还是房价或教育,在微博上更容易传播的积极情绪还是消极情绪,数据告诉你答案。《中国经济生活大调查》说“再小的声音我们都听得见”,是过头话,采样和传统的统计分析方法对数据分布采用一些简化的模型,这些模型把异常和长尾忽略了,全量的分析可以看到黑天鹅的身影,听到长尾的声音。
另一个特点是从定性到定量。计算社会学就是把定量分析应用到社会学,已经有一批数学家、物理学家成了经济学家、宽客,现在他们也可以选择成为社会学家。国泰君安3I指数也是一个例子,它通过几十万用户的数据,主要是反映投资活跃程度和投资收益水平的指标,建立一个量化模型来推知整体投资景气度。
再看见微,我认为大数据的真正差异化优势在微观。自然科学是先宏观、具体,进入到微观和抽象,这时大数据就很重要了。我们更关注社会科学,那是先微观、具体,再宏观、抽象,许小年索性认为宏观经济学是伪科学。如果市场是个体行为的总和,我们原来看到是一张抽象派的画,看不懂,通过客户细分慢慢可以形成一张大致看得懂的现实图景,不过是马赛克的,再通过微分、甚至定位个人,形成高清图。我们每一个人现在都生活在零售商的bucket中(前面说的乐购创造了这个概念),最简单的是高收入、低收入这类反映背景的,再有就是反映行为和生活方式的,如“精打细算”、“右键点击一族”(使用右键的比较techsavvy)。反过来我们消费者也希望能够获得个性化的尊崇,Nobodywantstobenobodytoday。
了解并掌握客户比以往任何时候都更重要。奥巴马赢在大数据上,就是因为他知道西岸40-49岁女性的男神是乔治·克鲁尼,东岸同样年龄段女性的偶像则是莎拉·杰西卡·帕克(《欲望都市》的主角),他还要更细分,摇摆州每一个郡每一个年龄段每一个时间段在看什么电视,摇摆州(俄亥俄)1%选民随时间变化的投票倾向,摇摆选民在Reddit上还是Facebook上,都在其掌握之中。
对于企业来说,要从以产品为中心,转到以客户(买单者)甚至用户(使用者)为中心,从关注用户背景到关注其行为、意图和意向,从关注交易形成转到关注每一个交互点/触点,用户是从什么路径发现我的产品的,决定之前又做了什么,买了以后又有什么反馈,是通过网页、还是QQ、微博或是微信。
再讲第三个,当下。时间是金钱,股票交易就是快鱼吃慢鱼,用免费股票交易软件有几秒的延迟,而占美国交易量60-70%的高频程序化交易则要发现毫秒级、低至1美分的交易机会。时间又是生命,美国国家大气与海洋管理局的超级计算机在日本311地震后9分钟发出海啸预警,已经太晚。时间还是机会。现在所谓的购物篮分析用的其实并不是真正的购物篮,而是结帐完的小票,真正有价值的是当顾客还拎着购物篮,在浏览、试用、选择商品的时候,在每一个触点影响他/她的选择。数据价值具有半衰期,最新鲜的时候个性化价值最大,渐渐退化到只有集合价值。当下的智慧是从刻舟求剑到见时知几,原来10年一次的人口普查就是刻舟求剑,而现在东莞一出事网络迁徙图就反映出来了。当然,当下并不一定是完全准确的,其实如果没有更多、更久的数据,匆忙对网络迁徙图解读是可能陷入误区的。
第四个,皆明。时间有限,就简单说了。就是从放马后炮到料事如神(predictiveanalytics),从料事如神到运筹帷幄(prescriptiveanalytics),只知道有东风是预测分析,确定要借箭的目标、并给出处方利用草船来借,就是处方性分析。我们现在要提高响应度、降低流失率、吸引新客户,需要处方性分析。
辨讹就是利用多源数据过滤噪声、查漏补缺和去伪存真。20多个省市的GDP之和超过全国的GDP就是一个例子,我们的GPS有几十米的误差,但与地图数据结合就能做到精确,GPS在城市的高楼中没有信号,可以与惯性导航结合。
晓意涉及到大数据下的机器智能,是个大问题,也不展开了。贴一段我的文章:有人说在涉及“晓意”的领域人是无法替代的。这在前大数据时代是事实。《点球成金(Moneyball)》讲的是数量化分析和预测对棒球运动的贡献,它在大数据背景下出现了传播的误区:一、它其实不是大数据,而是早已存在的数据思维和方法;二、它刻意或无意忽略了球探的作用。从读者看来,奥克兰竞技队的总经理比利·比恩用数量化分析取代了球探。而事实是,在运用数量化工具的同时,比恩也增加了球探的费用,军功章里有机器的一半,也有人的一半,因为球探对运动员定性指标(如竞争性、抗压力、意志力等)的衡量是少数结构化量化指标无法刻画的。大数据改变了这一切。人的数字足迹的无意识记录,以及机器学习(尤其是深度学习)晓意能力的增强,可能逐渐改变机器的劣势。今年我们看到基于大数据的情感分析、价值观分析和个人刻画,当这些应用于人力资源,已经或多或少体现了球探承担的作用。
以上是小编为大家分享的关于漫谈大数据的思想形成与价值维度的相关内容,更多信息可以关注环球青藤分享更多干货
Ⅳ 如何利用大数据工具,辅助教师教学
无论你是在千禧年出生,还是在婴儿潮时期降临这个世界,今日的课堂与我们儿时的课堂相比,已经非常不同。
今日的小孩一上学就有平板电脑或者笔记本电脑,很多小孩拿到电脑时甚至还不能识字。一些国家为了让学生适应基于电脑的标准化测试,要求二年级的学生必须具备每分钟输入60个单词的能力。现在的小孩上学前就已经有姓名、住址、出生日期、医学和行为记录等数字记录。
在课堂上应用技术和大数据的设想已经成为现实,并且正以非常快的速度在发展,快到我们都无法预测未来几年内孩子们接受的规范教育将会变成怎样。这是我们的生活已经离不开大数据的又一证据。但当这个事情发生在我们孩子的教育上时,到底是好事还是坏事呢?
形成反馈闭环和大数据在教育中的益处
就教育而言,最重要的地方一直都是形成反馈闭环。教师提出一个问题,然后学生尝试去解决问题。从学生尝试解决问题的行为中,教师可以发现学生理解了哪些内容,以及哪些内容是不理解的,然后再基于此对教学行为作出相应的调整。同样的,学生在尝试解决问题的过程中,也能加深对问题的理解。
这个闭环在一对一或者是师生人数比率较低的情况下,非常有效,但是当学生数量过多,同时不同学生之间的水平存在差异之时,要想创建这种有效的闭环就变得异常困难。这时大数据和技术就可以发挥作用了。
任何一名教师都可以带着学生学一门课程,但是要做到对每个学生具体的问题进行精准定位,就没有那么容易了,尤其是在班级学生数量较大的情况下。一家名为Knewton的大数据公司开发了一个数字平台,该平台分析了几百万学生(从幼儿园到大学)的学习过程,并基于这一分析来设计更加合理的测试题目和更加个性化课程目标。最近,该公司与Houghton Mifflin Harcourt建立了合作关系,开发出了K-12阶段的个性化数学课程,同时还与法国创业公司Gutenberg Technology一道,开发了智能数字教科书。
简单来说,这些课程和教科书能够适应每个学生的差异。该程序可以根据学生的表现,判断当前的题目的难度是否过大,是否太容易,还是刚刚好?然后,基于判断实时的改变题目的难度。学生可以按照自己的节奏来控制学习进度,而不会受到周围其他学生的行为的影响。然后,系统会给教师一个反馈,告知哪个学生在哪个方面有困难,同时给出全班学生的表现的整体分析数据。
那么,这种教学方法有什么缺点吗?
大数据教育的阻碍
与其它所有使用大数据的应用一样,在教育中使用大数据也有人表示出不理解和担忧。人们最常担心的问题就是数据泄露,而且这种事情已经发生过了。2009年的时候,美国田纳西州的一个学区由于疏忽,将18000名K-12阶段学生的姓名、住址、出生日期和完整的社保号码暴露在了一个不安全的服务器上,而且整个过程持续了数月。
人们的另一个担忧是,这些数据会像以前学校曾经使用的神秘的“永久性档案”一样,一直伴随学生的整个教育生涯。毕竟,一个学生在小学时被标记为“捣蛋鬼”,并不代表他上了中学之后还是“捣蛋鬼”,反而可能会变成另外一个完全不一样的人。但是,由于他的数字档案里依然标记其为“捣蛋鬼”,学校当局和老师可能会基于这个过去的评价来对待已经改变的学生,这显然不合适。
另外一些团体还担心,这些学生的数据将被用于商业营销。理论上讲,学校和大数据软件开发商确实可以在特定的领域,向学生精准投放个性化广告。或许,学生写了一篇关于棒球的论文,然后就会收到关于当地棒球比赛的门票广告。
教师角色的转变
所有涉及数据的领域,从财经到零售业都会遇到这些担忧和阻碍,但是在教育领域使用大数据还有另外一个问题——教师角色的转变。随着越来越多的技术和数据应用投入的教学中,教师的角色也应该随之发生转变,即由教学角色向数据驱动的管理角色转变。然而,这是一个非常困难的过程。
优秀的教师选择成为教师,主要是因为他们热衷于教育学生。他们喜欢看到学生理解了一个问题之后,两眼放光的样子。他们也喜欢学生沉浸在一个知识点的时候,释放出的热情。不幸的是,这些优秀的教师对于让算法接管这一切感到不乐意,他们也不愿意做一些数据输入和管理工作,虽然这一切或许最终都能帮助学生走向卓越。
因此,大数据和技术或许并不是解决教育问题的灵丹妙药。我相信,我们应该开发出一些应用来辅助优秀的教师进行教学,而不是用大数据和数据分析替代他们。最终,理解和应用数据及其分析过程,将像在其他行业一样,让学生和教师都从中获得益处。
不知道各位如何看待这个问题,我们应该用数据记录和分析学生在课堂上的一切表现吗?还是我们应该保持传统教学方式,让大数据靠边站?
Ⅵ 大数据的应用领域有哪些
1.了解和定位客户
这是大数据目前最广为人知的应用领域。很多企业热衷于社交媒体数据、浏览器日志、文本挖掘等各类数据集,通过大数据技术创建预测模型,从而更全面地了解客户以及他们的行为、喜好。
利用大数据,美国零售商Target公司甚至能推测出客户何时会有Baby;电信公司可以更好地预测客户流失;沃尔玛可以更准确的预测产品销售情况;汽车保险公司能更真实的了解客户实际驾驶情况。
滑雪场利用大数据来追踪和锁定客户。如果你是一名狂热的滑雪者,想象一下,你会收到最喜欢的度假胜地的邀请;或者收到定制化服务的短信提醒;或者告知你最合适的滑行线路。。。。。。同时提供互动平台(网站、手机APP)记录每天的数据——多少次滑坡,多少次翻越等等,在社交媒体上分享这些信息,与家人和朋友相互评比和竞争。
除此之外,政府竞选活动也引入了大数据分析技术。一些人认为,奥巴马在2012年总统大选中获胜,归功于他们团队的大数据分析能力更加出众。
2.
改善医疗保健和公共卫生
大数据分析的能力可以在几分钟内解码整个DNA序列,有助于我们找到新的治疗方法,更好地理解和预测疾病模式。试想一下,当来自所有智能手表等可穿戴设备的数据,都可以应用于数百万人及其各种疾病时,未来的临床试验将不再局限于小样本,而是包括所有人!
苹果公司的一款健康APPResearchKit有效将手机变成医学研究设备。通过收集用户的相关数据,可以追踪你一天走了多少步,或者提示你化疗后感觉如何,帕金森病进展如何等问题。研究人员希望这一过程变得更容易、更自动化,吸引更多的参与者,并提高数据的准确度。
大数据技术也开始用于监测早产儿和患病婴儿的身体状况。通过记录和分析每个婴儿的每一次心跳和呼吸模式,提前24小时预测出身体感染的症状,从而及早干预,拯救那些脆弱的随时可能生命危险的婴儿。
更重要的是,大数据分析有助于我们监测和预测流行性或传染性疾病的暴发时期,可以将医疗记录的数据与有些社交媒体的数据结合起来分析。比如,谷歌基于搜索流量预测流感爆发,尽管该预测模型在2014年并未奏效——因为你搜索“流感症状”并不意味着真正生病了,但是这种大数据分析的影响力越来越为人所知。
3.提供个性化服务
大数据不仅适用于公司和政府,也适用于我搏衫们每个人,比如从智能手表或智能手环等可穿戴设备采集的数据中获益。Jawbone的智能手环可以分析人们的卡路里消耗、活动量和睡眠质量等。Jawbone公司已经能够收集长达60年的睡眠数据,从中分析出一些独到的见解反馈给每个用户。从中受益的还有网络平台“寻找真爱”,大多数婚恋网站都使用大数据分析工具和算法为用户匹配最合适的对象。
4.
了解和优化业务流程
大数据也困毕越来越多地应用于优化业务流程,比如供应链或配送路径优化。通过定位和识别系统来跟踪货物或运输车辆,并根据实时交通路况数据优化运输路线。
人力资源业务流程也在使用大数据进行优化。SociometricSolutions公司通过在员工工牌里植入传感器,检测其工作场所及社交活动——员工在哪些工作场所走动,与谁交谈,甚至交流时的语气如何。美国银行在使用中发现呼叫中心表现最好的员工——他们制定了小组轮流休息制度,平均业绩提高了23%。
如果在手机、钥匙、眼镜等随身物品上粘贴RFID标签,万一不小心丢失就能迅速定位它们。假想一下未来可能创造出贴在任何东西上的智能标签。它们能告诉你的不仅是物体在哪里,还可以反馈温度,湿度,运动状态等等。这将打开一个全新的大数据时代,“大数据”领域寻求共性的信息和模式,那么孕育其中的“小数据”着重关注单个产品。
5.
改善城市和国家建设
大数据被用于改善我们城市和国家的方方面面。目前很多大城市致力于构建智慧交通。车辆、行人、道路基础设施、公共服务场所都被整合在智慧交通网络中,以提升资源运用的效率,优化城市管理和服务。
加州长滩市正在使用智能水表实时检测非法用水,帮助一些房主减少80%的用水量。洛杉矶利用磁性道路传感器和交通摄像头的数据来控制交通灯信号,从而优化城市的交通流量。据统计目前已经控制了全市4500个交通灯,将交通拥堵状况减少了约16%。
6.提升科学研究
大数据带来的无限可能性正在改变科学研究。欧洲核子研究中心(CERN)在全球遍布了150个数据中心,有65,000个处理器,能同时分析30pb的数据量,这样的计算能力影响着很多领域的科学研究。比如政汪银芹府需要的人口普查数据、自然灾害数据等,变的更容易获取和分析,从而为我们的健康和社会发展创造更多的价值。
7.提升机械设备性能
大数据使机械设备更加智能化、自动化。例如,丰田普锐斯配备了摄像头、全球定位系统以及强大的计算机和传感器,在无人干预的条件下实现自动驾驶。XcelEnergy在科罗拉多州启动了“智能电网”的首批测试,在用户家中安装智能电表,然后登录网站就可实时查看用电情况。“智能电网”还能够预测使用情况,以便电力公司为未来的基础设施需求进行规划,并防止出现电力耗尽的情况。在爱尔兰,杂货连锁店Tescos的仓库员工佩戴专用臂带,追踪货架上的商品分配,甚至预测一项任务的完成时间。
8.强化安全和执法能力
大数据在改善安全和执法方面得到了广泛应用。美国国家安全局(NSA)利用大数据技术,检测和防止网络攻击(挫败恐怖分子的阴谋)。警察运用大数据来抓捕罪犯,预测犯罪活动。信用卡公司使用大数据来检测欺诈交易等等。
2014年2月,芝加哥警察局对大数据生成的“名单”——有可能犯罪的人员,进行通告和探访,目的是提前预防犯罪。
9.
提高体育运动技能
如今大多数顶尖的体育赛事都采用了大数据分析技术。用于网球比赛的IBMSlamTracker工具,通过视频分析跟踪足球落点或者棒球比赛中每个球员的表现。许多优秀的运动队也在训练之外跟踪运动员的营养和睡眠情况。NFL开发了专门的应用平台,帮助所有球队根据球场上的草地状况、天气状况、以及学习期间球员的个人表现做出最佳决策,以减少球员不必要的受伤。
还有一件非常酷的事情是智能瑜伽垫:嵌入在瑜伽垫中的传感器能对你的姿势进行反馈,为你的练习打分,甚至指导你在家如何练习。
10.金融交易
大数据在金融交易领域应用也比较广泛。大多数股票交易都是通过一定的算法模型进行决策的,如今这些算法的输入会考虑来自社交媒体、新闻网络的数据,以便更全面的做出买卖决策。同时根据客户的需求和愿望,这些算法模型也会随着市场的变化而变化。
Ⅶ 大数据分析 应用的九大领域
大数据分析 应用的九大领域
随着大数据的应用越来越广泛,应用的行业也越来越低,我们每天都可以看到大数据的一些新奇的应用,从而帮助人们从中获取到真正有用的价值。很多组织或者个人都会受到大数据的分析影响,但是大数据是如何帮助人们挖掘出有价值的信息呢?下面就让我们一起来看看九个价值非常高的大数据的应用,这些都是大数据在分析应用上的关键领域:
1.理解客户、满足客户服务需求
大数据的应用目前在这领域是最广为人知的。重点是如何应用大数据更好的了解客户以及他们的爱好和行为。企业非常喜欢搜集社交方面的数据、浏览器的日志、分析出文本和传感器的数据,为了更加全面的了解客户。在一般情况下,建立出数据模型进行预测。比如美国的着名零售商Target就是通过大数据的分析,得到有价值的信息,精准得预测到客户在什么时候想要小孩。另外,通过大数据的应用,电信公司可以更好预测出流失的客户,沃尔玛则更加精准的预测哪个产品会大卖,汽车保险行业会了解客户的需求和驾驶水平,政府也能了解到选民的偏好。
2.业务流程优化
大数据也更多的帮助业务流程的优化。可以通过利用社交媒体数据、网络搜索以及天气预报挖掘出有价值的数据,其中大数据的应用最广泛的就是供应链以及配送路线的优化。在这2个方面,地理定位和无线电频率的识别追踪货物和送货车,利用实时交通路线数据制定更加优化的路线。人力资源业务也通过大数据的分析来进行改进,这其中就包括了人才招聘的优化。
3.大数据正在改善我们的生活
大数据不单单只是应用于企业和政府,同样也适用我们生活当中的每个人。我们可以利用穿戴的装备(如智能手表或者智能手环)生成最新的数据,这让我们可以根据我们热量的消耗以及睡眠模式来进行追踪。而且还利用利用大数据分析来寻找属于我们的爱情,大多数时候交友网站就是大数据应用工具来帮助需要的人匹配合适的对象。
4.提高医疗和研发
大数据分析应用的计算能力可以让我们能够在几分钟内就可以解码整个DNA.并且让我们可以制定出最新的治疗方案。同时可以更好的去理解和预测疾病。就好像人们戴上智能手表等可以产生的数据一样,大数据同样可以帮助病人对于病情进行更好的治疗。大数据技术目前已经在医院应用监视早产婴儿和患病婴儿的情况,通过记录和分析婴儿的心跳,医生针对婴儿的身体可能会出现不适症状做出预测。这样可以帮助医生更好的救助婴儿。
5.提高体育成绩
现在很多运动员在训练的时候应用大数据分析技术了。比如例如用于网球鼻塞的IBMSlamTracker工具,我们使用视频分析来追踪足球或棒球比赛中每个球员的表现,而运动器材中的传感器技术(例如篮球或高尔夫俱乐部)让我们可以获得对比赛的数据以及如何改进。很多精英运动队还追踪比赛环境外运动员的活动-通过使用智能技术来追踪其营养状况以及睡眠,以及社交对话来监控其情感状况。
6.优化机器和设备性能
大数据分析还可以让积极和设备在应用上更加智能化和自主化。例如,大数据工具曾经就被谷歌公司利用研发谷歌自驾汽车。丰田的普瑞就配有相机、GPS以及传感器,在交通上能够安全的驾驶,不需要人类的敢于。大数据工具还可以应用优化智能电话。
7.改善安全和执法
大数据现在已经广泛应用到安全执法的过程当中。想必大家都知道美国安全局利用大数据进行恐怖主义打击,甚至监控人们的日常生活。而企业则应用大数据技术进行防御网络攻击。警察应用大数据工具进行捕捉罪犯,信用卡公司应用大数据工具来槛车欺诈性交易。
8.改善我们的城市
大数据还被应用改善我们日常生活的城市。例如基于城市实时交通信息、利用社交网络和天气数据来优化最新的交通情况。目前很多城市都在进行大数据的分析和试点。
9.金融交易
大数据在金融行业主要是应用金融交易。高频交易(HFT)是大数据应用比较多的领域。其中大数据算法应用于交易决定。现在很多股权的交易都是利用大数据算法进行,这些算法现在越来越多的考虑了社交媒体和网站新闻来决定在未来几秒内是买出还是卖出。
以上九个是大数据应用最多的九个领域,当然随着大数据的应用越来越普及,还有很多新的大数据的应用领域,以及新的大数据应用。
以上是小编为大家分享的关于大数据分析 应用的九大领域的相关内容,更多信息可以关注环球青藤分享更多干货