『壹』 twitter的storm系统属于哪种大数据处理系统
实时大数据系统
相关知识:
Hadoop(大数据分析领域无可争辩的wang者)专注于批处理。这种模型对许多情形(比如为网页建立索引)已经足够,但还存在其他一些使用模型,它们需要来自高度动态的来源的实时信息。为了解决这个问题,就得借助 Nathan Marz 推出的 Storm(现在在 Twitter 中称为 BackType)。Storm 不处理静态数据,但它处理预计会连续的流数据。考虑到 Twitter 用户每天生成 1.4 亿条推文 (tweet),那么就很容易看到此技术的巨大用途。
但 Storm 不只是一个传统的大数据分析系统:它是复杂事件处理 (CEP) 系统的一个示例。CEP 系统通常分类为计算和面向检测,其中每个系统都可通过用户定义的算法在 Storm 中实现。举例而言,CEP 可用于识别事件洪流中有意义的事件,然后实时地处理这些事件。
『贰』 大数据热门词汇汇总
大数据热门词汇汇总
可以说,大数据是如今IT行业最热门的趋势之一,它催生出了处理大数据的一批全新技术。而新技术带来了新的热门词汇:首字母缩略词、专业术语和产品名称等。连"大数据"这个短语本身都让人犯晕。许多人一听到"大数据",觉得是指"大量数据",而大数据的涵义绝不仅仅涉及数据量的多寡。
下面是我们认为你要熟悉的几个热门词汇,按字母顺序排列。
ACID
ACID的全称是原子性、一致性、隔离性和持久性,这其实是一组需求或属性:如果这四个方面都得到遵守,就能在处理过程中确保数据库事务的数据完整性。虽然ACID问世已有一段时日,但是事务数据量的急剧增长把更多的注意力投向在处理大数据时需要满足ACID的规定。
大数据三要素
如今的IT系统在生成数量、速度和种类都很"庞大"的数据。
数量:IDC公司估计,今年全球信息总量将达到2.7泽字节(这相当于27亿太字节),而且每两年就翻一番。
速度:让IT管理人员们头痛的不仅仅是数据数量,还有数据从金融系统、零售系统、网站、传感器、无线射频识别(RFID)芯片以及Facebook和推特等社交网络源源而来的速度越来越快。
种类:如果回到5年前或可能10年前,IT人员处理的主要是字母数字数据,它们很容易存储在关系数据库中整齐排列的行和列中。现在不再是这样了。如今,推特和Facebook上的帖子、各种文档及网页内容等非结构化数据都是大数据组合的一部分。
列式(或列型)数据库
一些新一代数据库(如开源Cassandra和惠普的Vertica数据库)被设计成了按列存储数据,而不是像传统的SQL数据库那样按行存储数据。这种设计提供了更快的磁盘访问速度,提高了处理大数据时的性能。对数据密集型业务分析应用系统而言,列式数据库尤其受到欢迎。
数据仓库
数据仓库这个概念存在至今已有大概25年了,具体指将数据从多个操作IT系统复制到面向业务分析应用系统的辅助离线数据库
但是随着数据量急剧增长,数据仓库系统正在迅速改变。它们需要存储更多的数据以及更多种类的数据,因而数据仓库管理成为一大难题。10年或20年前,数据可能每周或每月复制到数据仓库系统中;而如今,数据仓库的更新要频繁得多,有的甚至实时更新。
ETL
将数据从一个数据库(比如支持银行应用事务处理系统的数据库)转移到另一个数据库(比如用于业务分析的数据仓库系统)时,就要用到提取、转换和加载(ETL)软件。数据从一个数据库传送到另一个数据库时,常常需要对数据进行重新格式化和清理操作。
由于数据量急剧增长,数据处理速度大大加快,对ETL工具的性能要求也大大提高了。
Flume
Flume是属于Apache Hadoop大家族(其他技术包括HBase、Hive、Oozie、Pig和Whirr)的一项技术,这种框架用于为Hadoop填充数据。该技术使用散布于应用服务器、Web服务器、移动设备及其他系统上的软件代理,收集数据,并将数据传送到Hadoop系统。
比如说,公司可以使用在Web服务器上运行的Apache Flume,收集来自推特帖子的数据,以便分析。
地理空间分析
推动大数据潮流的一个趋势是,由如今的IT系统生成和收集的地理空间数据越来越多。常言道,一幅图片的信息量抵得上1000个单词;所以难怪越来越多的地图、图表、照片及其他基于地理位置的内容是导致如今大数据呈爆炸式增长的主要动因。
地理空间分析是一种特殊形式的数据可视化(参阅下面的"可视化"条目),在地理地图上覆盖数据,以帮助用户更清楚地理解大数据分析的结果。
Hadoop
Hadoop是一种开源平台,用于开发分布式、数据密集型的应用程序。它由Apache软件基金会控制。
Hadoop的发明者是雅虎公司的开发者道格o卡廷(Doug Cutting),他在谷歌实验室的MapRece概念这个基础上开发出了Hadoop,以他儿子的玩具象命名。
另外,HBase是一种非关系数据库,它是作为Hadoop项目的一部分开发而成的。Hadoop分布式文件系统(HDFS)是Hadoop的一个关键组成部分。Hive则是建立在Hadoop基础上的数据仓库系统。
内存中数据库
计算机在处理事务或执行查询时,一般从磁盘驱动器获取数据。但是当IT系统处理大数据时,这个过程可能实在太慢。
内存中数据库系统利用计算机的主内存来存储经常使用的数据,因而大大缩短了处理时间。内存中数据库产品包括SAP HANA和甲骨文Times Ten内存中数据库。
Java
Java是一种编程语言,由现隶属甲骨文公司的Sun开发,于1995年发布。Hadoop和其他许多大数据技术都是使用Java开发而成的,它仍是大数据领域一种主要的开发技术。
Kafka
Kafka是一种高吞吐量的分布式消息传送系统,最初是在LinkedIn开发而成,用于管理该服务网站的活动流(关于网站使用情况的数据)和操作数据处理流水线(关于服务器组件的性能)。
Kafka在处理大量流式数据时很有效,而流式数据是许多大数据计算环境的一个关键问题。由推特开发的Storm是另一种大行其道的流处理技术。
Apache软件基金会已将Kafka列为一个开源项目。所以,别以为这是有缺陷的软件。
延迟时间
延迟时间是指数据从一个点传送到另一个点过程中的延迟,或者是某个系统(如应用程序)响应另一个系统的延迟数量。
虽然延迟时间不是什么新术语,但是随着数据量不断增长,IT系统竭力跟上步伐,如今你更常听到这个术语。简单地说,"低延迟"是好事,"高延迟"是坏事。
映射/化简
映射/化简(Map/Rece)这种方法是指把一个复杂的问题分解成多个较小的部分,然后将它们分发到多台计算机上,最后把它们重新组装成一个答案。
谷歌的搜索系统用到了映射/化简概念,这家公司有一个品牌名为MapRece的框架。
谷歌在2004年发布的一份白皮书描述了它使用映射/化简的情况。Hadoop之父道格o卡廷充分认识到了其潜力,开发出了同样借用映射/化简概念的第一个版本的Hadoop。
NoSQL数据库
大多数主流的数据库(如甲骨文数据库和微软SQL Server)基于关系型体系结构,使用结构化查询语言(SQL)用于开发和数据管理。
但是名为"NoSQL"(有些人现在称NoSQL表示"不是只有SQL")的新一代数据库系统基于支持者们认为更适合处理大数据的体系结构。
一些NoSQL数据库是为提高可扩展性和灵活性设计的,另一些NoSQL数据库在处理文档及其他非结构化数据方面比较有效。典型的NoSQL数据库包括Hadoop/HBase、Cassandra、MongoDB和CouchDB,而甲骨文等一些知名开发商已推出了各自的NoSQL产品。
Oozie
Apache Oozie是一种开源工作流引擎,用于帮助管理面向Hadoop的处理工作。使用Oozie,一系列工作可以用多种语言(如Pig和MapRece)来加以定义,然后彼此关联起来。比如说,一旦从操作应用程序收集数据的作业已完成,程序员就可以启动数据分析查询任务。
Pig
Pig是Apache软件基金会的另一个项目,这个平台用于分析庞大的数据集。就其本质而言,Pig是一种编程语言,可用于开发在Hadoop上运行的并行计算查询。
定量数据分析
定量数据分析是指使用复杂的数学或统计模型,解释金融和商业行为,或者甚至预测未来的行为。
由于如今收集的数据量急剧增加,定量数据分析已变得更加复杂。但是如果公司知道如何利用海量数据,获得更好的可视性,深入了解公司业务,并且洞察市场发展趋势,那么更多的数据也有望在数据分析方面带来更多的机会。
一个问题是,拥有这种分析技能的人才严重匮乏。知名咨询公司麦肯锡表示,光美国就需要150万名拥有大数据分析技能的分析员和管理员。
关系数据库
关系数据库管理系统(RDBM)是如今使用最广泛的一种数据库,包括IBM的DB2、微软的SQL Server和甲骨文数据库。从银行应用系统、零售店的销售点系统到库存管理应用软件,大多数的企业事务处理系统都在RDBM上运行。
但有些人认为,关系数据库可能跟不上如今数据量和种类都呈爆炸式增长的形势。比如说,RDBM当初在设计时着眼于处理字母数字数据,处理非结构化数据时不是同样有效。
分片
随着数据库变得越来越庞大,处理起来也变得越来越困难。分片(sharding)是一种数据库分区技术,把数据库分成了更小、更容易管理的部分。具体来说,数据库被横向分区,以便单独管理数据库表中的不同行。
分片方法让庞大数据库的片段可以分布在多台服务器上,从而提高数据库的整体运行速度和性能。
另外,Sqoop是一种开源工具,用于将来自非Hadoop来源(如关系数据库)的数据转移到Hadoop环境。
文本分析
导致大数据问题的因素之一是,从推特和Facebook等社交媒体网站、外部新闻源,甚至公司内部收集而来以便分析的文本数量越来越多。由于文本是非结构化数据(不像通常存储在关系数据库中的结构化数据),主流的业务分析工具面对文本时常常束手无策。
文本分析采用了一系列方法(关键字搜索、统计分析法和语言研究法等),从基于文本的数据中获得洞察力。
非结构化数据
就在不久前,大部分数据还是结构化数据,这种字母数字信息(如来自销售交易的财务数据)很容易存储在关系数据库中,并由商业智能工具来分析。
但是如今共计2.7泽字节的存储数据中很大一部分是非结构化数据,比如基于文本的文档、推特消息、发布在Flickr上的照片、发布在YouTube上的视频,等等。(颇有意思的是,每分钟有长达35个小时的视频内容上传到YouTube。)处理、存储和分析所有这些凌乱的非结构化数据常常是如今的IT系统面临的难题。
可视化
随着数据量的增长,人们使用静态的图表和图形来理解数据越来越困难了。这就导致开发新一代的数据可视化和分析工具,能够以新的方式呈现数据,从而帮助人们理解海量信息。
这些工具包括:标以色码的热图,三维图形,显示一段时间内变化的动画可视化,以及在地理地图上覆盖数据的地理空间呈现。今天的先进数据可视化工具还具有更强的互动性,比如允许用户放大某个数据子集,进行更仔细的检查。
Whirr
Apache Whirr是一组Java类库,用于运行大数据云服务。更确切地说,它可以加快在亚马逊弹性计算云(EC2)和Rackspace等虚拟基础设施上开发Hadoop集群的过程。
XML
可扩展标记语言(XML)用来传输和存储数据(别与HTML混为一谈,后者用来显示数据)。借助XML,程序员们就可以创建通用的数据格式,并通过互联网共享信息和格式。
由于XML文档可能非常庞大、复杂,它们往往被认为导致IT部门面临大数据挑战。
尧字节
尧字节(yottabyte)是一种数据存储度量指标,相当于1000泽字节。据知名调研机构IDC公司估计,今年全球存储的数据总量预计将达到2.7泽字节,比2011年增长48%。所以,我们离达到尧字节这个大关还有很长一段路,不过从目前大数据的增长速度来看,那一天的到来可能比我们想象的要快。
顺便说一下,1泽字节相当于1021字节的数据。它相当于1000艾字节(EB)、100万拍字节(PB)和10亿太字节(TB)。
ZooKeeper
ZooKeeper是由Apache软件基金会创建的一项服务,旨在帮助Hadoop用户管理和协调跨分布式网络的Hadoop节点。
ZooKeeper与HBase紧密集成,而HBase是与Hadoop有关的数据库。ZooKeeper是一项集中式服务,用于维护配置信息、命名服务、分布式同步及其他群组服务。IT管理人员用它来实现可靠的消息传递机制、同步流程执行及实施冗余服务。
『叁』 大数据的来源有哪三个
品牌型号:华为MateBook D15
大数据的来源有交易数据、人为数据、机器和传感器数据。
交易数据包括POS机数据、信用卡刷卡数据等;人为数据,包括电子邮件、文档、图片以及通过微信、博客、推特等产生的数据流;机器和传感器数据,如感应器、量表和其它设施的数据。
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
『肆』 2020年度大数据解决方案TOP50出炉!智领云榜上有名
近年来,我国大数据生态环境不断向好,产业发展维持高增长态势,大数据技术在与政府、企业核心业务的融合中,释放出了更多创新活力和应用潜能。
此次上榜企业,均属于大数据领域的驱动力量,也是其所在行业不可替代的创新主力。入选榜单进一步提升了智领云的品牌形象和影响力,更是对公司产品与技术实力的认可。
未来我们将不断挖掘大数据的巨大潜力,扩大自身专业性和影响力,更好地支撑企业数字化建设,落地更多的数字化创新应用,不断 探索 大数据产业链的融合应用,为各行各业数字化转型提供可实践的方法论与经验,并致力于为大数据与行业的融合创新不断贡献自己的力量。
关于智领云
武汉智领云 科技 有限公司成立于2016年8月,专注于云计算、大数据领域前沿技术的研发。公司创始团队成员来自于推特(Twitter)、苹果(Apple)和艺电(EA)等硅谷知名企业,是硅谷最早一批从事云计算和大数据研究与实践的技术专家,拥有十多年的云计算、大数据系统的系统架构和系统开发经验。公司作为拥有云计算、大数据领域核心技术的高 科技 企业获得了来自硅谷、国内知名投资人和投资机构的青睐。
公司为企业级客户提供云原生数据中台系统解决方案;帮助企业搭建数据和AI中台,轻松打造业务数据能力闭环,掌握全面、及时、更多维度的业务现状,提升数据驱动应用的迭代和发布速度;实现系统资产(人/资源/数据/应用) 在同一系统中的统一管理,建立数字化运营体系,并最终完成数据驱动的数字化转型。
公司在能源、教育、医疗 健康 、物联网、金融等行业同国内外很多知名企业和上市公司建立了合作关系,包括:D2IQ(Mesos平台的主要开发商),埃克森美孚(中国)、天源迪科、中电数据、天喻教育、深圳智宇、青岛赛维、广州畅驿、楚天云、华讯网络、南瑞集团等。公司与合作伙伴在多个领域中展开紧密的合作,充分利用各自的优势,共同为企业客户提供更有价值的云计算、大数据产品和技术服务。
『伍』 大数据将对国家治理和社会生活带来哪些根本性改革
很荣幸能为你解答!
一、“四个结合”助力国家大数据战略
实施国家大数据战略部署和顶层设计,需要我们做到“四个结合”:把数据开放和市场基于数据的创新结合起来。拥有80%的数据资源,如果不开放,大数据战略就会成为无源之水,市场主体如果不积极利用数据资源进行商业创新,数据开放的价值就无从释放;把大数据与国家治理创新结合起来。国务院的部署明确提出,“将大数据作为提升治理能力的重要手段”“提高社会治理的精准性和有效性”,用大数据“助力简政放权,支持从事前审批向事中事后监管转变”“借助大数据实现负面清单、权力清单和责任清单的透明化管理,完善大数据监督和技术反腐体系”,并具体部署了四大重大工程:数据资源共享开放工程、国家大数据资源统筹发展工程、治理大数据工程、公共服务大数据工程;把大数据与现代产业体系结合起来。这里涉及农业大数据、工业大数据、新兴产业大数据等,我国的产业结构优化升级迎来难得的历史机遇;把大数据与大众创业、万众创新结合起来。国务院专门安排了“万众创新大数据工程”,数据将成为大众创业、万众创新的肥沃土壤,数据密集型产业将成为发展最快的产业,拥有数据优势的将迅速崛起。
此外,我国作为世界制造业第一大国,需要高度关注一个现实——大数据重新定义了制造业创新升级的目标和路径。无论是德国提出的工业40战略,还是美国通用提出的工业互联网理念,本质正是先进制造业和大数据技术的统一体。大数据革命骤然改变了制造业演进的轨道,加速了传统制造体系的产品、设备、流程贬值淘汰的进程。数字工厂或称智能工厂,是未来制造业转型升级的必然方向。我国面临着从“制造大国”走向“制造强国”的历史重任,在新的技术条件下如何适应变化、如何生存发展、如何参与竞争,是非常现实的挑战。
二、推动大数据在国家治理上的应用
在大数据条件下,数据驱动的“精准治理体系”“智慧决策体系”“阳光权力平台”将逐渐成为现实。大数据已成为全球治理的新工具,联合国“全球脉动计划”就是用大数据对全球范围内的推特(Twitter)和脸谱(Facebook)数据和文本信息进行实时分析监测和“情绪分析”,可以对疾病、动乱、种族冲突提供早期预警。在国家治理现代化进程中推动大数据应用,是我们繁重而紧迫的任务。
在治理方面,可以借助大数据实现智慧治理、数据决策、风险预警、智慧城市、智慧公安、舆情监测等。大数据将通过全息的数据呈现,使从“主观主义”“经验主义”的模糊治理方式,迈向“实事求是”“数据驱动”的精准治理方式。
经济治理领域也是大数据创新应用的沃土,大数据是提高经济治理质量的有效手段。互联网系统记录着每一位生产者、消费者所产生的数据,可以为每个市场主体进行“精确画像”,从而为经济治理模式带来突破。判断经济形势好坏不再仅仅依赖统计样本得来的数据,而是可以通过把海量微观主体的行为加总,推导出宏观大趋势;银行发放贷款不再受制于信息不对称,通过贷款对象的大数据特征可以很好地预测其违约的可能性;打击假冒伪劣、建设“信用中国”也不再需要消耗大量人力、物力,大数据将使危害市场秩序的行为无处遁形。
在公共服务领域,基于大数据的智能服务系统,将会极大地提升人们的生活体验,智慧医疗、智慧教育、智慧出行、智慧物流、智慧社区、智慧家居等等,人们享受的一切公共服务将在数字空间中以新的模式重新构建。
三、加强大数据动态的跟踪研究
我国要从“数据大国”成为“数据强国”,借助大数据革命促进国家治理现代化,还有几个关键问题需要深入研究。
切实建设数据政策体系、数据立法体系、数据标准体系。以数据立法体系为例,一定要在数据开放和隐私保护之间权衡利弊,找到平衡点。
重视对“数据主权”问题的研究。借助大数据技术,美国和互联网、大数据领军紧密结合,形成“数据情报联合体”,对全球数据空间进行掌控,形成新的“数据霸权”。思科、IBM、谷歌、英特尔、苹果、甲骨文、微软、高通等产品几乎渗透到世界各国的、海关、邮政、金融、铁路、民航系统。在这种情况下,我国数据主权极易遭到侵蚀。对于我国来说,在服务器、软件、芯片、操作系统、移动终端、搜索引擎等关键领域实现本土产品替代进口产品,具有极高的战略意义,也是维护数据主权的必要条件。
“数据驱动发展”或将成为对冲当前经济下行压力的新动力。大数据是促进生产力变革的基础性力量,这包括数据成为生产要素,数据重构生产过程,数据驱动发展等。数据作为生产要素其边际成本为零,不仅不会越消耗越少,反而保持“摩尔定律”所说的指数型增长速度。这就可能给我国经济转型升级带来新动力,对冲经济下行压力。
需要建设一个高质量的“大数据与国家治理实践案例库”。国家行政学院一直重视案例库的建设,在中央的重视和支持下,就大数据促进国家治理这一主题,各部门、各地方涌现出大量创新性的实践
『陆』 大数据有哪些来源
大数据分析的数据来源有很多种,包括公司或者机构的内部来源和外部来源。分为以下几类:
1)交易数据。包括POS机数据、信用卡刷卡数据、电子商务数据、互联网点击数据、“企业资源规划”(ERP)系统数据、销售系统数据、客户关系管理(CRM)系统数据、公司的生产数据、库存数据、订单数据、供应链数据等。
2)移动通信数据。能够上网的智能手机等移动设备越来越普遍。移动通信设备记录的数据量和数据的立体完整度,常常优于各家互联网公司掌握的数据。移动设备上的软件能够追踪和沟通无数事件,从运用软件储存的交易数据(如搜索产品的记录事件)到个人信息资料或状态报告事件(如地点变更即报告一个新的地理编码)等。
3)人为数据。人为数据包括电子邮件、文档、图片、音频、视频,以及通过微信、博客、推特、维基、脸书、Linkedin等社交媒体产生的数据流。这些数据大多数为非结构性数据,需要用文本分析功能进行分析。
4)机器和传感器数据。来自感应器、量表和其他设施的数据、定位/GPS系统数据等。这包括功能设备会创建或生成的数据,例如智能温度控制器、智能电表、工厂机器和连接互联网的家用电器的数据。来自新兴的物联网(Io T)的数据是机器和传感器所产生的数据的例子之一。来自物联网的数据可以用于构建分析模型,连续监测预测性行为(如当传感器值表示有问题时进行识别),提供规定的指令(如警示技术人员在真正出问题之前检查设备)等。
5)互联网上的“开放数据”来源,如政府机构,非营利组织和企业免费提供的数据。
『柒』 大数据可以应用在哪些方面
大数据应用于各个行业,包括金融、汽车、餐饮、电信、能源、娱乐等在内的社会各行各业都已经融入了大数据的痕迹。
1、制造业:利用工业大数据提升制造业水平,包括产品故障诊断与预测、分析工艺流程、改进生产工艺,优化生产过程能耗、工业供应链分析与优化、生产计划与排程。
2、金融业:大数据在高频交易、社交情绪分析和信贷风险分析三大金融创新领域发挥重大作用。
3、汽车行业:利用大数据和物联网技术的无人驾驶汽车,在不远的未来将走入我们的日常生活。
4、互联网行业:借助于大数据技术分析用户行为,进行商品推荐和针对性广告投放。
5、餐饮行业:利用大数据实现餐饮O2O模式,彻底改变传统餐饮经营方式。
6、电信行业:利用大数据技术实现客户离网分析,及时掌握客户离网倾向,出台客户挽留措施。
7、能源行业:随着智能电网的发展,电力公司可以掌握海量的用户用电信息,利用大数据技术分析用户用电模式,可以改进电网运行,合理设计电力需求响应系统,确保电网运行安全。
8、物流行业:利用大数据优化物流网络,提高物流效率,降低物流成本。
9、城市管理:利用大数据实现智能交通、环保监测、城市规划和智能安防。
11、公共安全领域:政府利用大数据技术构建强大的国家安全保障体系,公共安全领域的大数据分析应用,反恐维稳与各类案件分析的信息化手段,借助大数据预防犯罪。
12、个人生活:大数据还可以应用于个人生活,利用与每个人相关联的“个人大数据”,分析个人生活行为轨迹,为其提供更加周到的个性化服务。
大数据的价值远不止于此,大数据对各行各业的渗透,是推动社会生产和生活的核心要素。
(7)推特大数据扩展阅读
七个典型的大数据应用案例
1、梅西百货的实时定价机制。根据需求和库存的情况,该公司基于SAS的系统对多达7300万种货品进行实时调价。
2、Tipp24AG针对欧洲博彩业构建的下注和预测平台。该公司用KXEN软件来分析数十亿计的交易以及客户的特性,然后通过预测模型对特定用户进行动态的营销活动。这项举措减少了悉指培90%的预测模型构建时间。SAP公司正在试图收购KXEN。
3、沃尔玛的搜索。这家零售业寡头为其网站Walmart.com自行设计了最新的搜索引擎Polaris,利用语义数据进行文本分析、机器学习和同义词挖掘等。根据沃尔玛的说法,语义搜索技术的运用使得在线购物的完成率提升了10%到15%。“对睁唯沃尔玛来说,这就意味着数十亿美元的金额。”Laney说。
4、快餐业的视频分析。该公司通过视频分析等候队列的长度,然后自动变化电子菜单显示的内容。如果队列较长,则显示可以快速供给的食物;如果队列较短,则显示那些利润较高但准备时间相对长的食品。
5、Morton牛排店的品牌认知。当一位顾客开玩笑地通过推特向这家位于芝加哥的牛排连锁店订餐送到纽约Newark机场(他将在一天工作之后抵达该处)时,Morton就开始了自己的社交秀。首先,分析推逗改特数据,发现该顾客是本店的常客,也是推特的常用者。根据客户以往的订单,推测出其所乘的航班,然后派出一位身着燕尾服的侍者为客户提供晚餐。
6、PredPolInc.。PredPol公司通过与洛杉矶和圣克鲁斯的警方以及一群研究人员合作,基于地震预测算法的变体和犯罪数据来预测犯罪发生的几率,可以精确到500平方英尺的范围内。在洛杉矶运用该算法的地区,盗窃罪和暴力犯罪分布下降了33%和21%。
7、TescoPLC(特易购)和运营效率。这家超市连锁在其数据仓库中收集了700万部冰箱的数据。通过对这些数据的分析,进行更全面的监控并进行主动的维修以降低整体能耗。