Ⅰ 技术落地性成大数据竞争赛点,鲲鹏大数据解决方案凭何领先
文 | 曾响铃
来源 | 科技 向令说(xiangling0815)
新基建浪潮下,作为底层支撑力量的数据与计算正变得越来越重要。
最近,由中国大数据与智能计算产业联盟主办,以“新算力 新基建 新经济”为主题的第二届中国超级算力大会ChinaSC在北京召开,包括国内外院士、知名学者和产业大咖在内的600多人参加,探讨了超级计算、新基建、云计算、大数据、人工智能、区块链等前沿技术进展。
这个奖项的颁出,官方给出的标准是,“能够把当前的各种技术有机的整合在一起,以满足不同应用场景下的各种综合的软硬件及系统方案,集科学性、先进性、稳定性、经济性等众多实际指标于一身,是技术转变为实际应用的关键环节。”
显然,这个权威奖项最关心的,是大数据解决方案在推动技术向实际应用转变的能力,而这也正是当下市场环境对大数据的核心需求。笔者尝试拆解鲲鹏大数据解决方案从宏观到操作层面的布局,希望能给予相关从业者这方面的行业借鉴。
技术竞赛不停, 但大数据需求转向应用落地
数据的价值越来越明显,更好地释放数据价值的技术在不断演化,但是,随着更多政企组织开始着手利用大数据能力帮助现实业务提升,其需求也开始更多倾向于技术能否更好地实现应用落地,大数据解决方案正是为此而生。
以鲲鹏为案例,在推动技术落地的过程中,其大数据解决方案表现出符合时代需要的三大特征,让它在新趋势下占据领先优势,受到客户广泛欢迎并获得ChinaSC权威认可。
1、超高性能仍然是应用落地的最有力支撑
大数据解决方案要推动技术实现各种场景的落地,其前提和支撑,是底层软硬件性能本身要足够强悍,否则,再完善和深度的解决方案,没有性能支撑也只能是空中楼阁。
而也只有性能足够强悍,在应用落地阶段才能够尽可能去满足客户各类数据价值需求。
得益于底层软硬件能力的深度开发,鲲鹏大数据解决方案就拥有超高性能,为应用做好了充分的准备以及支撑。
例如,硬件方面,采用自主研发高性能鲲鹏920处理器,软件方面,则拥有在大数据场景下获得倍级性能提升的独创IO智能预取和Spark机器学习&图增强算法。
以鲲鹏与浙江移动的合作为例,2019年,浙江移动相继完成了IT云鲲鹏服务器测试,营业厅前台系统、CRM、计费、大数据、CDN等系统的验证及上线商用。这其中,浙江移动的CRM&BOSS系统在鲲鹏大数据方案支撑下,整体得到了较大提升,在规模承载网络运营支撑业务的情况下,该系统现在已经稳定运行一年。
目前,浙江移动围绕网络云,IT云和移动云,已经打造了全球首个运营商领域ICT全场景样板点。
2、全栈方案才能推动技术全面落地
解决方案本身并不是一种具体的技术,其价值在于各种技术的有效融汇,作为统一的输出方式面向政企客户。而在政企客户需求日益加深的情况下,尽可能满足多种场景、多种技术诉求的解决方案,就必须建立一套尽可能完善的全栈体系,将各种技术有机地、系统地、全面地整合在一起。
这正是华为鲲鹏大数据解决方案的体系构成,其基于鲲鹏处理器,构建了端到端打通硬件、操作系统、中间件、大数据软件的全栈体系,并对应进行了全栈性能优化,推动各类技术汇聚成高性能解决方案:
可以看到,这套全栈体系,一方面通过有机整合,能够较为容易地同时满足科学性、先进性、稳定性、经济性等需求(例如,加速特性和大数据组件能够帮助方案更有效率同时成本更低);另一方面,作为全面、完整、一体化的信息化解决方案,也更容易去适应政府、金融、电信、互联网、大企业等不同行业应用需求。
从技术到应用落地,“全栈”成为重要的中间转换环节,不但“无损”,而且“增益”。
3、符合政企个性化需求让技术落地更具现实价值
在最终面向单个客户落地时,大数据解决方案还需要真正贴合这个客户的实际需要,这是从技术到应用落地的“临门一脚”,毕竟,不论性能如何强悍,全栈体系如何完善灵活,落实到客户头上,最终还是需要符合业务实际,产生现实价值。
既要有能力,更需要契合,鲲鹏大数据解决方案就是这么做的。
2019年,江苏省基于鲲鹏架构打造了全国首个省区市县三级政务大数据,未来将有越来越多的政务系统可以由自主可靠的鲲鹏计算平台来承载;
在广西,区内首个鲲鹏产业生态云项目——“壮美广西·玉林政务云(鲲鹏云)”已于不久前上线,这是该市全面推广应用广西数字政务一体化平台的体现,而其推出的广西首个市级公共数据开放管理办法,就与鲲鹏的大数据解决方案紧密相关;
目光转到浙江,在鲲鹏生态落子浙江的过程中,浙江推动形成“用鲲鹏”的共识,城市被当成鲲鹏生态的“试验场”,杭州市政务云已经选用鲲鹏作为算力底座,基于鲲鹏技术架构的解决方案和应用在政府服务场景中得到广泛应用。
总得看来,仅有高高在上的技术而无法产生实际价值的大数据玩法已经行不通,鲲鹏大数据解决方案跨越技术与应用的鸿沟,已经在众多行业、场景和企业中实现落地。
电信行业三巨头中,中国移动已实现鲲鹏大数据解决方案规模商用,中国电信则基于鲲鹏打造了天翼云,中国联通则基于鲲鹏构建了天宫IT系统;政务方面,北京、广东、江苏、浙江、广西等政务云都出现鲲鹏身影,当下其已经成为首选技术路线;在金融行业,鲲鹏正在帮助银行系统加速完成国产化。
可以说,鲲鹏大数据解决方案有力推动了中国数字经济发展,尤其是信息技术应用创新的落地。
领先优势下, 鲲鹏三个角度出发为大数据技术落地“铺路”
1、走得更稳——回应数字时代重要的安全关切
因此,鲲鹏大数据解决方案在安全方面一直加大投入,最典型的,是在底层硬件而非软件层面进行安全保障——鲲鹏920处理器内置硬件加速器、业界首创支持国密算法加速,这种CPU内置加速模块的做法,被称作“内生安全”,配合国密算法在技术上更为安全。
而与通常的大数据解决方案为了保证安全不得不让渡较多的性能随时监控系统运行不同,华为鲲鹏大数据解决方案内生安全的做法,做到了加密对业务性能的损耗低于5%——既解决安全痛点问题,也解决“为了安全需要”本身导致的痛点问题。
2、走得更顺——用兼容性保护既有数据软硬件投资
前文提到政务云大数据解决方案中,与现有的服务器的混合部署,这其中有一个十分重要的兼容性做法——由于鲲鹏大数据解决方案建立在鲲鹏处理器基础之上,而很多政企组织原有的软硬件投资都基于X86架构,所以鲲鹏要让技术的应用落地走得更顺,还需要在技术上完成对X86在部署层面的兼容,这样还能保护政企客户现有的数字化投资。
可以看到,当下的鲲鹏方案已经支持大数据组件TaiShan服务器与其他架构服务器混合部署。
以江苏电信为例,去年7月,其宣布成功上线全球首个基于鲲鹏处理器的运营商大数据平台。作为核心的业务系统,该大数据平台基于鲲鹏处理器的华为TaiShan服务器和开源Hadoop软件构建,承载着江苏电信所有生产系统的运行数据、存储及分析:
在项目进行过程中,双方携手完成基于鲲鹏处理器的开源Hadoop源代码编译,让关键的大数据业务组件在华为TaiShan服务器上的成功部署和运行,在原有集群上实现了传统架构服务器和TaiShan服务器融合部署。
这种兼容的做法,有效结合了江苏电信大数据业务特点和未来演进趋势,且充分发挥鲲鹏处理器的性能,提高了数据存储、计算等资源的使用效率。
3、走得更宽——生态开放才能让大数据拥有内生动力
鲲鹏生态的主要推动者华为一直强调的理念是“硬件开放、软件开源、使能合作伙伴”,在大数据解决方案中,这种理念同样得到了应用。
例如,在鲲鹏全栈方案中,顶层大数据平台就支持华为自研的FusionInsight大数据平台以及开源Apache、开源HDP/CDH、星环大数据平台,可以有效对接各类场景需要。今年8月,星环 科技 就发布了基于鲲鹏的大数据平台软硬件联合解决方案,由星环 科技 的TDH大数据平台提供软件层面优异的功能,由鲲鹏芯片提供硬件层面强大的性能,拥有极致性能、平滑迁移、丰富的场景支持以及快速部署多重优势,为行业创造价值。
此外,鲲鹏主导的数据虚拟化引擎openLooKeng开源,就支持跨数据格式、跨数据源、跨数据中心的海量分析,最终帮助方案的性能大幅度提升,典型的如北明数据资产管理平台V4.0就基于openLooKeng技术,解决了数据资产管理数据冗杂、标准不一、难以管理等痛点问题,为企业守护和挖掘数据的价值。
开放的生态,将帮助更多合作伙伴发展服务器和PC等计算产品,帮助构建高质量的基础软件生态,也让更多生态伙伴获得端、边、云的全场景开发能力,最终促进鲲鹏计算生态的繁荣,也加速大数据行业应用创新。
打好基础、做好标杆, 鲲鹏进入“强者恒强”周期
弥合技术与应用落地的鸿沟后,鲲鹏大数据解决方案拥有越来越多的政企实践,它们中大多数都是行业典型客户,本身既是大数据发展过程中的优质案例。
拥有这些客户资源的鲲鹏,实际上已经进入了强者恒强的发展周期,这不仅仅是因为它获得了诸多标杆合作案例、领先于行业,更重要的还在于,技术到应用实践的通路打通后,实践也将不断反馈技术,不断帮助鲲鹏锤炼自身的技术能力,从而形成有效的正反馈循环。
一旦这种循环形成,大数据解决方案就会进入“飞轮”式发展进程,越转越快、越难以停下,也很难以被后进者追赶,逐步成为政企客户最有竞争优势的选择。
更进一步来看,大数据服务从来都不是孤立存在的,在计算需求多样化的时代,鲲鹏计算产业生态的主要推动者华为在物联网、5G、AI等方面的能力和生态布局,无疑将帮助鲲鹏大数据解决方案有更多横向技术连接和融合的想象空间,满足更多政企客户潜在的创新业务需求。
总而言之,在以鲲鹏大数据解决方案为代表的优质案例引领下,数据与计算的时代正在加速到来,最终,“新算力”将推动“新基建”全面落地,带来“新经济”动能,更多政企客户将享受到技术带来的价值红利。
*本文图片均来源于网络
【完】
曾响铃
1钛媒体、品途、人人都是产品经理等多家创投、 科技 网站年度十大作者;
2虎啸奖评委;
3作家:【移动互联网+ 新常态下的商业机会】等畅销书作者;
4《中国经营报》《商界》《商界评论》《销售与市场》等近十家报刊、杂志特约评论员;
5钛媒体、36kr、虎嗅、界面、澎湃新闻等近80家专栏作者;
6“脑艺人”(脑力手艺人)概念提出者,现演变为“自媒体”,成为一个行业;
7腾讯全媒派荣誉导师、多家 科技 智能公司传播顾问。
Ⅱ 新媒体遇上大数据 隐私保护仍是“痛点”
新媒体遇上大数据隐私保护仍是“痛点”_数据分析师考试
大数据并不是简单地买几台服务器把数据存下来,而是要将大数据与实际接轨,突出工具化、服务化和实用化,让大数据能解决具体问题。
新媒体在运用大数据过程中,一个非常关键的问题是隐私保护。在使用大数据过程中保护个人隐私,需要司法机关发布有效的法律判例,对侵犯隐私行为形成舆论压力;同时要加强大数据隐私保护研究
7月9日,金砖国家领导人第七次会晤在俄罗斯乌法举行。
当天,人民日报全媒体平台“烹”出一张图解:《金砖国家大数据》。
这并非新媒体与大数据的第一次结合。
前不久由中国社会科学院发布的《中国新媒体发展报告(2015)》称,中国新媒体已超越“跨行业”,初步呈现“全产业”发展新趋势。移动化、大数据化和智能化的新媒体已成为具备高强渗透度的产业基因,可深度融合于经济产业各领域之中。
专注研究新媒体与数据新闻的清华大学新闻与传播学院教授沈阳认为,当前,大数据在新媒体中应用广泛,贯穿于新媒体发展的各个方面。
大数据运用广泛
人民日报全媒体平台发布的《金砖国家大数据》,只是近期新媒体运用大数据的一个例子。
早在大数据这一概念进入公众视野不久,便有媒体将大数据运用于新闻报道之中。
2014年春运期间,互联网上就出现了一张可以呈现国内春节人口迁徙实况的地图,这张尽显中国春运迁徙实景的图片更是登上央视《新闻联播》进行权威盘点。自从春运开始,这张地图多次被电视、报纸等媒体引用,成为用数据解读春运状况的一个样本。据称,这是国内首个运用大数据播报国内春节人口迁徙实况的地图。
相较于电视、报纸等传统媒体,新媒体对大数据的运用更加频繁,作为新媒体代表之一的“澎湃新闻”便是如此:今年2月,“澎湃新闻”出品了《大数据告诉你,梅西的右脚现在有多恐怖》;3月,《落马老虎大数据:除“军虎”外,69人共花两千多年入省部级》“走”下生产线。
在沈阳看来,将大数据应用于报道内容,只是新媒体运用大数据的一个方面。
在与《法制日报》记者交谈过程中,沈阳列出了新媒体“遇上”大数据的多个“场景”:在做新媒体功能研发时,哪些要素需要增强、哪些需要减弱,可以运用大数据分析进行修正;在策划选题时,可以通过大数据分析筛选出哪些话题关注度高、最热门;在内容推送过程中,可以利用大数据对用户兴趣进行分析并梳理出来;新闻发出后,受众有哪些评论、转发多少、分享情况,这些都可以通过大数据获得结果;即便是在广告投放环节,也可以通过大数据分析、预判广告与用户是否匹配、广告对新媒体品牌价值是否会有影响。
“大数据贯穿于新媒体的各个方面。”沈阳说。
“完美”并非绝对
尽管大数据很重要、很管用,但沈阳很早就发现,“大数据,没有看起来那么美”。
“数据真实性是一个不可回避的问题。目前,水军、僵尸粉、刷阅读量等情况都有存在,这在一定程度上给数据提供了虚假成分。”沈阳说,不过,从宏观上讲,可以控制这些虚假成分。
如何控制“水分”?沈阳举例说,在统计微博粉丝时,可以将范围缩小至带V的粉丝,因为带V粉丝造假成本高;如果要更精准的数据,可以进一步缩小范围,如近期活跃的带V粉丝。“当然,这样筛选数据会面临高成本的问题”。
沈阳在早期的研究中还关注到大数据的另外两个问题:样本代表性和相关性误差。
沈阳认为,我们不可能搜集到全数据,而与大数据相关的形容词往往是大规模、精准、细化,在调用如此“完美”的数据时,如何注意情景和样本的适用性是一个问题。正如网络民意与现实民意的讨论,微博不代表网络,网络不代表社会,朋友圈也是小圈子,跳出圈子看世界不容易,切勿陷入相同的悖论。在选样、测量、误差校正不尽如人意时,好数据将劣化,大数据将虚化。
相关性误差,则更偏向于技术。沈阳认为,在要素构成简单的情景中,可以利用大数据,基于一定算法和模型对变量元素进行相关性分析。然而,在复杂系统中,仅有相关性解释还不够,易走偏。比如一个明显不对的结论:一个城市的网页数越高,其网络形象就越好。虽然数据统计证实了网页数和网络形象存在一般的正相关,但忽略了负面事件带来的网页量爆发等,因此结论也是不科学的。相关性要真正体现在数据之间、数据与真实事件影射的现象之间、真实事件的客观联系上。
“大数据并不是简单地买几台服务器把数据存下来,而是要将大数据与实际接轨,突出工具化、服务化和实用化,让大数据能解决具体问题。”沈阳说。
隐私保护日益突出
基于多年研究大数据的心得,沈阳认为,新媒体在运用大数据过程中,一个非常关键的问题是,隐私保护。“目前,隐私保护问题越来越突出”。
此前,《法制日报》记者在参加一次论坛时,工信部相关部门一名负责人曾表达这样的观点:大数据时代到来后,随着互联网技术及其应用的发展,大数据、云计算技术方式的使用,个人信息的价值不断被挖掘、被使用,但是安全保护是一个很大的问题。
工信部相关部门这名负责人认为,大数据时代的个人信息安全面临三大问题。
“一个问题是数据未经授权被搜集,这种情况发生得比较多。”工信部相关部门这名负责人说,第二个问题是超出范围使用。所谓超范围使用,是指企业通过一定的所谓合法的形式拿到个人信息,但是拿到以后使用信息的目的、用途以及范围,并非信息权利主体所熟知。这种情况包括,当互联网对一些数据信息进行更进一步或者深层挖掘时,这种挖掘在一定程度上有可能侵犯了权利主体的权益。因为互联网企业之前可能告诉权利主体,获取信息是基于特定的目的或者在特定范围内使用,但是进一步挖掘就有可能触犯了约定。第三个问题是数据保存。曾有网络社区存储的几千万用户信息被黑客拿到后转卖给第三家,最后造成信息滥用。
在新媒体广泛使用、深度挖掘大数据的时代,如何保护公民隐私?
工信部相关部门这名负责人提出了一个观点:信息保护人人有责。
“在信息安全保护方面,很重要的一点在于,权利人自身要加强保护意识。”工信部相关部门这名负责人说,现在,不管是要求政府部门监管,还是要求司法机关动起来,一个重要前提是人人保护信息,这样才可能使信息保护问题得到根本解决,否则只靠公权力机关单方面去做是没有用的。当然,在提倡人人保护信息的同时,执法保护也是一个很重要的方面。
在沈阳看来,在使用大数据过程中保护个人隐私,一方面需要司法机关发布有效的法律判例,对侵犯隐私行为形成舆论压力;另一方面要加强大数据隐私保护研究。
以上是小编为大家分享的关于新媒体遇上大数据隐私保护仍是“痛点”的相关内容,更多信息可以关注环球青藤分享更多干货
Ⅲ 扬州将如何用大数据技术识别拦截骚扰电话
保险、商铺、楼盘推销,培训班咨询……这样的推销电话,几乎每个扬州人都曾接到过。层出不穷的电话骚扰,让人十分无奈。最近,扬州一小伙因不堪各类推销电话的骚扰,特意在手机上安装了安全软件。一个月下来,被拦截的推销电话竟有73个之多。
扬州通信业发声将利用大数据技术判断、识别、拦截记者从扬州运营商处获悉,运营商在省公司层面,已经按照工信部的要求,拦截骚扰电话。 怎样从茫茫的“话海”中,准确识别出骚扰电话呢?这就不得不提到大数据技术。 据运营商人士介绍,运营大数据技术,可以准确判断、识别和拦截骚扰电话。“举个例子,如果同一个号码,向外打电话的频率特别高,而每次通话时长又特别短,我们可以推定为广告推销电话。”广告推销电话的特点是,一分钟内的通话可达十多次,而每次通话的时长只有短短数秒,显然不符合常规通话的特点。 若同时该号码又被人举报为骚扰电话,就可对其实施拦截了。运营商人士表示,目前有12321骚扰电话、垃圾短信举报平台,用户可拨打12321举报电话举报骚扰电话。
来源:澎湃新闻网
Ⅳ 如何拥抱“大数据时代”
汹涌澎湃的大数据浪潮,正携带着巨大商机,撞击传统经济的概念和思维。大数据孕育和驱动下的新产品、新服务、新产业层出不穷,并日益深刻地改变着每个人的日常生活。一个基于技术进步的“大数据时代”正在来临。
中国有句成语,叫“窥一斑而知全豹”。回望人类发展的历史长河,囿于技术限制的“抽样数据”,和建立在此“有限数据”基础上的假设、推理、论证,恰如“窥管知豹”一样,是人类在无法获得“全体数据”的条件限制之下,探索未知领域时无法选择的唯一途径。
在互联网基础上发展起来的社交网络、电子商务、移动通信、可穿戴设备等“云计算”技术,让“抽样数据”迅速让位“全体数据”,“全体数据”即“大数据”时代的来临,使“知全豹”不仅成为可能,而且变得越来越容易。
宽带资本董事长田溯宁说:“以云计算为基础的信息存储、分享和挖掘手段,可以便宜、有效、快捷地将这些大量、高速、多变化的终端数据存储下来,并随时进行分析和计算。”
“全豹”当然比“一斑”更能反应事物的本质。《大数据时代》的作者维克托认为,大数据使人类第一次有机会和条件,在非常多的领域和非常深入的层次,获得和使用全面数据、完整数据和系统数据,深入探索现实世界的规律,获取过去不可能获取的知识,得到过去无法企及的商机。
田溯宁认为,大数据正在成为巨大的经济资产,是新时代的“矿产”与“石油”,并将带来全新的创业方向,商业模式和投资机会。
的确,大数据正成为资本“热恋”的对象。从Facebook、谷歌,到网络、九次方,五湖四海的资本如过江之鲫,正在加速向“大数据”领域集结。成立于2010年的九次方大数据,2014年、2015年两次融资,就募得资金近10亿元,得到了博信资本、建银财富、当代集团、IDG资本等18家顶尖基金的追捧。
《2015年中国大数据产业白皮书》显示,我国大数据市场规模2014年达到767亿元,预计到2020年将超过8000亿元。而申万宏源的报告分析称,10年后“大数据”可撬动万亿元级GDP。
美好的前景,并不能掩盖前行的曲折。稀缺是任何资源的基本属性。“大数据”发展的瓶颈,同样在于数据的“可获取性”。中国政府网披露的信息显示,目前我国信息数据资源80%以上掌握在各级政府部门手里,“深藏闺中”而未能与社会共享,造成了极大的浪费。
身处大数据时代,人们生活所需的导航、气象、房屋、医疗、就业等信息,往往都来自政府的信息数据开放;产业发展所需的战略思考、布局规划、落地方案等,往往也要依托对政府信息数据的挖掘、重组、混搭。庞大的手机用户和应用市场,造就了中国大数据资源的极端丰富性。解决这些由大规模数据引发的问题,探索以大数据为基础的解决方案,是中国产业升级、效率提高的重要手段。
贵阳大数据交易所执行总裁、九次方大数据创始人王叁寿认为,大数据将成为继土地之后政府手中最值钱的资源。他说,激活政府手中的大数据资源,让它们走出政府的“深闺大院”,作为要素参与市场,既是简政放权的现实需要,也应该是供给侧改革的重要内容,更是拥抱大数据经济的必由之路。
流动的要素才能创造价值。开放、流通的数据是时代发展的要求。目前美国政府已创建了Data.gov网站,为大数据敞开了大门;英国、印度也有“数据公开”运动;我国近年来也崛起了贵阳大数据交易所等一批数据交易机构,但作为数据主体的政府依然动作缓慢。
数据的挖掘和应用,不仅是公司竞争力的核心,也必将成为国家竞争力的标志。在我国产业转型升级的过程中,以大数据思维的创新方式解决问题,推动供给侧改革,创建新的产业群,实现“中国制造”向“中国创造”“中国智造”转型,意义显得尤为重要。
纵观近代历史,历次技术革命,中国都落在了时代的后面。而这次以互联网为基础的大数据变革,中国与世界的距离最小,在很多领域甚至还是领跑者。田溯宁说:“只要我们以开放的心态,创新的勇气拥抱‘大数据时代’,就一定能抓住历史赋予中国创新的机会。”
Ⅳ 大数据的边界和大数据生存法则
大数据的边界和大数据生存法则
“大数据”的汹涌澎湃,让人们逐渐意识到,由此带来的,极有可能是一场发生在几乎所有领域的颠覆性革命。只是,虽然坊间有关大数据的论著很多,但敢于将这种趋势上升到“主义”高度的,恐怕非史蒂夫·洛尔莫属。身为在《纽约时报》撰稿长达二十余年的非虚构写作者和资深记者、编辑,因为长期从事数据科学报道,洛尔早在十多年前就敏锐地感受到“大数据”即将给人类带来的变化。而眼前的这本《大数据主义》,不同于此前的大多数同类论著的动人之处在于,它以一个在数据分析行业找到人生价值的年轻人、曾为脸谱网建立了最初的数据科学家团队的哈佛毕业生杰夫·哈梅巴赫的经历,以及人类数据时代的标杆——IBM公司的大数据生存法则为主线,在叙事中又穿插了大量相关人物的故事和观点,勾勒出了近几年大数据浪潮对人类生活诸多方面的深刻影响。
早在2012年初,史蒂夫·洛尔便先知先觉地以“大数据主义”为题,在《纽约时报》“周日评论”板块发表了一篇社论,网站点击量激增,很多读者还写了关于这篇文章的评论。《大数据主义》便是对上述主题进一步挖掘的成果。
杰夫·哈梅巴赫,这位曾在华尔街这个聪明人汇集的行业做金融数据分析,之后又加盟脸谱网,在从事数据科学研究的同时也为自己的人生赢得了财务自由。离开脸谱网后,他自己创办了一家名为Cloudera的公司,自任首席科学家,编写用于数据科学研究的软件。2012年夏天,年仅28岁的哈梅巴赫又转战医疗业,加入纽约西奈山伊坎医学院,领导一个数据小组,从事遗传信息的研究,为探索疾病模型的建立方法和治疗手段寻找突破口,这是他认为的目前能将数据科学研究投入应用的最佳途径。而作为一家有着上百年历史的科技巨头,IBM对数据技术的进展同样甚为关注,他们在较早时候就组建了研究团队,制定了战略方针,投入了大量资金,招募大批该领域的专家,团队人数至今已达2000人。其首席执行官甚至告诉洛尔:“我们把整个公司的前途都押在了大数据技术的应用上。”
大数据生存法则
自1946年计算机问世以来,便不可逆转地加速改变着人类的生活方式和进程。时至今日,海量存在于互联网及其他各处、能被人们获取的信息,早已由千字节(KB)、兆(MB)、千兆(GB)、太字节(TB),跃升为拍字节(PB)、艾字节(EB)、泽字节(ZB),乃至尧字节(YB)。据测算,如果将人类现存的信息全部汇集并存贮起来,需要用到的ipad,叠加起来的厚度可绕地球三分之二圈。正是这惊人的数据总量,使人类在处理信息时能经历从量变到质变的过程,就如同物质到了纳米级别,各种原有的特性都会发生惊人的突变,“大数据”概念的诞生,正是数据存量不断累积的必然结果。
面对不断生成的各种数据,尤其同一个系统或平台上生成的数据,尽管以人类的大脑很难理清它们相互之间的关系,对这些数据得以如此产生的前因后果更无法给出合乎逻辑的解释,但它们之间确实存在着一定的相关性。尽管以人类现有的理解能力看来,这种相关性并不十分清晰,甚至有几分神秘,但通过总结这一系列数据之间的生成规律,人们仍然可以比过去更为有效地决策,而不是像过去通常所做的那样,依靠个人直觉或是一些只可意会不可言传的经验来做出某个重要决定。因此,许多在过去看来无用的数据,今日都“变废为宝”了。举例来说,世界最大零售商沃尔玛通过对大数据统计和研究发现,男性顾客在购买婴儿尿片时,通常会顺便买上几瓶啤酒。尽管商家不知其中缘由,但还是果断推出了啤酒与尿布捆绑销售的促销方式,提升了啤酒销量。由此看来,正是大数据带来的定量分析方法,为人们的决策带来了新的参考依据。作为一种创新工具,它还催生了大量相关技术,如社交媒体、传感器信号、基因组信息等,不仅有利于经济增长,还可以帮助我们重塑构建世界的方式,甚至在一定程度上改变我们世界观。
尽管大数据技术刚刚起步,但如今可涵盖的应用领域已十分广泛:从挖掘数据帮助企业经营决策,到对社交媒体用户展开细致入微的数据分析,提高网站的广告点击率;从利用大数据培育性能前所未有的智能机器人,到推动一些传统产业的升级换代。此外,还有更为性命攸关的医疗行业的“大数据革命”。例如有人提出,许多慢性疾病并非个体基因引起,而是一种复杂的网络性紊乱,涉及从分子、细胞、组织、器官到人类社群的各个环节。因此他们将一组涉及年龄、病史、生活方式和环境等可能影响疾病的发生发展因素,通过复杂的数学模型,全部转化为数字,以便试验性地检测一个人三年内患上某种疾病的可能性。尽管从定量分析角度看,精密科学,如物理学、化学等学科更为成熟,预测结果也更准确,但人们仍在努力引导医疗行业向定量分析的方向发展,而非仅仅依靠经验对人的健康状况定性。
在美国某些研究机构中,大数据应用几乎可协助建立人类行为模型,帮助人们了解自身各种行为之间的关联关系,那些不曾为人所知的人类行为的奥秘也将慢慢得到破解。
另一个很有意思的例子,发生在IBM公司研制的智能机器人沃森身上。这个“人”在《危险边缘》节目中高超的信息处理速度,战胜了面对人类对手战无不胜的超级挑战者,令人想起当年深蓝战胜棋王卡斯帕罗夫的故事。似乎显得巧合的是,深蓝的发明者,同样是IBM公司,如今它又一次以辉煌战绩证明了在人工智能领域的领先地位,所不同的是,这次的胜利,离不开大数据技术的鼎力相助。
在IBM沃森实验室召开的一次学术会议上,人工智能专家希利斯更提出了一个极具前瞻性的观点:“机器人必须学会讲故事。”在希利斯看来,如果一个计算机系统只会提供答案,而不会“思考”和“解释”问题,那么无论运算速度多快,都不会有突破性的前景。这里所说的“讲故事”,其实就是在软件糅合数据、想法、推断,并形成决策时,对整个过程实施跟踪,让人们在使用过程中和过后都能知道计算机是如何一步一步完成其工作的。给出这样的解释,就能让人们知道机器人与我们之间的关系,也就是弄清楚,在整个决策过程中,有哪些部分工作是机器人完成的,有哪些是由人类所做的。
大数据真果真无懈可击?
既然如此神奇,大数据技术及其应用岂不是理应被当代渴望进步、增长的人们顶礼膜拜·史蒂夫·洛尔并不这样认为。大数据技术的应用,仅从其可靠性而言,就亟待改进。在近年来一些大公司的错误经营行为中,常常可找到大数据应用的影子。此外,伴随大数据技术渗透进人们生活的,还有个人隐私被泄露的风险。无论社交网络的使用,还是各种随身软件中内置的定位装置,甚至连个人的基因信息,都会在人们并不知情的情况下,被大数据拥有者有意或无意地获取,从而令个人信息的保护程序受到严重威胁。
这方面最典型的例子还要数安客诚公司。这家全美最大的数据代理商,在全球范围内收集了数亿名消费者的相关数据。这些公开或推断所得的信息包括年龄、种族、性别,党派,以及诸如对度假的期待、对健康的关注程度等非客观信息。在将这些数据归纳之后,这家网站就可轻易推断出大多数美国成年人在这些项目上的相关数据,其深入细致的程度无人可及。《纽约时报》的一位评论员甚至写道:“访问者登录之后就会发现,该网站不仅有大量与自己有关的信息,甚至还有描述详细的私生活,面对这种情况,他们可能会大吃一惊。”面对这种对个人隐私的严重侵犯,除了少数民间的隐私权倡导者提出抗议之外,无论从法律或技术层面,至今仍没能设计出有效的预防措施加以制止。
更为本质的问题还在于:尽管很多大型现代企业早已进入了“无法计量就无法管理”的时代,但在人类生活的其他方面,仍有许许多多重要的东西无法只用数据就可以说明或解决的。事实上,至少迄今为止,几乎所有能赋予我们的生活以终极意义的东西,如情感、信仰、人与人之间的爱,还有个体自身庄严阔大的精神世界,都绝不可能以数据来涵盖或表达。因此单纯的数据崇拜并非福音,面对人类生活的无数复杂微妙之处,任何形式的“大数据决策”,都有必要用谦卑来调和,以免误入歧途。
以上是小编为大家分享的关于大数据的边界和大数据生存法则的相关内容,更多信息可以关注环球青藤分享更多干货
Ⅵ 金融科技发展规划18个要点:主要涉及人工智能、大数据、云计算
今后三年中国金融 科技 的发展规划正式揭开了神秘面纱,9月6日,央行官方正式发布了《 金融 科技 (FinTech)发展规划(2019—2021年)》(下称《规划》)。
《规划》开宗明义的指出,
持牌金融机构在依法合规前提下发展金融 科技
,有利于提升金融服务质量和效率,优化金融发展方式,筑牢金融安全防线,进一 步增强金融核心竞争力。
《规划》提出的目标是,到2021年 ,建立健全我国金融 科技 发展的“四梁八柱 ”, 进一步增强金融业 科技 应用能力,实现金融与 科技 深度融合、协调发展,明显增强人民群众对数字化、网络化、智能化金融产品和服务的满意度,使我国金融 科技 发展居于国际领先水平。
《规划》提出的重点任务包括六个方面,即加强金融 科技 战略部署、强化金融 科技 合理应用、赋能金融服务提质增效、增强金融风险技防能力、加大金融审慎监管力度、夯实金融 科技 基础支撑。
以下为澎湃新闻梳理的《规划》要点:
1.依法合规 探索 设立金融 科技 子公司等创新模式。
2.合理增加金融 科技 人员占比。金融机构要在年报及其他正式渠道中真实、准确、完整地披露 科技 人员数量与占比。
3.建立健全企业级大数据平台,进一步提升数据洞察能力和基于场景的数据挖掘能力,充分释放大数据作为基础性战略资源的核心价值。
4.推动形成金融业数据融合应用新格局,助推全国一体化大数据中心体系建设。
5.强化金融与司法、社保、工商、税务、海关、电力、电信等行业的数据资源融合应用。
6.引导金融机构 探索 与互联网交易特征相适应、与金融信息安全要求相匹配的云计算解决方案。
7. 探索 相对成熟的 人工智能 技术在资产管理、授信融资、客户服务、精准营销、身份识别、风险防控等领域的应用路径和方法,构建全流程智能金融服务模式。
8.推动建立 人工智能 金融应用法律法规、伦理规范和政策体系。
9.有计划、分步骤地稳妥推动分布式数据库产品先行先试,形成可借鉴、能推广的典型案例和解决方案,为分布式数据库在金融领域的全面应用探明路径。
10.积极 探索 新兴技术在优化金融交易可信环境方面的应用,稳妥推进分布式账本等技术验证试点和研发运用。
11.打造“看懂文字”、“听懂语言”的智能金融产品与服务。
12.加强 人工智能 、 移动互联网、大数据、云计算 等 科技 成果运用,加快完善小微企业、民营企业、科创企业等重点领域的信贷流程和信用评价模型,引导企业征信机构利用替代数据评估企业信用状况,降低运营管理成本。
13.研究制定条码支付互联互通技术标准,统一条码支付编码规则、构建条码支付互联互通技术体系,打通条码支付服务壁垒,实现不同APP和商户条码标识互认互扫。
14.突破1:N人脸辨识支付应用性能瓶颈,由持牌金融机构构建以人脸特征为路由标识的转接清算模式,实现支付工具安全与便捷的统一。
15.动态监测分析网络流量和网络实体行为,绘制金融网络安全整体态势图,准确把握网络威胁的规律和趋势,实现风险全局感知和预判预警,提升重大网络威胁、重大灾害和突发事件的应对能力。
16.引导金融机构积极配合实施穿透式监管,通过系统接口准确上送经营数据,合理应用信息技术加强合规风险监测。
17.支持高校和科研院所研究建立金融 科技 相关学科体系,推动经济金融、计算机科学、数理科学等多学科交叉融合。
18. 研究调整完善不适应金融 科技 发展要求的现行fa律fa规及政策规定,推动出台金融业新技术应用的相关fa律fa规,在条件成熟时将原有立法层次较低的部门规章等及时上升为法律法规。
Ⅶ 长乐:数字引擎 动能澎湃
党的二十大报告指出:
建设现代化产业体系。坚持把发展经济的着力点放在实体经济上,推进新型工业化,加快建设制造强国、质量强国、航天强国、交通强国、网络强国、数字中国。
19日,位于 福州市 长乐区的博思人工智能产业园建设迎来喜讯——施工难度极大的1、2号楼空中弧形钢结构连廊完成提升工作,显出惊艳的“博思之眼”外形。
“党的二十大报告铅歼宏强调要加快建设数字中国,给了我们数字企业更大信心!这个园区建成后,将为人工智能研发人员筑新‘巢’。”博思软件集团董事、高级副总裁叶章明说。
以博思为代表,位于东海之滨的长乐,数字产业正踏浪而行、高速发展。
2000年,时任福建省省长习近平极具前瞻性地作出了建设“数字福建”的战略决策。福建,由此成为数字中国建设的思想源头和实践起点。截至目前,福建已经连续五届成功举办了槐册数字中国建设峰会。
20多年来,福建始终牢记习近平总书记的殷殷嘱托,用数字化赋能高质量发展,取得显著成就。长乐区就是一个缩影。作为产业重镇,长乐区近年来大力推进“产业数字化、数字产业化”,推动主导产业——纺织化纤产业加快转型升级,同时培育壮大大数据、人工智能等新兴产业,不断掀起澎湃的数字化发展浪潮。
·新福建客户端记者在博思人工智能产业园建设工地采访。 吴旭涛 摄
产业数字化
传统产业插上新“翅膀”
随着工业信息化革命的到来,行业竞争的不断加剧,长乐纺织业也面临着转型压力。如何借助“数字福建”“数字福州”,抢抓数字化转型先机,获取新动能、激发新活力?
当地龙头企业恒申集团,就率先尝到了“甜头”。
19日,记者来到恒申合纤科技有限公司,不少党员员工在“恒申创新发展中心”展厅的党建展板前,学习热议党的二十大精神。
“党的二十大报告强调坚持把发展经济的着力点放在实体经济上,这让我们实体企业倍感温暖。”恒申合纤常务副总经理何卓胜说,企业数字化发展信心更足了。
在锦纶后纺三期厂房,与印象中纺织业“千人纱、万人布”不同,这里的生产线实现了智能化,不需要人工值守点位。端头,一位检测人员正操作着最新的智能化质检系统。
“我们生产的每一锭纱,都要检测后再出厂。新上马的这套设备采用5G+工业互联网技术,以工业相机+检测机器人代替人工,大大提高了效率。”恒申合纤科技有限公司信息部总监肖卫民介绍,过去人工检测一车共48锭纱,需要15分钟;现在智能检测检完一车不到3分钟,检测准确率提升到99%,漏检率也大大下降。
产业数字化升级,助力企业跨越发展。继连续跨国收购、掌握全球己内酰胺话语权后,今年在全球纺织业受疫情影响面临压力的背景下,恒申合纤逆势上扬,上半年总产值同比增长10.42%。
“龙头”舞动,还需政企联动。近年来,长乐区抢抓“数字中国”建设机遇,大力推进产业数字化。当地着力打造的纺织工业互联网平台,已完成525家企业、7723台设备上云上平台,整合了长乐大部分纺织企业的上下游交易数据。此外,还重点培育了“辅布司”长乐工业互联网公共服务平台、智慧供应链协同智能制造云服务平台等8大工业互联网平台。
数据显示,此类平台的建设,让传统产业平均减少60%以上的一线操作人员,节约能耗20%,大大优改迹化了产品开发、制造和销售体系。
“党的二十大报告强调推进新型工业化,加快建设制造强国、质量强国、航天强国、交通强国、网络强国、数字中国。”长乐区工信局党组成员、总工程师官建立介绍,近年来,长乐区大力推动数字经济赋能先进制造业,大力发展工业互联网,让更多企业上云上平台,打通产业链供应链操作链,产业不断向智能化高端化升级。
数字产业化
“筑巢引凤”增添新动能
在长乐,传统产业实现数字化升级,新兴数字产业也不断落地。
“我们建设博思人工智能产业园,并不是把原来的产能挪到新园区,而是通过持续创新发展、新增动能!”刚从产业园工地回到公司办公室,叶章明又忙碌起来。
他介绍,博思现有政府智慧财政财务、数字采购、智慧城市+数字乡村3大板块业务,是国内电子票据和政府采购信息化龙头企业。目前,博思开发的“政府采购云平台”在全国同类平台中市占率第一、达35%;全国财政电子票据业务占有率达85%;企业还在电子缴费全国通缴、数字人民币场景服务等新兴业务上发展强劲。
“党的二十大报告强调要加快建设数字中国,我们信心十足。加之长乐数字产业基础好,契合我们的需求。因此,我们决定把企业的‘未来’也放在这里。”叶章明说,“未来4到5年,我们将陆续引进3000到5000名高新技术人才,入驻到新建的人工智能产业园,助推长乐大数据产业发展。”
博思底气十足,正是长乐数字产业高速发展的真实写照。近年来,长乐借“数字福建”“数字福州”的东风,承接数字中国建设峰会溢出效应,打造数字产业高地,一批大数据龙头纷纷入驻。
位于东湖湖畔的东南大数据产业园内,中电数据、贝瑞基因、网龙科技等一大批大数据龙头企业云集,福州国家级互联网骨干直联点、“海峡光缆一号”、超算中心二期等产业基础设施陆续建成,国家东南健康医疗大数据中心等国家级平台落地……截至今年9月,产业园已注册企业超800家,成为全省规模最大的大数据产业集聚区之一。
此外,网龙元宇宙、“谷仓海外仓”等项目,也让长乐数字产业拓展赛道、更具未来。
数据显示,2021年,长乐数字经济占GDP比重达55%,数字核心产业占比达9.5%,在全省处于领跑地位。在数字经济赋能下,多元产业体系正不断构建,产业高质量发展势头强劲。(记者 吴旭涛 段金柱)
Ⅷ 大数据时代 的应急管理变革
大数据时代 的应急管理变革
当前,大数据浪潮汹涌澎湃。大数据所具有的大量(volume)、高速(ve locity)、多样(variety)和真实(ve racity)的特性正在推动原有社会生产生活模式的重大变革。在应急管理领域,大数据技术的发展至少带来两个方面的革命性变化。
一方面,大数据的出现改变了突发事件的发生、发展和演化的时空模式,加深了突发事件的不确定性。数据关联和信息联通扩大了传统突发事件的影响范围,数据的高速传输也可能使某些负面信息通过互联网瞬间引爆网络群体性事件。海量个性化数据的存储和传输过程中的安全问题则孕育了超乎想象的全新风险。
另一方面,大数据又为可测量、可追踪和精细化的应急管理提供基本信息和管理工具。大数据技术可将这些纷繁复杂的多源异构数据处理成具有决策价值的有效信息。传统管理模式下,应急决策大多是依据个人经验的直觉决策(heuristic decision),而大数据技术的应用使得高度不确定性和高度时间压力下的分析决策(analytical decision)成为可能。
这两个方面的变化是相辅相成、具有逻辑关联的,前者是应急管理对象的变化,后者是应急管理方式的变化,正是由于大数据时代突发事件的形式和规律都在不断发生变化,因此适应大数据发展的应急管理方式变革势在必行。
综观世界各国应急管理的最新进展,大数据技术的应用大致体现在以下五个方面。
大数据技术在突发事件监测预警领域的应用。著名的大数据研究者迈尔·舍恩伯格和库克耶在其畅销著作《大数据时代:生活、工作与思维的大变革》中指出,“大数据的核心就是预测,是把数学算法运用到海量的数据上来预测事情发生的可能性”。并描述了一个运用大数据技术预测突发公共卫生事件的经典案例:谷歌公司通过保存和分析人们的搜索指令准确地预测了2009年甲型h1N1流感的爆发,比美国疾病预防与控制中心(CDC)依靠传统方法的预测提前了两周,为有效控制流行病传播提供了宝贵时间。美国政府在国家安全战略中引入大数据技术,用于对恐怖主义活动、黑客攻击、公共卫生事件、舆情危机等进行监测和预警。
基于大数据技术构建的辅助决策系统。危机情景下的决策始终是应急管理领域的一个重大挑战,危机决策的挑战来自于信息不完备、时间压力大等客观条件的约束。大数据技术使得基于所有数据而不是样本数据的决策成为可能。以美国为代表的发达国家开始探索基于大数据技术的辅助决策系统。美国国土安全部从2012年开始运行了第一个跨部门大数据应用试点项目——“海王星”(Neptune)和“地狱犬”(Cerberus),数据库以完全不同于国土安全部自2002年沿袭至今的方式进行了重新组织,计划将不同来源的未经分类的信息汇聚成一个“数据湖”,对海量数据的综合分析成为国家安全决策的重要参考。
大数据技术在城市管理和社会管理领域的运用。大数据将兴起于2008年的“智慧地球”和“智慧城市”建设推进到全新的阶段。城市管理的一个重要方面就是确保城市公共安全。“智慧城市”运用信息和通信技术手段感测、分析、整合城市运行核心系统的各项关键信息,城市系统的突发事件,特别是城市生命线、基础设施、重点地区的突发事件都在“智慧城市”系统的监测之中。而以“网格化管理”为特征的新型社会管理模式也通过监控录像、社区服务信息等途径不断积累大数据,这些数据对于掌握城市和社会的脆弱环节,控制和消除风险因素起到重要作用。
大数据技术对危机中个体行为模式的研究和应用。大数据时代中,由于人的各种行为都可以数据化,因此通过大数据技术分析危机中个体行为模式构筑了应急管理领域中的一个政策基础。大数据技术通过分析单个网民的传播模式研究了舆情热点事件的演化过程,大数据技术通过分析大量个体的言论和行为从而预测群体性事件发生的可能性,大数据技术通过分析人们接受各类灾害(如暴雨、飓风、地震等)的预警信息之后的行为反应以设计更加有效的风险沟通策略,大数据技术追踪个体在灾害中的逃生和自救行为,从而提升应急疏散和第一响应的能力。
大数据技术在应急资源配置中的管理。应急管理是在危机情景下组织应急人员、调配应急物资以缓解和消除危机负面影响的过程。借助于大数据技术,人员流动和物资流动都可以转化为各种形式的大数据,如通过通讯基站可以快速确定通过手机等通讯设备发出应急信号的人员位置,而急救车、消防车等应急设备的运动轨迹可以通过GPS进行定位和追踪。通过对这些数据集的分析可以针对灾害发生的时空规律对应急资源进行优化配置,对危机情景下应急物资的调运进行最优的线路设计。大数据技术使得应急资源的布局和运用更加精准、高效。
以上是小编为大家分享的关于大数据时代 的应急管理变革的相关内容,更多信息可以关注环球青藤分享更多干货