⑴ 大数据工程面临哪些挑战
基础平台的改变
大数据挑战的就是企业的存储系统,大数据爆炸式的增长使得存储系统的容量、扩展能力、传输瓶颈等方面都面临着挑战。与之相连的还有服务器的计算能力,内存的存储能力等等都面临着新的技术攻关。
商业模式的挑战
大数据具有强大的数据价值,当我们可以利用大数据挖掘到需要信息的时候,则需要我们根据得到的信息对企业的商业模型、产品和服务等方面进行创新,这样才能够真正的让大数据的价值得到体现。
⑵ 大数据时代所面临的挑战
大数据时代所面临的挑战
大数据时代临近,企业数据呈现爆炸式增长,如何为了更大的发掘企业数据价值将是很多公司必须要面对的挑战。首当其冲的是大数据的快速发展对我们原有的IT基础设施提供了更高的挑战,原有的IT基础设施以及很难满足大数据时代的需求。发现价值的过程离不开基础平台技术的创新与发展。
基础平台的改变
首先大数据挑战的就是企业的存储系统,大数据爆炸式的增长使得存储系统的容量、扩展能力、传输瓶颈等方面都面临着挑战。与之相连的还有服务器的计算能力,内存的存储能力等等都面临着新的技术攻关。目前闪存技术的发展以及英特尔、IBM等公司在大数据方面都已经投入相当大的资金进行研发,主要也是为了解决大数据对基础平台所带来的挑战。
同样,大数据分析同样面临着软件方面的挑战,同时也引发数据库、数据仓库、数据挖掘、商业智能、人工智能、内容/知识管理等领域的技术变革。Hadoop是近年大家经常提到了一个能够对大量数据进行分布式处理的软件框架,用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。
商业模式的挑战
大数据具有强大的数据价值,当我们可以利用大数据挖掘到需要信息的时候,则需要我们根据得到的信息对企业的商业模型、产品和服务等方面进行创新,这样才能够真正的让大数据的价值得到体现。
如何利用大数据信息来改变商业模式最终实现价值呢,这里我们引用Tesco为案例。Tesco收集了海量的顾客数据,并且通过对每位顾客海量数据的分析,Tesco对每位顾客的信用程度和相关风险都会有一个极为准确的评估。在这个基础上,Tesco推出了自己的信用卡,未来Tesco还有野心推出自己的存款服务。
以上是小编为大家分享的关于大数据时代所面临的挑战的相关内容,更多信息可以关注环球青藤分享更多干货
⑶ 大数据带来的挑战有哪些
大数据近年来发展的非常快,现在也普遍得到应用,大数据带来了机遇同时也版带来了挑战,当权大数据产业链、行业应用逐步发展完善之后,大数据将会形成质变,创新整个社会形态。光环大数据培训认为,大数据行业的真正挑战来自三个方面:一是原来的分析基础要变化,要融合统计学、计算理论基础、逻辑基础。二是,计算技术也需要重新革新,无论是存储、计算语言、还是计算方法都需要重新来过。三是,大数据做出来的结论对不对,还无法大规模验证,这是目前面临的最大挑战。
⑷ 如何应对大数据的挑战
合理获取数据,存储应需而变,筛选和分析大数据,理性面对大数据的诱惑,云计算和大数据相辅相成,处理好非结构化数据,与硬件保持距离,提高大数据的可视化,安全防范必不可少。
⑸ 大数据的发展所面临的挑战有哪些
挑战一:业务来部门没有清晰的大自数据需求。
挑战二:企业内部数据孤岛严重。
挑战三:数据可用性低,数据质量差。
挑战四:数据相关管理技术和架构。
挑战五:数据安全。
⑹ 大数据时代的数据分析技术面临的挑战
数据分析是整个大数据处理流程的核心,大数据的价值产生于分析过程。从异构数据源抽取和集成的数据构成了数据分析的原始数据。根据不同应用的需求可以从这些数据中选择全部或部分进行分析。小数据时代的分析技术,如统计分析、数据挖掘和机器学习等,并不能适应大数据时代数据分析的需求,必须做出调整。
大数据时代的数据分析技术面临着一些新的挑战,主要有以下几点。
(1)数据量大并不一定意味着数据价值的增加,相反这往往意味着数据噪音的增多。因此,在数据分析之前必须进行数据清洗等预处理工作,但是预处理如此大量的数据,对于计算资源和处理算法来讲都是非常严峻的考验。
(2)大数据时代的算法需要进行调整。首先,大数据的应用常常具有实时性的特点,算法的准确率不再是大数据应用的最主要指标。在很多场景中,算法需要在处理的实时性和准确率之间取得一个平衡。其次,分布式并发计算系统是进行大数据处理的有力工具,这就要求很多算法必须做出调整以适应分布式并发的计算框架,算法需要变得具有可扩展性。许多传统的数据挖掘算法都是线性执行的,面对海量的数据很难在合理的时间内获取所需的结果。因此需要重新把这些算法实现成可以并发执行的算法,以便完成对大数据的处理。最后,在选择算法处理大数据时必须谨慎,当数据量增长到一定规模以后,可以从小量数据中挖掘出有效信息的算法并一定适用于大数据。
(3)数据结果的衡量标准。对大数据进行分析比较困难,但是对大数据分析结果好坏的衡量却是大数据时代数据分析面临的更大挑战。大数据时代的数据量大,类型混杂,产生速度快,进行分析的时候往往对整个数据的分布特点掌握得不太清楚,从而会导致在设计衡量的方法和指标的时候遇到许多困难。
⑺ 我国大数据战略实施面临的五大挑战
我国大数据战略实施面临的五大挑战
一、我国实施国家大数据战略的新成效
近几年,在国家政策支持下,我国大数据战略取得多方面成效:
一是产业集聚效应初步显现。国家八个大数据综合实验区建设促进了具有地方特色产业集聚。京津冀和珠三角跨区综合试验区,注重数据要素流通;上海、重庆、河南和沈阳试验区,注重数据资源统筹和产业集聚;内蒙的基础设施统筹发展,充分发挥能源、气候等条件,加快实现大数据跨越发展。
二是新业态新模式不断涌现。我国在大数据应用方面位于世界前列,特别是在服务业领域,如基于大数据的互联网金融及精准营销迅速普及;在智慧物流交通领域,通过为货主、乘客与司机提供实时数据匹配,提升了物流交通效率。
三是与传统产业融合步伐加快。铁路、电力和制造业等加快了运用信息技术和大数据的步伐。高铁推出“高铁线上订餐”等服务,提升了乘客体验。电力企业推广智能电表,提高了企业利润。三一重工、航天科工、海尔等一批企业将自身积累的智能制造能力,向广大中小企业输出解决方案,着手建设工业互联网平台。
四是技术创新取得显著进展。互联网龙头企业服务器单集群规模达到上万台,具备了建设和运维超大规模大数据平台的技术实力,并以云服务向外界开放自身技术服务能力和资源。在深度学习、人工智能、语音识别等前沿领域,我国企业积极布局,抢占技术制高点。
五是产业规模快速增长。2016年我国包括大数据核心软硬件产品和大数据服务在内的市场规模达到3100亿元。预计2017年有望达到4185亿元。未来2-3年市场规模的增长率将保持在35%左右。未来5年,年均增长率将超过50%。
六是一批企业快速成长。主要分为三类:一类是已经有获取大数据能力、具有一定国际影响力的公司,如网络、腾讯、阿里巴巴等互联网巨头;二是以华为、浪潮、中兴、曙光、用友等为代表的电子信息通信厂商;三是以亿赞普、拓尔思、九次方等为代表的大数据服务新兴企业。
七是法治法规建设全面推进。先后制定和出台《全国人大常委会关于加强网络信息保护的决定》《全国人大常委会关于加强网络信息保护的决定》《电信和互联网用户个人信息保护规定》《电话用户真实身份信息登记规定(部令第25号)》《中华人民共和国网络安全法》等文件,保障用户隐私和合法权益。
二、我国实施国家大数据战略面临的挑战
一是数据权属不清晰,数据流通和利用混乱。大数据带来了复杂的权责关系,产生数据的个人、企业、非政府组织和政府机构,拥有数据存取实际管理权的云服务提供商和拥有数据法律和行政管辖权的政府机构,在大数据问题上的法律权责不明确,数据产权承认和保护存在盲点,阻碍了数据有效流通。
二是数据爆炸式增长与数据有效利用矛盾突出。当前面临的问题不是数据缺乏,而是数据快速增长与数据有效存储和利用之间矛盾日益突出。数据呈爆炸式增长,每两年数据量翻10倍,而摩尔定律已接近极限,硬件性能提升难以应对海量数据增长。
三是企业与政府数据双向共享机制缺乏。目前,我国政府、少数互联网企业和行业龙头企业掌握了大部分数据资源,但数据归属处于模糊状态,法律规定不明确,政府与企业数据资源双向共享不够。
四是发展一哄而上,存在过度竞争倾向。截止2017年1月,全国37个省、市出台大数据发展规划,90%提出要统筹建设政府和行业数据中心,有12个省市提出建设面向全国的大数据产业中心,有14省(市)合计产值目标过2.8万亿元,远远超过工信部提出到2020年1万亿元大数据产值发展目标。
五是安全问题日益凸显。截至2017年7月,全国共侦破侵犯公民个人信息案件和黑客攻击破坏案件1800余起,抓获犯罪嫌疑人4800余名,查获窃取的各类公民个人信息500多亿条。乌克兰电力系统和伊朗核设施遭遇网络攻击,也给我国电力、石油、化工、铁路等重要信息系统安全敲响了警钟。
三、 更好实施我国国家大数据战略政策建议
按照十九大精神,要着力推动大数据与实体经济深度融合,建设数字中国和智慧社会,实现网络强国的目标,需要从政府、企业、社会组织和个人等统筹推动国家大数据战略落实。
(一)完善机制与制度,更好发挥政府作用。在体制机制方面,建议设立由国务院领导担任组长的国家大数据战略领导小组,负责组织领导、统筹协调全国大数据发展。领导小组下设办公室和大数据专家咨询委员会。
在法规建设方面,加快制定《大数据管理条例》,鼓励行业组织制定和发布《大数据挖掘公约》和《大数据职业操守公约》,在条件成熟时启动《数据法》立法,明确数据权属,培育大数据市场,加快数据作为生产要素规范流通。
在产业政策方面,出台数字经济优惠政策,创新数字经济监管模式,加强重点人群大数据应用能力培训,创造更多就业。
在试点示范方面,在环境治理、食品安全、市场监管、健康医疗、社保就业、教育文化、交通旅游、工业制造等领域开展大数据试点应用,以点带面提升大数据应用能力。
在资源共享方面,按照“逻辑统一、物理分散”原则,通过建设国家一体化大数据中心和国家互联网大数据平台,探索政府与企业数据资源双向共享机制。
在发展环境方面,着力部署下一代新基础设施,加快我国信息基础设施优化升级,制定政府大数据开发与利用的“负面清单”“权力清单”和“责任清单”,建立统计和评估指标体系,营造良好的舆论环境,防止炒作大数据概念,引导全国大数据健康有序发展。
在数据安全方面,加快落实《中华人民共和国网络安全法》,建立国家关键基础设施信息安全保护制度,明确监管机构的关键基础设施行业主管部门的信息安全监督管理职责,加快推动国产软硬件的应用推广,提升安全可控水平。
(二)对企业分类施策,发挥市场资源配置决定性作用。一是发挥互联网龙头企业引领和带动作用。网络、腾讯、阿里、京东为代表的龙头企业技术和人才储备雄厚,具有强大的数据资源收集、存储、计算和分析能力,成为我国大数据技术进步的主要推动力。应像使用电、水、交通等传统基础设施一样,互联网龙头企业向各行业提供高性能和低成本的大数据服务,帮助传统企业提升效率,提升核心竞争力。
二是发挥重要行业龙头企业数据和用户优势。我国电力、交通、金融等诸多行业龙头集聚了海量用户和数据,是未来我国大数据战略实施的主战场和大数据价值真正“钻石矿”。应发挥铁路、电力、金融等重要行业龙头企业优势,通过与互联网龙头企业深度合作,利用其技术优势,深度挖掘数据资源,提升自身核心竞争力,并帮助中小企业发展。
三是发挥通信运营商生力军作用,为大数据发展提供基础性战略性资源。我国移动、电信、联通等拥有全球最多的电话用户,积累了海量数据,是我国信息社会的战略性资源。应充分发挥自身在网络方面的优势,推动移动互联网、云计算、大数据、物联网等与行业结合,助力智慧城市、交通、能源、教育、医疗、制造、旅游等行业的创新和发展。
(三)激发社会组织活力,构建新型协作关系。构建政府和社会组织互动的信息采集、共享和应用协作机制,提高社会组织大数据应用意识和能力,与具有大数据技术的企业合作,提高社会事业精准化水平和资金使用效率。针对发展需要、重视科技引领,整合广大科研机构和事业单位力量,加强大数据基础理论、方法和技术研究,推动关键技术突破。
(四)提升公民数据意识和能力,推动“数字公民”建设。通过给每位公民一个数字身份,方便公民获取个性化、智慧化精准服务,提高政府公共服务的精准度与实效性,推动社会治理向精细化、智慧化转变。要提高公民数据素养,增强公民数据权利意识,提高大数据应用能力。
⑻ 大数据分析工具面临哪些挑战
大数据分析工具面临哪些挑战
在大数据时代,传统的智能BI和报表工具已经很难承担大数据的市场应用任务。新一代的大数据处理工具将取代传统的数据处理软件,并引领新时代的数据挖掘浪潮。那么,在信息时代背景下,大数据分析工具又将会面临哪些挑战呢?
数据搜集与兼容
数据的搜集与整合是数据处理的第一步,在数据源充足的情况下,如何更好更快的检索并搜集到足够的数据成为数据分析过程的关键。对于大数据分析工具来说,有时甚至要面对数十种格式的数据源或数据库,能否快速兼容就成了关键。
新时代的大数据分析工具必须拥有强大的数据兼容能力,包括对非结构化数据的处理。即使在数据量庞大而杂乱的情况下,大数据分析工具也要能快速反应,整合与甄别数据,为接下来的数据分析工作打好基础。
大数据坏境下的数据分析速率
数据分析效率直接反映大数据分析工具的性能优劣,新时代的大数据分析工具在面对海量数据时不仅要能快速分析、快速得出结果,还要能保证数据分析结果的准确与客观(基于数据)。而传统的数据分析工具因为软件设计架构的落后已难以胜任大数据分析工作。
传统的技术架构不能满足大数据分析工具的性能要求,在众多大数据解决方案中,国云数据开发的大数据魔镜采用新颖的“三层架构”模式,将大数据分析工具的功能选项做进一步细分,不得不说是一种大胆的尝试与创新。
数据分析方法的革新
与传统的数据处理流程相比,因为数据量的庞大和非结构化数据的增加,大数据分析工具必须具有更强的并行处理能力。以便查询、分解及数据分析进行分布式处理,将处理任务分配到不同的处理节点,提高数据处理深度与宽度。
在数据分析过程中,数据分析模型扮演着分析“路径”的角色。大数据分析工具必须内嵌有多种数据分析模型才能满足不同目的的数据分析需求。这个要求从技术层面上来说问题不大,关键是随着大数据应用范畴的拓展,大数据分析工具能否赶上市场需求的步伐。
数据可视化技术(末端展示)
数据可视化可谓是新时代数据分析工具必备的功能了。数据可视化就是将数据或者数据分析结果以图表的形式展示在各种平台上。这要求大数据分析工具有着强大的数据图表渲染功能,并且要内置丰富的可视化效果,以满足用户的不同展示需求。
除了末端展示的需要,数据可视化也是数据分析时不可或缺的一部分,即返回数据时的二次分析。大数据魔镜仅可视化效果就有数百种,能为客户提供完美的数据可视化解决方案,可见数据可视化技术已成为主流大数据分析工具的“标配”。
时代在变化中发展,科技在争议中进步。大数据分析工具作为重要的大数据应用技术而影响着未来大数据产业的发展,可谓举足轻重。但只要顺应时代发展和社会需求,大数据分析工具的前途还是一片明朗的。
⑼ 大数据面临的技术挑战
上周在大数据的趋势和特点中,说到了人类这次面临的问题不是问题无法解决,而是问题过于复杂。采用机械思维,其速度和效率已经赶不上新问题的产生。正是在这种分工越来越细,协作越来越紧密,问题越来越复杂的背景下,产生了大数据思维。大数据思维也由其独特的体量大、多样性和完备性,使得过去看来很复杂很难处理的问题变得可以解决了。
其实早在20世纪60年代就有研究学者提出采用人工智能的方法来解决社会问题。当时的人工智能方法还是局限于通过首先了解人类是如何产生智能,然后让计算机按照人的思路去做。吴军老师在《智能时代》中说到:“在人类发明的历史上,很多领域早期的尝试都是模仿人或者动物的行为,因为这是我们的直觉最容易想到的方法。” 但是经过十几年的发展,科学家们发现采用上面的思路去发展人工智能,似乎解决不了什么实际问题。很多科学家开始反思人工智能的发展,而在之后的20年左右的时间,在人工智能学术界的研究是处于低谷的。20世纪70年代,人类开始尝试智能的另一条发展道路,即采用数据驱动和超级计算的方法。即便在10年前,那时我还在念书,也曾接触过人工神经网络算法。很显然,当时对机器智能的概念大家都还是比较模糊的,人工智能也还没有被我们提高到现在的高度。
机器智能的概念在60多年就被提出来了,真正的突破却在具有了大数据的今天。为什么大数据的拐点会发生在今天?大数据到底面临何种技术挑战?
过去的10年,最容易看到的特征就是全球数据量呈爆炸式增长。大数据的第一个来源是电脑本身;第二个来源是传感器;第三个来源是将那些过去已经存在的、以非数字化形式储存的信息数字化。据2015年思科公司的统计数据显示,从2009~2015年的6年时间内,企业级数据增长了50倍。当然数据的爆炸式增长,离不开电脑硬件、软件、互联网、数据储存、数据处理等一系列配套技术的发展和支撑。大数据实际上是对计算机科学、电机工程、通信、应用数学和认知科学发展的一个综合考量。目前这些技术难题不一定有最佳的解决方案,甚至不存在什么绝对好的解决办法。
一、数据收集
传统的数据方法常常是先有一个目的,然后开始收集数据。比如,海王星的发现就是在人们发现天王星运动轨迹和牛顿力学预测出来的不一样之后,天文学家拍了很多星空的照片后发现的;心理学研究也是在有了一个明确的研究课题后,再通过实验的方法采集数据,如 “棉花糖测验”系列实验,以及关于认知失调的“追随者案例”等等。大数据则避免了采样之苦,因为大数据常常以全集(大数据的特征之一)作为样本集。
但是,如何收集到全集就是一件很有挑战的事情了。目前一些聪明公司,比如Google, Facebook, 网络,京东都是绕一个弯子,间接地去收集数据,然后利用数据的相关性,导出自己想要的结论。但是即便是这些如此成功的公司,仍然也有很多失败的案例。2010年,Google推出了自己的电视机顶盒Google TV,为了获取数据为进入电视广告做准备。但是,由于Google TV销售得很差,最终Google彻底地放弃了这产品。到目前为止,无论是Google过去的机顶盒,还是后来的Chromecast,苹果的Apple TV,除了统计一下收视率,计算一下可能的广告观众,并没有什么大的作为。数据收集是一个开放性的话题,不存在唯一性或最佳方法,目前仍然面临着很大的挑战。
二、数据储存
仅Google街景地图每天产生的数据量就有1TB,假如一份数据存三个拷贝,一年下来就1PB。即使使用当今最大容量的10TB硬盘,也需要用100个。因此,不能简单地依靠设备来解决数据储存的问题,而是需要技术解决方案来提高储存效率,保证不断产生出来的数据都能存得下。目前的数据储存手段主要是从如下2个方面考虑:去除数据冗余和便于使用。去除数据冗余可以简单理解为去除数据中的重复部分,比如同一份附件在所有的邮件中只储存一次。这样,在去除数据冗余的过程中,相应的数据读写处理就要改变。是否有比现在更有效率的储存格式或方式,仍然是大数据所面临的挑战。另外,便于使用的思路是从使用者的角度就去考虑数据的储存。大数据之前,数据在设计文件系统的数据储存格式时,主要考虑的是规模小、维度少的结构化数据。到了大数据时代,不仅数据量和维度都剧增,而且大数据在形式上也没有固定模式,因此需要重新设计通用、有效和便捷的数据表示方式和储存方式。
三、数据处理
大数据由于体量大、维度多,处理起来计算量巨大,其处理效率是一大技术挑战。并行计算是目前解决计算量巨大的重要手段,但仍然存在一些的问题。例如,任何一个问题总用一部分计算是无法并行计算的,这类计算占比越大,并行处理的效率就越低;再次,并行计算中无法保证每一个小任务的计算量是相同的,这样一来,并行计算的效率也会大打折扣,即完成了自己计算任务的服务器需要等待个别尚未完成的服务器,最终的计算速度取决于最后完成的子任务。
四、数据挖掘
如何从一堆杂乱无章的数据中挖掘出有价值的信息,是机器智能的关键,也是大数据的使命。数据在进行降噪处理之后,基本就可以直接使用了,接下来的关键一步就是机器学习。目前广泛使用的机器学习算法有人工神经网络算法、最大熵模型、逻辑自回归等。Google公司的AlphaGo的训练算法就是人工神经网络。机器学习的过程是一个不断迭代、不断进化的过程,只要事先定出一个目前,这些算法就会不断地优化模型,让它越来越接近真实的情况。寻找更优算法一直也是科学家们探索的难题。
五、数据安全
大数据应用的一个挑战还来自数据安全的担忧和对隐私的诉求。2014年爆出的索尼公司丢失数据时,造成的损失高达1亿美元。比商业数据丢失后损失更大的是医疗数据的被盗。在中国,除了在北京建立了大数据中心,还在贵阳建立了大数据灾备中心,而且正筹备在内蒙古再建立另一个数据灾备中心。而关于数据隐私,我想大家应该是深有感触,由于信息泄露而带来的骚扰电话以及电信诈骗,就发生在我们每个人身上。据《智能时代》中记载:“在美国的黑市上,一个医疗记录的卖家是商业数据的50倍左右”。可见,数据安全已然成为大数据发展的一大隐患和难题。
上述大数据5个方面的技术挑战并不是独立的,而是相辅相成、互相影响的。关于大数据的技术挑战在此仅谈谈个人的一点认识,希望对大家在这方面的思考有所帮助。下周我们继续聊,大数据给我们带来便利以及隐患。
⑽ 在当前大数据的新环境下it企业面临哪些机会与挑战
挑战一:数据来源错综复杂,丰富的数据源是大数据产业发展的前提。而我国数字化的数据资源总量远远低于美欧。
挑战二:数据挖掘分析模型建立,关于大数据分析,人们鼓吹其神奇价值的喧嚣声浪很高,却鲜见其实际运用得法的模式和方法。
挑战三:数据开放与隐私的权衡,目前我国一些部门和机构拥有大量数据但宁愿自己不用也不愿提供给有关部门共享,导致信息不完整或重复投资。
挑战四:大数据管理与决策,在今时今日的商业世界中,高管的决策仍然更多地依赖个人经验和直觉,而不是基于数据。
挑战五:大数据人才缺口,精通大数据技术的相关人才也成为一个大缺口。