A. 《大数据》这个期刊的质量怎么样,本人有一篇文章被录用,版面费要2700。作为学生觉得有点贵了。
你要是找的代理的话,不但贵,而且还有可能被骗,直接找杂志社,不会那么贵。
B. 算法推荐服务被戴“紧箍”,流量造假、控制热搜等有治了
算法推荐是把“双刃剑”
腾讯安全战略研究中心联合赛博研究院发布的《人工智能时代数字内容治理的机遇与挑战》报告显示,算法精准推荐已经占据信息流分发主导地位,算法能够实现数字内容聚合和精准推荐,快速匹配信息与人。基于算法的个性化内容推送在为用户提供精准化、个性化服务的同时,也带来了国家安全风险因素增高、不良信息泛滥风险增加以及传统权利保护难度加大等问题,已然成为一把“双刃剑”。
上海 财经 大学研究员崔丽丽表示,互联网平台作为消除信息不对称的先进技术代表,有责任维持技术手段的客观性,反映流量的自然状态,呈现真实的公众意见。不应该因为商业利益的驱使在流量上作假。过去曾发生过一些涉及到商业利益的新闻、信息被操控的情况,这样获取的商业利益是一种市场不公平的表现,甚至是不合法的。
提出算法“向善”新要求
根据征求意见稿,管理规定将适用于在境内应用算法推荐技术提供互联网信息服务的公司。这也意味着,以内容推荐算法为核心竞争力的短视频平台、UGC(用户生产内容)平台、推荐内容或是广告的电商和社交平台等主流互联网公司和平台的算法推荐技术都包含在此。
崔丽丽表示,不论是UGC还是PGC(专业生产内容)平台,内容的审核以及对于受众的推荐实际都有相应的规则,互联网信息平台已经在形态上取代了过去的传统媒体,因此,可能具备了一定的公共设施属性,所以信息的产生、审核和分发应该符合公允、客观以及符合事实等要求。
征求意见稿指出,算法推荐服务提供者应当坚持主流价值导向,优化算法推荐服务机制,积极传播正能量,促进算法应用“向上向善”。算法推荐服务提供者应当定期审核、评估、验证算法机制机理、模型、数据和应用结果等,不得设置诱导用户沉迷或者高额消费等违背公序良俗的算法模型。
王娟表示,征求意见稿对算法的主体价值导向、个人数据用途、行业自律等提出了算法“向善”的要求,提出了算法提供者备案责任,明确了算法推荐服务提供者作为落实算法安全的主体责任 ,还对算法推荐服务日志等信息提出了留存要求,留存期限不少于六个月,并在相关执法部门依法查询时予以提供,对回溯求证环节进行了加强。
征求意见稿明确,算法推荐服务提供者应落实算法安全主体责任,建立健全用户注册、信息发布审核、算法机制机理审核、安全评估监测、安全事件应急处置、数据安全保护和个人信息保护等管理制度,制定并公开算法推荐相关服务规则,配备与算法推荐服务规模相适应的专业人员和技术支撑。
从用户的角度来看,算法对数据的交互模式也提出了很多要求。征求意见稿提出,算法推荐服务提供者应当以显著方式告知用户其提供算法推荐服务的情况,并以适当方式公示算法推荐服务的基本原理、目的意图、运行机制等。同时,算法推荐服务提供者应当向用户提供选择、修改或者删除用于算法推荐服务的用户标签的功能,以及不针对其个人特征的选项,或者向用户提供便捷的关闭算法推荐服务的选项。
而对于大数据“杀熟”等顽疾,征求意见稿强调,算法推荐服务提供者向消费者销售商品或者提供服务的,应当保护消费者合法权益,不得根据消费者的偏好、交易习惯等特征,利用算法在交易价格等交易条件上实行不合理的差别待遇等违法行为。
网络热搜将被严管
近年来,网络热搜已经成为实时的舆情风向标和舆论的集散地,征求意见稿也特别对热搜作出了规范管理,明确算法推荐服务提供者应当加强算法推荐服务版面页面生态管理,建立完善人工干预和用户自主选择机制,在首页首屏、热搜、精选、榜单类、弹窗等重点环节积极呈现符合主流价值导向的信息内容。
王娟表示,征求意见稿对热搜、虚假流量可谓“重拳出击”,核心仍是围绕互联网不是法外之地,建立清朗网络空间、树立良好 社会 价值观,微博热搜榜等各类“带节奏”式资本叠加流量的运作模式将受到重大挑战。
面对外界的质疑,微博也在近日发布了热搜管理规则,并对“花钱买热搜”“花钱压热搜”等质疑回应称,热搜根据微博用户的真实行为进行计算,并根据搜索量、发博量、互动量等数据指标,形成实时榜单。榜单算法中包含了严格的排水军和反垃圾机制,以确保公正客观。同时上半年热搜还将“减少 娱乐 占比”作为主要调控目标。
C. 大数据时代哪7类人最赚钱
大数据时代哪7类人最赚钱
一个划时代新的技术和思维的兴起,它会驱动几乎所有的产业变革,大数据更是如此,通过几高笑年的观察和最近大量的基金公司朋友的接触,我从赚钱的角度对这个领域进行了分析。
第一类:对已经上市企业股票投资的基金公司
他们通过炒作概念在股票市场活动巨额回报。这些人分析发展趋势,把握大局,他们关心产业政策,关心市场空间,少关心具体运营能力和市场竞争格局。据了解,大数据概念股以 2010 年 6 月 1 日为原始起点,截至 2015 年 11 月 10 日,大数据概念指数变化区间在 [95%,1860%],一直以来强于上证指数,相对上证指数有很高的收益,这个相对收益是惊人的,最高时超额收益超过 15 倍。即使从 2012 年底开始的创业板指数,也跑弱于大数据概念指数,足见大数据概念相关个股具有较好的回报。相对高点时,大数据概念指数强于创业板指数 10 倍以上;从低点起来,大数据指数涨幅到最高点超过 18 倍,如此高的涨幅让许多人羡慕不已,相关个股精彩纷呈。投资这类的企业如拓而思,用友,东方国信、启明星辰、绿盟科技、恒生电子。
他们用最短的时间,研究股票,投资,获益,资本效率极高,一些高端的股票和投资者,他们会专门针对行业要求做培训,走访企业家走访客户。短时间内就可以赚的钵满盘满。
第二类:对大数据创业方向投资的 VC 和 PE 们
他们从最开始就投资有最高价值的大数据的企业,并从中发现商机,过去的几年只是一个开始,可以预见大数据行业未来十年仍然会是创业公司的机遇地。他们眼光超前,投资的估值不断高升;他们跟进投资,然后迅速推动企业发展,然后期待包装上市。这类企业如:集奥聚合、国双科技、华院数云、品友互动、易赞普、百分点科技、永洪科技、国云信禅数据、数据堂、数海科技等。投资资本如:宽带资本、红杉资本、IDG、创新工场、深圳创投、清科、软银中国,今日资本等。
第三类:创始人和联合创始人,企业越来越值钱
虽然有些企业死了,但是大部分还在受到资本追捧,创业者最苦逼,但是在资本催生产业变革的年代他们获益也是最多的,现在大数据企业的估值从几年前的几个亿到几十亿是翻了近十倍;企业老板的身价也是翻了近十倍,这类人笔者认识很多,因为比较涉密不一一列举。
第四类:讲课的人
行业内专家教授参加各种会议各种讲课,培训机构,在线教滑念尘育,还有专家学者备受亲来。笔者成立的大数据培训联盟、数据共享联盟等微信群,经常会收到邀请做讲课深有体会。
第五类:CDO 们,技术架构师们,大数据分析师们,获得长足的薪水提高第六类:一些媒体,自媒体
媒体版面改版,自媒体增多,受到关注的大数据自媒体如:大数据邦、大数据文摘、大数据参考、腾讯大数据、CSDN 大数据、36 大数据等。
第七类:他们没有赚钱,但是都在圈地,投入很大,未来会成为非常赚钱的企业
那就是免费数据,收费 api 的这些数据开放平台们;已经成功的如: Salesforce 23 亿美元的年收入中超过的一半的收入是通过 API 产生的。Google 每天通过 API 处理 50 亿笔交易,Twitter 每天通过 API 处理 130 亿笔交易,亚马逊每天通过 API 处理万亿笔交易,还没有成功的但是已经获得很好的发展的国内如:BAT、运营商、政府的数据开放平台,高德数据开放平台,数据交易市场 (数海科技、数据堂、聚合数据、九次方、美林数据等)。
数据之美在于流通,在于推动业务发展,在于提高用户体验,在于预测业务发展做好企业战略规划,在于集群众智慧、激活人员动力。利用数据推动商业变革才刚刚开始,做企业赚钱才是硬道理,先活下来,因为企业的大数据路还很长,变数也很多。盲目跟风,不可取!
D. 怎么分析新闻报道情况
亲亲您好,一、研究背景
2010年,“互联网之父”蒂姆·伯纳斯—李说了这样一句话:“Date-driven journalism is the future”(数据驱动新闻代表未来)这句话在当时被广泛传播,使“数据新闻”开始进入公众的视野。关于数据新闻的定义,目前在新闻传播届采用最多的依然出自欧洲新闻中心和开放知识基金会共同编写的《数据新闻手册》中的表述:“与其他类型的新闻区别或许在于将传统的新闻敏感和使用数字信息讲述一则好故事的能力相结合而带来新的可能性,数据新闻能够帮助记者使用数据图表讲述一个错综复杂的故事。”[1]一些国内学者根据自己的理解,也对“数据新闻”下了定义:“数据新闻是以数据为中心,密切围绕数据来组织报道,同时与数据相关的各种技术在新闻生产中都被赋予了重要地位。”[2]结合上述两种对“数据新闻”的解释,我们认为:“数据新闻”就是在新闻报道中,以数据作为支撑整个新闻报道的核心论据,围绕数据进行信息的采集、整理、分析与呈现工作,最终形成的新闻报道。数据新闻的本质不仅是对数据的呈现,而更在于挖掘数据背后隐藏的意义与价值。
现代体育离不开数据,体育竞赛过程中会产生大量的数据,数据永远都是体育赛事的核心。不论是奥运会、世界杯或是各种职业联赛,其比赛的最终结果都可以通过数据表现出来,而运动员的表现同样可以通过数据得以呈现。因此,体育媒体行业的工作人员想要报道好体育新闻,必然需要和各种数据打交道,数据显然对于体育媒体人来说相较于其他行业更具重要性。如今在大数据时代下,体育新闻人同样可以凭借大数据技术,来挖掘体育赛事数据,形成生动、有深度的新闻报道,大数据技术为体育新闻生产注入新动力。
二、研究目的
(一)了解目前我国网络媒体对体育数据新闻的应用现状
相较于传统媒体,我国网络媒体较早开始了数据新闻实践,并表现出专门频道为主,专题报道为辅的运行模式。而传统媒体方面,虽然也在数据新闻方面有过一些尝试,但由于自身条件的限制,使得数据新闻在传统媒体上总是难以施展拳脚。比如,电视媒体在制作数据新闻时会受到播出时间的限制,纸媒则由于版面容量的问题限制数据新闻的刊载。而其在网络媒体上则不会受到版面和时间的限制,这就导致传统媒体的数据新闻在数量和质量上都无法与网络媒体相比。所以本文选取了两家网络媒体——《新浪体育》与《肆客足球》作为研究的主体,将这两家网媒在俄罗斯世界杯期间制作的数据新闻为研究样本,来探析目前我国网媒对体育数据新闻的应用现状。
(二)研究当下我国网媒在制作体育数据新闻时存在的问题并提出对策
本文通过对俄罗斯世界杯期间《新浪体育》与《肆客足球》制作的130篇体育数据新闻进行全样本内容分析,发现并分析当下网媒上的体育数据新闻在制作和传播应用中存在的问题,在借鉴西方主流媒体发展经验的基础上,结合我国的国情,为国内体育数据新闻的报道提供可借鉴策略。
三、研究结果以及问题分析
(一)新闻选题全面多样、特色鲜明,但预测类新闻相对较少
本文将选题角度划分为六种类型,分别是:预测、赛后、回顾、场外、专题以及人物。随后将全部130篇体育数据新闻按照这六个类目进行统计整理,在俄罗斯世界杯期间,《新浪体育》和《肆客足球》制作发表的体育数据新闻,在六个类型的选题方面都有涉及,其中专题类新闻最多共有34篇,占总体样本的26%左右;而预测类新闻最少,只有11篇,占总体样本的9%左右。通过以上数据我们发现,目前网媒制作的体育数据新闻选题覆盖比较全面,且结合自身特色的专题类报道成为了数据新闻的“主力军”,但同时又比较缺乏对预测类新闻的制作。
(二)体育数据新闻内容以文字叙述为主,可视化设计水平参差不齐
本文将选取的体育数据新闻内容划分为两种类型,即非可视化数据新闻和可视化数据新闻。再将非可视化数据新闻分为纯文字和图文两种,将可视化数据新闻分为图表、视频、H5三种。经过统计整理发现:在俄罗斯世界杯期间,《新浪体育》与《肆客足球》发表的体育数据新闻在内容上主要以文字叙述数据的方式为主,共有67篇;在可视化数据新闻作品中,主要以H5形式的作品为主,共有32篇,占可视化数据新闻的51%;而视频类数据新闻较少,只占可视化数据新闻的5%左右。经过分析,发现目前网媒对体育数据新闻的报道内容多以文字叙述为主,依然处于数据新闻制作的早期形态;在数据可视化制作方面,多爱采用H5的方式制作数据新闻,同时也存在一些以各类数据图表为内容的可视化作品。另外视频数据新闻制作水平较低,多为动图配字幕的形式,所以目前的体育数据新闻可视化水平有待进一步发展。
(三)体育数据新闻的数据来源多样,但通过自己挖掘的数据较少
本文将选取的130篇数据新闻的数据来源进行统计,发现目前我国网媒在制作数据新闻时采集的数据主要来源于四个方面:一、自己挖掘;二、专业数据机构(主要为一些国外数据机构如:OPTA、Transfer Market、Squawka);三、官方网站(国际足联官网、机构官网、足协官网、维基网络);四、外媒。经过统计整理发现:《新浪体育》与《肆客足球》在制作数据新闻使所采用的数据来源具有多样化的特点。这其中共69篇新闻的数据来自官方网站,占总体样本的53%左右;而利用通过自己的工作人员挖掘整理的数据进行报道的新闻只有15篇,占总体样本的11%。经过分析发现,目前我国网媒获取数据的渠道较多,说明大数据时代数据的开放程度变得越来越高;另一方面,目前我国网媒的数据新闻制作者应提高大数据挖掘技术,进一步提升自主生产、挖掘数据新闻的水平。
四、研究结论及建议
数据新闻起于西方、兴于西方,《卫报》是最早践行数据新闻的西方主流媒体,其制作的数据新闻获得业界高度赞誉。根据本研究对我国网媒应用体育数据新闻的现状分析,同时借鉴英国《卫报》在体育数据新闻方面的成功案例,可以得出以下研究结论及建议
(一)提高预测类数据新闻比重,发挥数据新闻价值优势
通过对我国网媒体育数据新闻应用现状的分析,发现目前我国网媒制作的体育数据新闻虽然题材多样,生产效率较高,但仍然缺乏一些具有深度的新闻报道。作为一名数据新闻记者,一定要有高水准的数据素养,具备敏锐的数据感知和分析能力,要能够在大数据的海洋中捕捞出最具新闻价值的数据信息,深挖数据背后所隐藏的故事,最终拟成有价值的选题呈现给受众,这样才能够使复杂的数据发挥出最大的价值。
如要改变现状,一方面,新闻机构要对自己的数据新闻记者组织培训,邀请业界富有能力、经验的数据新闻记者来为自己的数据新闻团队授业解惑;另一方面,高校作为培养国家人才的大熔炉,也必须设立专门的数据新闻课程,来为社会培养具备高水准数据素养的新闻人才。虽然目前国内于2013年开始,也有几家高校开辟了数据新闻专业,毕竟还处于探索阶段,且培养出来的人才数量有限,还远远不能满足社会的需要。
(二)提高数据可视化制作水平
通过对我国网媒体育数据新闻应用现状的分析,发现目前我国网媒制作的体育数据新闻的可视化设计水平有待提高。“可视化”(visualization),来源于“visual”,原意是“视觉的”、“形象的”。事实上,将任何抽象的事物、过程变成图形、图像的表示都可以称为可视化[1]。
提高数据可视化呈现水平,首先,媒体需要在自己的数据新闻团队里组建一个得力的视觉团队。记者在将数据信息进行可视化处理时,需要兼备新闻、技术与艺术素养的专业人员来做视觉专业的工作。一个相对完整的视觉团队大致包括选题策划、文字摄影摄像记者、数据编辑、美术设计、电脑制图、版面编辑和网页设计等层面的人员。
其次,在设计环节要对数据可视化工作有高要求。《卫报》“数据博客”前主编西蒙·罗杰斯曾说:“对好图表的追求,就像是要更多的阳光和免费巧克力。”数据新闻的可视化绝不是随意的将数据以图表的形式展现,在数据可视化的制作中还需要将图表进行美化,使可视化效果尽可能的贴合视觉感受,只有经过这样严苛地工作过程,才能为受众带来更好的阅读体验,良好的阅读体验是数据新闻生存的根本。
(三)搭建属于自己的高水平数据库
经过分析发现,目前我国的网络媒体基本没有建立属于自己的数据库,在制作数据新闻时,主要依靠两种渠道:一种是通过记者在网上查找搜寻数据;一种是花钱从专业的数据公司购买数据。如此现状,可能导致媒体人在制作数据新闻时受到数据开放程度的限制,而无法制作优质的数据新闻作品。数据新闻又称“数据驱动新闻”,因此必须要有高水平的数据库做支撑,才能保障数据新闻的质量。建立数据库同样有两种途径:一种是采集公共数据,主要是来自社会权威渠道的一些公开数据源;另一种是媒体自身的数据资料库,是媒体在长期的新闻报道中积累起来的新闻素材和数据信息。基于这些渠道,我们便可以建立起一个高质量、结构化的专业数据库,为数据新闻报道打下良好的基础。
从整体来看,我国的体育数据新闻在俄罗斯世界杯报道中的应用尚处于探索发展阶段,存在不少问题。数据新闻作为时代的产物,必然具有先进性,这种新型的新闻报道模式在我国拥有广阔的应用前景,值得学者、媒体对其进行研究。在今后的发展中,我国的体育新闻媒体需要改进数据新闻制作模式与方法,以追求更高质量的数据新闻作品。另一方面,更应将数据人才培养放在首位。只有人才队伍的壮大,才能够最终使我国的体育数据新闻获得强大的生命力,实现永续发展,实现追赶超越。
E. 关于大数据的五大谬见
关于大数据的五大谬见
近期,有关大数据的新闻占据着各大媒体科技报道的主要版面。但是,有许多文章似乎华而不实,一些报道鼓吹大数据是能够解决一切问题的解决方案,如它能进行入侵检测、预防诈骗、治疗癌症,甚至还能设置最优的产品价格。
但是,业界定义的大数据是指迅速收集的、各种各样的、大量的数据集合,而不是能够处理一切问题的万能解决方案。在现实中,如果一些企业偏信这些与大数据相关的谬见,那么这些企业很可能会偏离正轨,走向错误的发展方向,浪费大量的时间和金钱,丧失其在市场上有利的竞争地位,还可能损害企业的声誉。
此篇文章就讲述了业界常出现的有关大数据五大谬见。
1. 只有数据科学家才能处理大数据
事实上,在处理大数据时,光靠数据科学家是远远不够的。
“如果你不能首先确定到底需要什么样的信息的话,那么单凭数据科学家自己是不可能成功地从大数据中提取有用信息的”,宾夕法尼亚大学医院(Penn Medicine)数据分析部门高级主管Pat Farrell说:“你还需要熟悉业界动态、掌握相关领域知识的人才,他们知道问题的所在,也了解什么样的解决方案对于你所从事的领域最有价值。”
例如,在宾夕法尼亚大学医院有两个系统,一个是医疗系统,一个是医学院系统。长期以来,医疗系统通常从一个数据仓库中收集临床医疗数据。与此同时,在医学院系统中,出现了一个新的技术,可以实现对人类基金组的排序,并产生了大量的数据。
Farrell说:“我们知道这些数据一定存在着某些价值,而我们最终也有了能够获取这些价值的计算能力。我们将专业的医疗知识与数据分析技术相结合,为预测医疗开拓了一片新的、更广阔的领域。”
2. 数据越大,价值越大
收集数据,并把它储存起来再登记入册,这会花费许多时间、占用很多资源。如果企业或机构在收集数据时不加选择、任意地收集大量数据,那么很可能会造成大量的资源浪费,而这些资源完全可以用到更有价值的项目上去。
Farrell建议企业在收集数据之前一定要有一个具体的目标,或关键性能指标,要明确自己需要什么样的数据,再去有目的地收集数据。
Farrell说:“你需要从你收集的数据中提取有价值的信息,但这并不代表你收集的数据越多,你所获得的价值越大。”
3.大数据用于大企业
大企业或许会有更多的内部数据来源,他们可以利用这些数据获取对自身企业发展有价值的东西。但这并不代表大数据只用于大企业,小企业也能够收集来自社交媒体平台、政府机构和数据供应商的数据,并从这些数据中提取有利信息。
戴尔软件信息管理解决方案部门的产品管理高级总监Darin Bartik说:“对于企业来说,不管它的规模有多大,利用数据分析制定的决策总比单纯依靠直觉或第六感制定的决策要好得多,且更加可靠。”
小企业虽然不像大企业那样经常利用数据分析来制定决策,但是当这些小企业真正这样做的时候,它们会使公司走向快速、正确的发展轨道。
Darin Bartik说:“小企业可以利用其最佳实践,进一步推动数据分析决策在企业中的发展,以此赶超或者胜过那些强大的竞争对手。”
4. 收集数据后不及时整理分类
位于美国旧金山的云计算商业智能供应商Birst的首席执行官Brad Peters表示,虽然数据存储的成本越来越低,但它并不是免费的。然而,对于许多大公司来说,它们对于数据欲望的增长速度要比数据存储成本降低的速度快得多。
许多企业往往在收集完数据之后,并不迅速处理这些数据,造成数据存储成本增加。Brad Peters说:“我发现很多大的企业或机构收集了一大堆数据之后却不及时处理这些数据,导致他们在这些数据上的开支逐渐增大,而他们也并没有从这些数据中获取任何价值。”
事实上,企业中的一些数据集已经开始造成了企业的收益递减。这种现象就像通过分析选民数据信息来预测选举结果一样,在预测过程中,你需要一定数量的选民作为样本,但是如果样本数量超过一个临界点之后,无论增加多少选民,对于预测结果不会有任何太大的影响。也就是说,样本数量过多,所花费的成本也就越多,但对于目标没有任何实质性的价值。
“数据冗余的话,企业支出的不仅仅是存储成本,还会面临许多其他的问题”, Recommind公司信息治理和大数据管理全球主管Dean Gonsowski说。比如,如果数据泄露的话,那么公司也会承担相应的损失。Recommind是一家位于美国旧金山的专注于非结构化数据分析的公司。
最终,数据越多,那么分类整理数据所需要的时间也就越多。Dean Gonsowski说:“当数据仓库的规模达到数十亿条记录时,那么光是检索数据就需要花上几个小时,甚至是几个星期。这时候,这些信息非但不会给企业带来商业价值,反而会阻碍企业系统的运转,因为这些系统根本不能处理这么大信息量。”
5. 所有数据都是一样的
美国佛吉尼亚州曾收集过在过去20年里学生的注册信息、奖学金,以及学位授予情况的数据,但这并不意味着20年前收集的与之存储在同一个数据域里的数据就一定是相同的数据。
佛吉尼亚州高等教育委员会的政策研究和数据仓库部门的主管Tod Massa说:“由于数据都存储在一个数据仓库里,这导致研究人员认为这些数据都是等同的,而这正是我需要处理的一个最大的问题。我们收集的ACT(American College Test,美国大学入学考试)和SAT(Scholastic Assessment Test,学术能力评估测试)的学生成绩,最初我们收集的只是整个佛吉尼亚州的学生成绩,但这导致我们的调查研究出现一个缺口,所以后来我们不仅收集了佛吉尼亚州的数据,还收集了其他州学生的数据。而且,不同种族在K-12级和高等教育的数据也不同。”
事实上,任何特定的数据,如果由不同的组织机构,或在不同的时间内,或由不同的人发布的话,也有所不同。Tod Massa说:“假如收集数据的这家公司或机构是完全孤立或与世隔绝的,那么情况可能会不一样。但我认为,随着时间的推移,它们收集的数据也会有所变化。”
因此,数据分析人员不仅要有数据统计的技能,还要掌握一定的数据知识,并清楚地了解相关行业内的动向和整体发展趋势。
这一点也同样适用于从外部数据源收集的数据,过去的那种数据收集和分析的方式已经完全改变了。能够了解不同的数据文化背景和数据环境,对于充分利用这些数据是非常必要的。
F. 如何将大数据进行到底
如何将大数据进行到底
“大数据”这个词可以说是已经完全把“云计算”的风头盖了下去,现在各种行业会议仿佛不提大数据就跟不上时代。而Gartner近日有报告显示,虽然全球范围内各大企业用户都加强了对大数据(Big Data)业务的投资力度,但有6成企业对大数据投资额的回报产生质疑。是什么原因让企业对这个趋之若鹜的技术产生了怀疑?
60%企业认为谈回报拍丛率为时尚早
Gartner报告显示,2012年全球各大企业用于大数据业务的投资总额达到43亿美元,其中绝大部分投资是针对公司服务器上运行的软件。预计2013年期间,这个投资总额将增至340亿美元。
但是,尽管企业加大了对大数据业务的投资,大部分企业未能确信这些投资将有良好回报。通过对800多名商业和IT主管的调查显示,60%的受访者表示,目前判断大数据投资能够带来良好回报还为时过早。
大数据光鲜背后
什么是大数据?到现在对于 “大数据”还没有标准的定义。维基网络上有人对大数据作了如下描述:数据增长如此之快,以至于难以使用现有的数据库管理工具来驾驭,困难存在于数据的获取,存储,搜索,共享,分析和可视化等方面。
作为未来发展的必然趋势,毫无疑问大数据对于企业有着极为深远的意义。近两年来,包括IBM、惠普等在内的存储厂商在追捧“大数据”的概念,他们提出除了为客户提供基础的存储解决方案外,还向企业推广一袭高樱系列针对“大数据”的分析解决方案,挖掘数据背后的价值。
但在各种文章铺天盖地描述大数据的美好前景的同时,却鲜有大数据项目实念悄施的实际效果的相关报道。
能够引起企业对回报率的质疑,首先我们必须看到的是,“回报率”在有些行业并不是显而易见。在金融服务领域,大数据能够促使服务更好、更有效,从而实现更有利的经营策略。媒体公司可以销售更多的广告版面。电子商务公司可卖出更多产品。
但是这些公司拥有一般企业经营公司不具备的一个共同点:投资回报率显而易见,足以使这些公司排除进入障碍进入大数据领域。而对于大多数企业,大数据是否具有足够的吸引力?很可能不会。大数据价值必须非常高、便宜而且足够成熟,才能吸引企业购买。
如何将大数据进行到底
有业内人士指出,制约大数据发展的因素主要有两个:第一,能够发掘大数据的技术还没有成熟;第二,成本太高。做大数据的时候,存储应该非常便宜,虽然存储比很多年前便宜很多,但还是很高。
非结构数据的快速增长加大了数据处理的难度。同时,许多公司仍处于大数据的研发阶段。也因此,在很多企业内心增加了很多不确定性。大数据技术必须更加容易,项目管理技能更广泛,大数据方可真正成为主流。
从具体技术上来看,数据投资回报是数据价值除以数据成本,首先,我们需要降低数据成本,提升数据价值。降低数据成本的方法很多,最重要的是把低活跃度的数据转移到低成本的存贮器上去。而增加数据的价值则要收集更多、更全面的数据,最近比较火的社交化软件正可以在此发挥作用。其次,要针对数据质量有一个数据治理的队伍和流程。最后,要有很好的数据分析的能力,“数据可视化”是当前的大趋势。