① 为破局而生,情报分析师决胜大数据
大数据时代,谁拥有数据,谁也就拥有财富。
数据服务产业的发展,提高数据的应用水平,所离不开的关键核心都是专业的情报分析师。
通常所说的大数据分为三种,企业数据、公权机构数据和开源网络数据。前两种可供挖掘和应用的价值有限,目前世界上各国所重视的都是开源网络数据。
挖掘大数据价值,获取目标对象(人物、事件、机构、项目等)精确可靠的信息,需要经由情报分析师充分利用自身的技术、方法、经验和手段,建立和理清调查任务内在的逻辑关系,通过综合研判,才能从纷繁冗余的数据中找出价值。
大数据是座挖不完的“钻石矿”,随着科学技术的发展,每个人的生活都与大数据息息相关,同时随着国家政策对于大数据等前沿技术的愈发重视,大数据行业已逐步形成了一个万亿级别的市场。
截至2018年底,致力于打造“中国数谷”的贵州省会贵阳正推动大数据与相关领域深度融合,全国人大代表、贵阳市市长陈晏表示,贵阳建成大数据产业园10个,大数据企业1632家,全年企业主营业务收入1000亿元人民币。在推动大数据与实体经济、社会治理等方面,贵阳市“融”出了新动能、新前景、新生活、新效率。贵阳市政府数据已实现100%共享交换,向社会免费开放618余万条数据。
基于大数据对各个行业的深入影响,近几年,美国、欧盟、日本等主要发达经济体都积极推进各自的大数据战略。2009年,美国科学家委员会(NSTC)就发布了《开发数字数据的威力》报告,初步提出发展大数据的框架,奥巴马政府亦对大数据行业大力支持,帮助美国取得世界领先地位。参考《大数据白皮书(2016)》,2016年全球大数据核心产业规模约为300亿美元,预计2020年有望达到近600亿美元。
中国亦将大数据视为新经济的重要支撑。2014年“大数据”首次出现在《政府工作报告》,奠定了行业快速发展的政策基础。2017 年,工信部印发了《大数据产业发展规划(2016-2020 年)》,全面部署“十三五”时期大数据产业发展工作。发改委、工信部及农业部、运输部等部委先后颁布相关后续政策,推动大数据产业发展。预计未来将有更多部门出台相应具体政策,推动大数据行业的发展。
根据中国信通院数据显示,2017年中国大数据产业规模(包括数据资源建设、大数据软硬件产品的开发、销售和租赁活动,以及相关信息技术服务)为4700亿元人民币,同比增长30%,且预计2020年这一规模有望赶超1万亿,年均复合增速近30%。其中,大数据核心产业规模2017年为234亿元,同比增长39%,预计2018年为329亿元。
目前中国金融数据体量位居全球第一,其中金融行业数据量是数据的重要贡献和使用机构,互联网金融占据相当大的比重,活跃的交易账户和交易事项为金融领域贡献了大量可供挖掘的有价数据。
受互联网金融的影响,金融行业大数据也迎来了迅速发展,大数据在金融行业正实现全面普及应用。大数据在金融行业的应用,除了传统的风险管理、运营管理及业务创新外,近年金融行业大数据应用呈现新的趋势,主要包括高频金融交易、小额信贷、P2P放款审核、客户管理、精准营销等。
随着大数据发展和应用的持续推进,未来金融大数据行业中的机构和企业将围绕建立新的金融环境而竞争,主要表现在围绕生态圈、战略和产品三个层面的竞争,并由此确定金融行业企业的市场地位及竞争力。因此,金融机构、互联网企业都不会局限于某一个层面的发展,更倾向于多维度、多层面的布局。
此外,A股上市公司在大数据产业的各个领域布局广泛,目前A股大数据概念板块中,有118个标的,但是在各个子版块中有较强变现能力的龙头企业的数量却很少,对于一些概念炒作,没有核心技术能力的公司,很容易因为一些市场环境的变化,产生大幅下跌,让投资者蒙受损失。
由此可见,大数据进一步发展急切需要综合解决方案提供商,专注于利用当代最先进的IT技术推动企业和政府部门在管理和商业模式上的创新发展,提供综合解决方案,包括运营支撑、大数据、移动互联网解决方案等。最终形成电信+政府+金融的大数据全面布局。
内生外延布局金融大数据,业务协同发展。在公共安全、运营商等传统大数据业务将大数据平台和应用技术研发落地,继而可将经验快速复制到金融、农业等其他领域。形成强协同效用。
大数据是未来的发展趋势,现今人人也都可以谈一点大数据,任何行业都可以直接间接的与大数据相关联,但是真正专业应用大数据技术的公司却也屈指可数,更难辨别出真正具有大数据业务变现能力的企业。
身处信息爆炸的时代,要想透过大数据去发现背后的真相,也并不是一件易事。
术业有专攻,作为企业方需要有意识培养大数据技术和情报分析师等专业人才,而作为个人也要有意识培养情报分析师思维,如此才能真正将大数据为己所用,如此也才能在未来市场的角逐中不被淘汰出局。
未来,每一个人都离不开对于数据的分析。
② 曝美驻华使馆过度采集中方雇员信息,数据或供给美国情报,美方有何目的
美国驻他国的大使馆,从来都不单纯只是双方外交关系的纽带。它更像是美国以合法的方式、楔进他国的最大的一颗钉子,而这颗钉子的用途,绝对与和平无关。
据了解,美国驻华大使馆存在过度采集中方雇员信息的违法行为,且这些非法采集的数据,或提供给美国情报部门。报道提到,中国雇员对此敢怒不敢言。
在信息方面,美国对俄罗斯有着碾压式的优势。这种现象应该引起我们的重视了,我们芯片不行,我们更应该注重个人信息安全的保护。
③ 大数据时代网络舆情管理变革探讨
大数据时代网络舆情管理变革探讨
大数据时代的到来对人类的生活、工作与思维产生变革性影响,深刻改变着商业王国及公共管理等各个领域的面貌,“大数据”日渐成为各行业创新的助推器。当前中国网络舆情环境复杂,网络舆情危机时有发生,社会热点舆情事件和涉官涉政舆情事件不断涌现,造成社会民主生活和政治稳定间的不平衡等诸多影响。大数据背景下的网络舆情正在发生巨大的变化,网络舆情管理变得日益复杂和重要,如何抓住大数据时代为网络舆情管理变革带来的机遇,以“大数据观”变革传统网络舆情管理思维,准确把握网络舆情的内在特征及其在演变过程中的潜在规律,实现网络舆情管理在思维、模式以及技术上的创新,对于新形势下做好网络舆情引导工作,加强和改进网络内容建设,具有重要的理论意义和实践价值。
一、大数据时代必然要求网络舆情管理变革
“大数据”概念最早在20世纪80年代提出,2011年麦肯锡咨询公司发布其研究成果《大数据:下一个创新、竞争和生产率的前沿》,使这个概念得以大范围推广。2012年3月29日,奥巴马宣布将投入2亿多美元启动“大数据发展和研究计划(Big Data Research and Development Initiative)”,将“大数据战略”上升为国家战略。近两年,大数据备受学术界、产业界和政府部门的关注,成为国内外强有力的前沿词汇。大数据又称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过目前主流软件工具在合理时间内进行抓取、管理和处理的数据集合,是必须通过深度挖掘、计算、分析才能创造价值的海量信息。大数据在体量、复杂性、产生速度及价值密度四个方面都极大地超越了传统的数据形态,具有4V特征:大量(Volume)、多样(Variety)、高速(Velocity)、价值(Value)。数量庞大的网民通过论坛、微博、微信等多种途径方便快捷地发表言论观点,网络舆情的规模和复杂性急速上升,体量巨大而价值密度低,其内在特征的变化必然要求实现网络舆情管理的变革以适应大数据时代的发展,这些要求主要体现在四个“转向”上。
(一)从监测转向预测。大数据的核心和目标就是预测。复杂网络的研究专家巴拉巴西认为,“93%的人类行为是可以预测的,当我们将生活数字化、公式化以及模型化的时候,我们会发现其实大家都非常相似。生活如此抵触随机运动,渴望朝更安全、更规则的方向发展,人类行为看上去很随意、很偶然,却极其容易被预测”[1]。例如,亚马逊可以推荐我们想要的图书,淘宝知道我们的喜好,而人人网可以猜出我们认识谁。传统网络舆情管理把监测已经产生的舆情信息作为起点,这种明显的滞后性使其在网络舆情危机的应对中处于消极被动的位置。而目前留给突发事件的处理时间越来越少,从传统的“黄金24小时”变为“黄金4小时”,如此短的时间使舆情分析和决策尚未来得及参与进来,整个事件就已经造成了爆炸性的效果。在大数据时代,通过挖掘数据相关性,把数学算法运用到海量的数据上进行分析,在敏感消息进行网络传播的初期就提前开始监测,然后建立模型,模拟仿真网络舆情的演变过程,使网络舆情突发事件发生的可能性和倾向性变得可以预测。
(二)从节点转向网络。由监测舆情转向预测舆情的目标实现,最关键的大数据技术就是挖掘数据的相关性。在小数据时代,由于受到数据库和计算分析能力的限制,无论是对于因果关系还是相关关系的追寻,都耗资耗时,并且易受传统的思维模式和特定领域隐含的固有偏见的影响,无法保证舆情分析结果的准确性。因此传统的网络舆情管理只注重舆情内容的监测,通过分析单个数据节点,如网民“说什么”来抓住比较浅层的社会语义表达。大数据则在保留了原始数据的同时,记录了网民“为什么这么说”背后的社会心理和社会关系网。按照大数据思维,每一个数据都是一个节点,可无限次地与其他关联数据形成舆情链上的乘法效应——类似微博裂变传播路径,数据裂变式的关联状态蕴含着无限可能性[2]。通过对海量信息的解构与重构,充分整合政府和企业的数据资产,利用一系列飞速发展的新技术和新工具,描绘、测量、计算各节点之间的关系,深度挖掘数据的相关性,以此排除偏见和视觉盲点,掌握易被忽略的社会动态,预测舆情的发展趋势。因此大数据时代必然要求网络舆情管理变革其监测系统,由节点转向网络,把握相关性,进而分析舆情背后的社会互动,乃至网络族群之间的界限和相互勾连。
(三)从定性转向定量。舆情分析师或解读者从自身经验和视角出发,在传统网络舆情管理的过程中进行定性分析时,必然使其分析结果带有个人价值与理念的主观印记,甚至不同的舆情机构对同一舆情事件会得出相悖的结论。在大数据时代,所有元数据都可通过量化关联转化为有价值的信息,并实现多次利用,每一次利用都是一种创新,大数据成为网络舆情定量管理的力量源泉。尽管数据的相关性决定了某些数据价值的潜藏性,但新技术、新软件的出现使得通过数学分析实现数据的价值转化变为可能。而多维解读舆情和新的深刻洞见的揭示,使舆情分析结果的全面性和客观性大大超越传统的网络舆情管理。但数据的量化并不等同于简单的“数字化”,而是数据的可计算化,舍恩伯格将其称之为“数据化”,是指一种把现象转变为可制表分析的量化形式的过程[3]。“数据化”使态度和情绪转变为一种可以分析的形式,网络舆情的相关信息得以进行深入分析,一些社交媒体如Facebook、Twitter、QQ、微博、微信等坐拥大型数据的宝藏,一旦实现对其自身数据库的深度利用,就能轻易获得社会各个领域和所有用户的几乎全部动态信息。
(四)从样本转向全体。在传统的网络舆情工作模式中,所采集的舆情关联数据仅为样本信息,构建的数据库结构单一、数据量有限。其数据源一般是基于抽样或者针对重点网络站点进行的数据抓取,仅能对小规模、有结构或类结构的数据进行分析,标准不一,难以在不同领域中通用。同时,样本分析并不能保证结果的准确,即使分析方法和操作没有问题,但采样过程的任何偏误都将使舆情分析结果与事实相去甚远。大数据体量巨大,从TB级别跃升至PB乃至ZB级别,完整记录了社情民意,成为人类生存痕迹和心理变化的记录仪。采样的目的是以尽可能少的数据获得尽可能多的信息,但大数据是建立在掌握所有数据,至少是海量数据的基础上的,在数据处理技术日新月异的今天,变革传统舆情管理思维与方法,改变采样的惯性行动成为必要。通过运用大数据技术,建立网络舆情自动分析系统,全天候自动搜索并采集与目标舆情看似毫不相关实则具有内在关联的信息,在抓取和收集页面之后,对信息自动分类、自动获取关键词、自动内容分析和自动报警等。样本扩大至几乎全体,舆情分析的结果更加客观可靠。
二、大数据时代网络舆情管理变革的效应前瞻
抓住大数据时代变革网络舆情管理的新机遇,迎接大数据时代网络舆情管理的新挑战,顺应大数据时代网络舆情管理的新要求,变革与创新网络舆情管理将会产生良好的管理效应,实现新时期网络舆情管理的升级转型。
(一)实现“防火”式管理。传统的网络舆情管理因为无法把握数据相关性,不能准确预测舆情未来的发展趋势,因此采用的是“灭火”式管理模式。政府通常在舆情产生或者已形成舆情危机的情况下才开始采取措施,如发布信息、引导舆情、满足诉求等,以此达到“灭火”效果。在此种模式下,政府经常被动陷入网络舆情漩涡,由此形成视网络舆情为“敌情”的偏见。为了摆脱这一困境,政府总是试图“控制”、“引导”和“应对”网络舆情,以一种上位者的姿态去支配、主宰网民及其舆情表达的方式。然而,若网民在网络舆情中的主体地位得不到保证,网络舆情就会失去其“减压阀”的功能,网络舆情问题将会是治标不治本。大数据时代,政府转变网络舆情管理思路,变革网络舆情管理模式,应用大数据技术对网络舆情进行关联分析、级别划分、聚类分析和倾向性分析,将实现“灭火”式管理到“防火”式管理的转变。通过寻找“导火索”与“减压阀”之间的平衡点,在发挥网络“民间舆论场”作用的同时,将网络舆情危机扼杀在摇篮里。例如美国中央情报局通过抓取海量数据来追踪恐怖分子和监控社会情绪,在“阿拉伯之春”中,通过大数据分析多少人和哪些人的立场从温和变为激进,并“算出”谁有可能会采取有害行为。
(二)打捞“沉没的声音”。大数据源于互联网的分享、开放,但“数字鸿沟”的存在却使“信息穷人”与网络隔绝。尽管互联网的发展使这一部分人的比例越来越低,但发展不均衡性的扩大意味着现在和将来仍然有一个不容忽视的群体将无法提供任何数据。即使是那些能够充分利用网络的人群,也有可能因为在某种情境下成为舆论中的弱势群体,或者因其在舆情主流中的异质思维而选择不在网络上发声。当然,这种选择既可能是主动也可能是被动的。正如美国哲学家埃里克·霍弗所言,“一个国家最不活跃的人群,为占大多数的中间层次。他们是在城市工作和在乡间务农的正派老百姓,然而,他们的命运却受分据社会光谱两头的少数人——最优秀的人和最低劣的人所左右”[4]。显而易见的是,单凭技术体系构筑的大数据平台无法真正获取“全部数据”,通过改革网络舆情管理去打捞那些可能代表某一个群体或一定数量级的“沉没的声音”十分必要。因此,全面思考和理清大数据时代网络舆情管理面临的机遇和挑战,通过“大舆情”观念的构建,变革网络舆情管理的工作理念和模式,将有利于打捞“沉没的声音”。例如,将舆情服务与社会调查相结合,重视实地调研与第一手材料的采集,而不是把网络舆情管理捆绑在技术上,将避免得到不全面的舆情或做出误导性决策。
(三)识破“伪舆情”。当前备受关注的网络舆情,越来越成为依存于影星式的学者、影星式的记者、影星式的商人和影星式的政客为中心的“伪舆情”[5]。重大敏感事件发生后,部分网管和有影响力的舆情机构快速封堵其主观上认为的“有害信息”,选择性地编撰舆情报告,以片面、虚假的“伪舆情”影响决策层对形势的研判,使其做出符合自身利益诉求的决策。有些利益集团则精心扶植和培育自己的网络发言人,引导网民思考的内容和方向。结果,这些舆论领袖对关键事件和问题的看法在网络上大行其道,并淹没其他异质言论,使群众对真相的认知产生巨大偏差。当舆情被各方利益集团的政治力量和经济力量操纵时,它便丧失了独立性,一旦“伪舆情”被识破,舆情机构就可能失去其公信力。基于全网的完整、准确和极速的信息抓取有利于为舆情分析报告提供一手的材料、纯粹的事实,从而获得真实全面的舆情,使网民在不知道“为什么”的情况下,依然能获得对“是什么”的比较公正客观的认知,并以此助力网络舆情的引导。同时,通过变革网络舆情管理的体制机制,保持舆情管理的独立性将有力识破“伪舆情”,剔除“杂音”与“噪音”,使大数据时代的网络舆情真正成为现实世界的“镜像”。
(四)克服“盲人摸象”和“信息孤岛”。海量信息无限增长与网民关注、分析能力有限之间的矛盾,造成了“数据爆炸”与“知识贫乏”的怪象,加剧了社会舆论的“盲人摸象”效应。大数据时代下,网络媒体促进了信息的开放和沟通的便捷,人们对公共事件的参与达到了一个前所未有的高度,但是分众传播、个性化传播的凸显以及信息的碎片化,使得全面、深刻地关注和分析事件变得越来越困难。网民非理性、易激动的特点导致网络舆情的偏激和情绪化,网络的“群体极化”被放大。大数据时代的舆情监测是建立在传统人工和软件无法进行的全网舆情信息采集的基础上,样本扩大到全体。通过运用大数据技术,建立网络舆情自动分析系统,避免因数据源不全面而造成的重要信息监测缺失,将有利于消弭“盲人摸象”现象。与此同时,由于信息化应用水平参差不齐,政府和企业不同的部门之间都存在“信息孤岛”问题:有多少个部门就有多少个信息系统,每个系统都有自己的数据库、应用软件和用户界面,完全是独立的体系,阻碍了数据的互通互联[6]。变革大数据时代网络舆情管理的工作模式,统一舆情行业的技术标准,共享数据,建立网络舆情服务联盟,统筹政府、企业、媒体及社会力量,实现网络舆情的多元共治将有利于解决“信息孤岛”问题。
三、大数据时代网络舆情管理的变革路径
当大数据给各行各业带来变革性影响时,全世界都没做好迎接这场产业革命的准备。但与英美等发达国家相比,中国更像是处在大数据时代的前夜。而中国的人口和经济规模决定了中国大数据的规模为全球最大,为中国抓住时代的脉搏进行改革提供了难得的机遇。在这种大背景下,大数据对传统舆情管理也产生了深刻的影响,要使网络舆情管理变革产生应有的预期效应,适应时代的发展要求,须从思维观念、方法手段、体制机制、技术保障、人才建设等路径着手。
(一)树立大舆情观念。大数据时代网络舆情管理的变革,首要在于树立大舆情观念。这里的大舆情,包括两层含义。第一,强调“大数据观”,即充分实现网络数据平台的开放共享。按照“一切皆可量化”的大数据逻辑,一个新增的相关性数据的产生,通常会带来一个新的分析结果。因此只有形成“大数据观”,实现数据的动态分享,才能有效防止信息“碎片化”,最大限度地消除“盲人摸象”和“信息孤岛”现象。第二,强调网上和网下数据的整合。网络舆情与社会调查结合不足,可能降低舆情的真实性,误导决策。例如,对于假期调整方案的选择,各舆情机构组织的网络投票的结果各不相同,其做出的舆情分析报告也和真实民意相左。因此只有真正掌握“大舆情”,打捞“沉没的声音”,才能正确决策,打造一个更安全、更高效的社会。树立大舆情观念,首先,必须实现数据分析的动态化,打破数据垄断,统一标准,共享数据,预防孤立的舆情机构闭门造车,制定片面或错误的舆情分析报告。其次,应把网上网下各方面数据整合起来,挖掘网络舆情与社会动态背后的深层次关系,实现网络舆情管理和社会治理的紧密联动、同步推进[7]。最后,完善和创新包括舆情抓取、预警、研判到决策、评估等在内的网络舆情管理的各个环节,使舆情管理功能不仅仅限于危机处理,更能发挥辅助决策的作用。
(二)变革网络舆情的引导战略。做好舆论引导工作,应把握好时、度、效。但是目前许多地方和部门对如何进行网络舆情的引导仍然缺乏正确认识,于“时”不能把握好“黄金4小时”,于“度”不能掌握火候,拿捏分寸,于“效”不能保证网络舆情引导的实效质量。大数据由于自身具有的特点,使其利于变革网络舆情的引导战略,变“封改删”、“鸵鸟战术”为“网上引导,网下落地”,使“伪舆情”失去生存的土壤。因此,我们要充分发挥大数据的优势来提高舆情引导工作的能力。其一,利用大数据提升网络舆情引导的预见性和目的性。通过数据抓取和相关性分析,构建网民意见倾向分析模型,了解网民的偏好和特点,建设和完善政府网站、官方微博,扶植和借助意见领袖,做到“善说话、说对话、接地气、办实事”。其二,通过数据的价值转化,实现网络舆情的价值引导。在充分收集相关数据的基础上,运用图表等数据可视化技术揭示事件的前因后果,让数据“发声”,使网民既“知其然”也“知其所以然”,从而全方位360度无死角了解事件的来龙去脉,消除“盲人摸象”现象。其三,提升舆情引导的公信力。一方面加强新老媒体间的互动,发挥各自的优势与公众沟通,破解谣言和流言,达到时效性和权威性的双重保障;另一方面要避免舆情分析师在处理数据的过程中受经验偏好的影响,并防止大数据沦为某些机构和个人更便捷地操纵舆论的手段。
(三)健全大数据舆情管理体制机制。当前,网络舆情管理的体制机制尚不完善,很多地区尚不具备系统规范的舆情应对与处理的管理体系。舆情分析和预测手段落后,危机应对系统缺失,舆情管理组织机构不健全、不稳定,以及多头管理等问题非常普遍。健全大数据舆情管理的体制机制,对于从源头上解决网络舆情管理过程中出现的问题和困难,实现标本兼治,具有决定性作用。因此,为使网络舆情管理取得实效,提升网络舆情工作的规范化和科学化水平,我国应加快建立健全大数据舆情管理的体制机制。首先,建立网络舆情多元管理的互动机制,由国家出台大数据发展战略规划,产学研相结合,统筹政府、企业、社会和公民的力量,形成合力,实现共治。其次,变革网络舆情管理的机构设置,改变以往通过临时组建领导小组或临时办公室等机构,或者以宣传部门为“消防队”等方式被动应对舆情危机的模式,通过常态化机构的设置和专业人员的配备,使网络舆情管理专门化、精细化。再次,建立权责明确的责任机制,通过加快数据立法进程明确各级各部门包括政府部门、企业媒体、人民团体等的权利义务;通过建立由网信部门牵头的大数据舆情管理体制,改变多头管理的局面,并设立政府首席信息官责任制度等。最后,健全大数据网络舆情管理的资源保障机制,大数据时代变革网络舆情管理面临初期成本高、短期效益不明显等问题,需要加大资金、技术、物资、人力等资源的投入。
(四)创新大数据网络舆情管理的方法与技术。大数据时代的到来,要求网络舆情管理必须采用更为先进的技术,这主要表现在对各种相关软件的大量应用以及对大数据技术支撑平台的依托。目前中国网络舆情监测采集软件中较具代表性的有TRS互联网舆情信息监控系统、北大方正智思舆情监控系统、军犬网络舆情监控系统、乐思网络舆情监测系统等。此外,还应完善和创新大数据技术支撑平台的五大基石——数据监测技术、数据挖掘技术、数据存储技术、数据分析技术、数据安全技术,使大数据为网络舆情管理服务的同时又不超出我们的控制。同时,我们也不能陷入“技术是万能的”误区而盲目迷信和依赖技术,更不能因相信大数据强大的预测功能而导致“数据独裁”,变成数据的奴隶。因此,网络舆情管理还需要依靠其他方法和手段相辅相成,共同作用。法律因其具备最大的强制性和权威性,成为最有效的管理控制的手段。法律与道德相互联系,在极具复杂性和特殊性的虚拟空间里,教育和自律被摆在重要的位置上。例如,欧美发达国家如美国、英国、加拿大等都通过倡导用户自律和自我管理来提高网民的媒介素养,加强自我把关能力。此外,还可以效仿韩国、新加坡等运用行政手段,要求网络用户在获得国家有关部门颁发的许可证的情况下,才能访问政府严格控制的信息等。
(五)培育大数据时代的网络舆情管理人才。大数据时代的网络舆情将会形成多向度的研究,例如对社会话语表达、社会心理描绘、社会关系呈现、社会诉求预测等的分析研究。网络舆情将真正成为一门与多学科交叉的社会显学,对人才的全面性要求很高。中国教育的学科划分和培养体系,客观导致培养出来的人才很难跨界。换句话说,真正进入这个行业的门槛是很高的。正因如此,各国越来越重视对数据科学家的培养,如美国在大学专门开设研究大数据技术的课程,通过严格的业务培训和职业资格认证,培养下一代的数据科学家。2013年9月,我国人社部联合人民网启动“网络舆情分析师职业培训计划”,“网络舆情分析师”成为一项被正式认可的职业。但是我国现有舆情工作人员的水平仍然严重滞后,很多舆情机构尤其是地方政府并没有专业的数据处理、分析团队和专门的网络舆情管理部门。为突破大数据时代变革网络舆情管理的人才瓶颈,从短期看,可以通过招考、录用等方式引进数据挖掘、分析人才,通过委托培养、网络培训等方式强化已有专业人才力量,通过购买服务的方式短期租赁大数据舆情管理的高素质人才。从长远看,则要系统梳理网络舆情管理所需人才目录,培养和壮大既精通数据挖掘、数学建模,又拥有较高学习能力、分析能力和知识水平,横跨统计学、社会学、计算机学、传播学、管理学等学科的复合型人才,打造一支大数据网络舆情管理的专业人才队伍。
以上是小编为大家分享的关于大数据时代网络舆情管理变革探讨的相关内容,更多信息可以关注环球青藤分享更多干货
④ 大数据时代的信息有哪些特点
大数据有4个特点,为别为:Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值),一般我们称之为4V。
1.大量。大数据的特征首先就体现为“大”,从先Map3时代,一个小小的MB级别的Map3就可以满足很多人的需求,然而随着时间的推移,存储单位从过去的GB到TB,乃至现在的PB、EB级别。
随着信息技术的高速发展,数据开始爆发性增长。社交网络(微博、推特、脸书)、移动网络、各种智能工具,服务工具等,都成为数据的来源。淘宝网近4亿的会员每天产生的商品交易数据约20TB;脸书约10亿的用户每天产生的日志数据超过300TB。
迫切需要智能的算法、强大的数据处理平台和新的数据处理技术,来统计、分析、预测和实时处理如此大规模的数据。
2.多样。广泛的数据来源,决定了大数据形式的多样性。任何形式的数据都可以产生作用,目前应用最广泛的就是推荐系统,如淘宝,网易云音乐、今日头条等,这些平台都会通过对用户的日志数据进行分析,从而进一步推荐用户喜欢的东西。
日志数据是结构化明显的数据,还有一些数据结构化不明显,例如图片、音频、视频等,这些数据因果关系弱,就需要人工对其进行标注。
3.高速。大数据的产生非常迅速,主要通过互联网传输。生活中每个人都离不开互联网,也就是说每天个人每天都在向大数据提供大量的资料。
并且这些数据是需要及时处理的,因为花费大量资本去存储作用较小的历史数据是非常不划算的,对于一个平台而言,也许保存的数据只有过去几天或者一个月之内,再远的数据就要及时清理,不然代价太大。
基于这种情况,大数据对处理速度有非常严格的要求,服务器中大量的资源都用于处理和计算数据,很多平台都需要做到实时分析。数据无时无刻不在产生,谁的速度更快,谁就有优势。
4.价值。这也是大数据的核心特征。现实世界所产生的数据中,有价值的数据所占比例很小。
相比于传统的小数据,大数据最大的价值在于通过从大量不相关的各种类型的数据中,挖掘出对未来趋势与模式预测分析有价值的数据,并通过机器学习方法、人工智能方法或数据挖掘方法深度分析。
发现新规律和新知识,并运用于农业、金融、医疗等各个领域,从而最终达到改善社会治理、提高生产效率、推进科学研究的效果。
⑤ 大数据如何作用于”舆情“
大数据如何作用于”舆情“
随着互联网技术的迅速发展,信息量大、类型繁多、价值密度低、速度快、时效高的大数据吸引了越来越多的关注目光,大数据带来的信息风暴正在改变我们的生活、工作和思维。毋庸讳言,舆情服务在进行行业规范和整合的同时,正面临着大数据的挑战。
大数据时代,对信息的“加工”是基础。据 互联网专家介绍,大数据体量巨大,非结构化数据的超大规模和增长分别占总数据量的80%至90%,比结构化数据增长快10到50倍。从舆情产品服务的角度 看,浓缩海量信息,抵抗“数据爆炸”已成舆情工作基本要求。故此,掌握数据抓取能力与舆情解读能力,通过“加工”实现数据的“增值”,将是未来舆情分析的 必备技能。目前,国内很多舆情服务机构甚至没有专门的数据管理、分析部门和专业分析团队,分析人员对信息的鉴别力、萃取力、掌控力仍有待提高。在信息广度 上大作文章的同时,未来需要一批有较高学习能力、分析能力、知识水平的数据从业人员占据舆情服务重镇。
大数据时代,对数据的解释是关键。目 前,数据的可获得度已经空前提高,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,实现真正的大数据挖掘和分析。数据的海量、 及时、动态、开放,有利于我们完善分析的效度和深度。同时,大数据也有价值密度低、传播速度快等特点,数据分析的模式是否科学,这将直接影响数据分析的质 量。大数据的异构和多样性,需要舆情分析人员对一些危机事件进行高质量的数据解释。基于数据分析,能否提炼出独到、高质量的观点,在凌乱纷繁的数据背后找 到更符合客户要求的舆情产品和服务,并进行针对性的调整和优化,这是大数据时代舆情最大的变量。
大数据时代,对趋势的研判是目标。大 数据的核心和目标就是预测,具体到舆情服务,舆情工作人员从互联网浩如烟海的数据中挖掘信息、判断趋势、提高效益,虽然获得广泛且实际的应用,但还远远不 够。舆情分析人员要不断增强关联舆情信息的分析和预测,把服务的重点从单纯的收集有效数据向对舆情的深入研判拓展,跟踪关联舆情,不再局限于危机解决,还 要辅之以决策参考,从注重“静态收集”向注重“动态跟踪”拓展,从致力“反映问题”向致力“解决问题”拓展,使舆情产品和服务“更高、更快、更强”(视点 高、预警快、处置强)。
大数据时代,分众服务是方向。数 据的互通互联,改变了数据库、应用软件和用户界面等系统之间的“孤岛”状态。舆情服务机构应树立大舆情观念,对数据进行生产、分析和解读,探索一条为用户 提供分众化服务的信息增值之路,使舆情服务的主体和边界形成一条完整的“舆情闭环”。在这个认识基础上,舆情服务机构需把握未来几年大数据在公共及企业管 理领域发展的重要方向:横向看,将服务主体延伸至政府、企业和社会的各领域,通过搭建关联领域的数据库、舆情基础数据库等,充分整合政府和企业的数据资 产;纵向看,将产品内容延伸至包括舆情抓取、预警到决策、评估等在内的各环节,协助客户丰富和完善决策参考体系。
大 舆情,强调大数据的关联性。发展和利用好数据资源,充分反映数据爆发背景下的数据处理与应用需求,这是大数据时代最大的舆情变革。目前,国内经济社会转型 发展环境压力加大,社会周期结构性突发舆情因素增多,舆情工作者尤其需要树立前瞻意识,提高媒介素养,加强互联网“大数据”分析研判,获取情报,抓住机 遇,为长远发展打下良好的基础。
⑥ 大数据时代发展历程是什么
可按照时间点划分大数据的发展历程。
⑦ 大数据时代的信息安全和未来展望
大数据时代的信息安全和未来展望
随着高级可持续性攻击的出现以及恶意软件的复杂性与日俱增,企业急需一种突破传统信息安全保障模式的、灵活的技术和方案来应对未来不断变化的安全威胁。大数据彻底的改变了信息安全行业,基于大数据分析的智能驱动型安全战略将帮助信息安全从业人员重获警惕性和时间的优势,以使他们更好地检测和防御高级网络威胁。
大数据时代信息安全面临挑战
在大数据时代,无处不在的智能终端、随时在线的网络传输、互动频繁的社交网络使得互联网时时刻刻都在产生着海量的数据。随着产生、存储、分析的数据量越来越大,在这些海量数据背后隐藏着大量的经济与政治利益。大数据如同一把双刃剑,在我们享受大数据分析带来的精准信息的同时,其所带来的安全问题也开始成为企业的隐患。
1、黑客更显著的攻击目标:在网络空间里,大数据是更容易被“发现”的大目标。一方面,大数据意味着海量的数据,也意味着更复杂、更敏感的数据,这些数据会吸引更多的潜在攻击者。另一方面,数据的大量汇集,使得黑客成功攻击一次就能获得更多数据,无形中降低了黑客的攻击成本,增加了其“收益率”。
2、隐私泄露风险增加:大量数据的汇集不可避免地加大了用户隐私泄露的风险。一方面,数据集中存储增加了泄露风险,而这些数据不被滥用,也成为人身安全的一部分。另一方面,一些敏感数据的所有权和使用权并没有明确界定,很多基于大数据的分析都未考虑到其中涉及的个体隐私问题。
3、威胁现有的存储和防护措施:大数据存储带来新的安全问题。数据大集中的后果是复杂多样的数据存储在一起,很可能会出现将某些生产数据放在经营数据存储位置的情况,致使企业安全管理不合规。大数据的大小也影响到安全控制措施能否正确运行。安全防护手段的更新升级速度无法跟上数据量非线性增长的步伐,就会暴露大数据安全防护的漏洞。
4、大数据技术成为黑客的攻击手段:在企业用数据挖掘和数据分析等大数据技术获取商业价值的同时,黑客也在利用这些大数据技术向企业发起攻击。黑客会最大限度地收集更多有用信息,比如社交网络、邮件、微博、电子商务、电话和家庭住址等信息,大数据分析使黑客的攻击更加精准。此外,大数据也为黑客发起攻击提供了更多机会。黑客利用大数据发起僵尸网络攻击,可能会同时控制上百万台傀儡机并发起攻击。
5、成为高级可持续攻击的载体:传统的检测是基于单个时间点进行的基于威胁特征的实时匹配检测,而高级可持续攻击(APT)是一个实施过程,无法被实时检测。此外,由于大数据的价值低密度特性,使得安全分析工具很难聚焦在价值点上,黑客可以将攻击隐藏在大数据中,给安全服务提供商的分析制造很大困难。黑客设置的任何一个会误导安全厂商目标信息提取和检索的攻击,都会导致安全监测偏离应有方向。
6、信息安全产业面临变革:大数据的到来也为信息安全产业的发展带来了新的契机,还没有意识到这场变革的安全厂商将在这场变革大潮中被抛弃。大数据正在为安全分析提供新的可能性,在未来的安全架构体系中,通过大数据智能分析有效的将原来分割的安全产品更好的融合起来,成为不同的安全智能节点,这将是在大数据时代安全产业需要研究突破的重点。
大数据安全未来趋势展望
据MacDonald预测,到2016年,40%的企业(银行、保险、医药和国防行业为主)将积极地对至少10TB数据进行分析,以找出潜在危险的活动。然而,供应商的产品格局却无法在短期内进行转变。现在,企业通常依赖于SIEM系统来关联和分析安全相关的数据,MacDonald表示目前的SIEM产品无法处理这么大的工作量,大多数SIEM产品提供接近实时数据,但只能处理规范化数据,还有些SIEM产品能够处理大量原始交易数据,但无法提供实时情报信息。
Gartner公司分析师表示,使用“大数据”来提高企业信息安全不完全是炒作,这在未来几年内这将成为现实。大数据将为安全团队带来新的工作方式,通过了解大数据的优势、制定切合实际的目标以及利用现有安全技术的优势,安全管理人员将会发现他们在大数据进行的投资是值得的。
RSA大中国区总经理胡军表示,“大数据将带动安全行业方向性的改变,安全与数据互相影响,未来共同促进发展。现今的安全需要更全面和广泛的可视性,敏捷的分析,可采取行动的情报和可扩展的基础设施。”
我们可以看到,大数据安全已经成为不可阻挡的趋势。在未来,不论是从商业需求角度,还是产业技术角度,大数据安全都将成为业界关注的热点。而在这场大数据安全的盛宴中,也必然会出现新老更替、推陈出新,这一切就让我们拭目以待吧!
⑧ 大数据时代下的舆情监控应如何做
舆情监测专员日常工作是什么?工作主要职责是什么? 一般来说,为了有效监测网络舆情,一些相关部门单位都会设有舆情监测专员,每天进行实时信息监测收集的工作。可能有的对于网络舆情监测意识不够,不太清楚舆情监测专员是做什么的?也不太清楚其日常工作职责是什么,针对这些问题总结出一下几点。 舆情监测专员日常工作任务:
1. 综合监测 综合监测网络上(包括微信、微博、自媒体等各渠道)传递的与工作单位相关的舆情,一旦发现负面舆论,能够在事情发生初期及时处理。避免舆论爆发产生负面的影响。 由于互联网信息量大,网络舆情监测员需利用舆情监测系统进行实时监测,从新闻、微博、论坛、贴吧等渠道获取相关的信息,储存到数据库。
2. 舆情分析研判 信息获取后,需要对数据库的信息进行处理。运用舆情监测系统对时间、热度、强度、内容等方面的信息进行筛选,剔除不必要的垃圾信息,然后自动过滤分类,最终获取有价值的信息。在舆情处理过程中,首先需要对舆情进行分析研判,判定是否能在短期内调查清楚舆情的真相和过程,并对外公布。 在舆情处理中重视“黄金4小时”和“黄金24小时”的重要节点,尽量在节点前还原真相并用官方或主流媒体对外公布,避免事态扩大,使舆情危机进入高潮阶段而造成极大的影响。 如无法短期内完成,则要立即告知事情正在处理中,有时候态度比真 相更重要。而后也要尽快查清事情的真相和舆情的传递过程,并形成舆情报告对外公布。
3. 制作舆情分析报告 舆情反馈包括舆情发生初期的表态公告、处理过程中的及时反馈以及处理完成后的舆情报告公布。当网络舆情已经发生,网民已经重点关注,若是不及时反馈舆情处理进展,只会加剧网友对事件的各种揣测,而使舆情越走越偏。 将筛选出的精准信息进行分析,判断舆情事件的走向以及事件的影响力,制作成舆情分析报告。舆情分析报告应包括对当下舆情监测工作的汇报总结和舆情处置行动的提示与指导。 由于互联网信息量大,网络舆情监测员需利用舆情监测系统进行实时监测,从新闻、微博、论坛、贴吧等渠道获取相关的信息,储存到数据库。 信息获取后,需要对数据库的信息进行处理。运用舆情监测系统对时间、热度、强度、内容等方面的信息进行筛选,剔除不必要的垃圾信息,然后自动过滤分类,最终获取有价值的信息。
● 舆情监测专员基本素养:
1. 把握媒体环境的变化 新媒体时代极大地提高了民众的参与性,网络舆情的广泛传播,使其影响力日渐提高,甚至成为政府单位、企业公司和名人个体决策的重要因素。网络舆情管理人员必须要随时监测媒体环境的动向,以便随时整合媒体传播在舆情处理中的重要作用。
2. 具有强烈的新闻敏感性 网络舆情管理人员要善于通过媒体渠道及时把握社会的变动和舆论走向。最大限度地接触与单位相关的信息,并对信息合理地筛选、评价和传播,保证提供的信息能够被媒体和公众接受。
3. 善与媒体沟通合作 在网络舆情处理的工作中,管理人员接触最多的就是各类媒体。网络舆情处理中,需要通过各类媒体随时公布处理的过程。因此与媒体达成友好良性的沟通合作,是网络舆情管理人员最重要的专业素养之一。
4. 能有效引导舆情的走向 工作中,能对负面以及者虚假的舆情及时处理,发布正面、正确的观点,鞭挞虚假丑陋,打击谣言,向民众传递正能量,引导舆情的正面走向。 蚁坊软件认为网络舆情管理人员在处理舆情时,要把握温情比冷漠好,面对比回避好,主动比被动好,越早比越迟好,公开比掩盖好,负责比推卸好的基本原则。
⑨ 如何在大数据时代的背景下将高新科技与情报信息工作相结合
随着学科的深入交叉融合及社会发展、经济发展与科技发展一体化程度的增强,情报研究正从单一领域分析向全领域分析的方向发展。
首先,表现在各领域中的情报研究从视角、方法上的相互借鉴。从方法上看,社交网络分析方法、空间信息分析等其他学科的分析方法,广泛应用于军事情报、科技情报等领域,心理学等领域的理论也用于情报分析的认知过程,以指导情报分析及其工具的研发。同时,情报学中的引文分析等文献计量方法也被借鉴用于网站影响力评估。从技术上看,可视化、数据挖掘等计算机领域的技术,为情报研究提供了有力的技术视角,情报研究获得的知识反过来又给予其他技术领域的发展以引导。可见,无论从思想上、方法上、技术上,各领域之间的交叉点越来越多,虽然这种相互借鉴早就存在,但现在意识更强、手段更为综合。 其次是分析内容的扩展,这也是最为重要和显著的变化。在情报研究过程中,不仅仅局限于就本领域问题的分析而分析,而将所分析的内容置于一个更大的情景下做通盘考虑,从而得出更为严谨的结论。联合国的创新倡议项目GlobalPulse在其白皮书“BigDataforDevelopment:Opportunities&Challenges”[7]中指出,情境是关键,基于没有代表性样本而获得的结论是缺乏外部合法性的,即不能反映真实的世界。在情报研究领域,一些数据往往因为一些不可抗力的原因而不完整,如早期的科技数据,可能由于国际形势等外部因素,导致一些国家的科技信息无法获取,基于这样缺失的分析样本来评估该国的科技影响力,如果仅就数据论数据,无疑是会得“正确”的错误结论,这时应针对这样的异常情况,将研究问题放置在当时的时代背景下,揭示背后的原因,从其他方面收集信息来补充,才能得出符合实际的结论。也就是说,必须要考察不同时间戳下的相关信息,再对分析内容加以扩充,这实质是一种基于时间轴的扩展。另外,将内容扩展至本领域的上下游则是一种更为重要的扩展。例如,考察某项技术的发展前景,如果仅就该技术本身来讨论,可能会得出正面的结论,但如果结合特定地区人们对该技术的态度、当地的技术水平、物理条件、发展定位等,却可能会得出相反的结论。这就说明,在很多领域中,环境不同,发展程度不同,要解决的问题也就不同。一些地区当前关注的问题不一定就是其他地区要关注的问题,某些欠发达地区当前不一定就必须照搬另一些所谓发达地区的当前做法。这需要通盘考察,分析相关思想、观点和方法产生的土壤、使用的条件,结合当前环境再做出判断,否则可能会对决策者产生误导。
⑩ 大数据时代:如何守护我们的数据安全
大数据时代:如何守护我们的数据安全
不管你承认不承认,我们已经全面进入了大数据时代。无时无刻,我们的很多信息都被通过各种途径传播出去,这就必然导致安全问题的产生。
大数据的安全问题有多严重?在此前举办的“2016中国大数据产业峰会”上发生的一个实例,就可见一斑。
在360展区,市民严女士随手将钱包、手机放到安检筐里,空手走过安检门。她通过安检门,突然发现大屏幕上显示出自己银行卡的姓名拼音、身份证号、银行卡号、卡片有效期、最近10次的消费时间、消费地点、取现记录、转账记录等等。严女士惊呼:“遇到了魔术师”。
360安全专家刘洋解释,实际上,存放手机钱包的安检筐里存有一张具有NFC(近距离通信)功能的无线读卡器,旁边还有配套的信号接收器和电脑等设备,就像公交车刷卡器,只要银行卡靠近读卡器,卡片的信息就显示出来,安检门其实就是“安全魔术师”手中的障眼法。就在严女士将钱包放进安检筐的那一刻,严女士的个人信息就已经泄露了。
那么,我们靠什么来保障我们的数据安全呢?难道我们只能看着个人的数据和隐私到处泄露吗?
数据安全事件日益高发
近来,大数据安全事件呈高发之势。日前,广东警方破获一起高科技经济犯罪案件,17岁的“黑客”叶世广,攻破了多个商业银行网站,窃取了储户的身份证号、银行卡号、支付密码等数据,带领一批人在网上大肆盗刷别人的信用卡,涉案金额近15亿元,涉及银行49家。
今年2月,发生了世界上有史以来规模最大的网络盗窃案。黑客入侵了孟加拉国央行在纽约联邦储备银行的账户,盗走了8100万美元,后来孟加拉国官方表示,黑客出现了一个拼写错误,否则随后还将进行一笔近10亿美元的转账。
今年3月,与叙利亚有关联的激进黑客组织对一个自来水厂发起网络攻击。黑客操纵系统改变了进入到自来水中的化学物含量,阻碍净水过程。
类似的案例不胜枚举。
360公司总裁齐向东向《中国科学报》记者表示,接入互联网的设备越多,网络攻击的发生几率就越高,网络攻击首先瞄准大数据,攻击造成大数据丢失、情报泄密和破坏网络安全运行。大数据技术是一把双刃剑,既可以造福社会、造福人民,又可以被一些人用来损害社会公共利益和民众利益。
大数据安全体系构建势在必行
“在互联网乃至物联网时代,如果我们不能很好地解决安全问题,就会影响社会各方面的发展。因此,各级政府在鼓励发展大数据的同时,要同步考虑构建大数据安全体系。”齐向东表示。
值得注意的是,传统的网络安全思路已经无法保障大数据时代的安全。刘洋向记者介绍,传统网络安全的防护思路是划分边界,将内网、外网分开,业务网和公众网分离,用终端设备将潜在风险隔离。通过在每个边界设立网关设备和网络流量设备,来守住“边界”,以期解决安全问题。但随着移动互联网、云服务的出现,移动终端在4G信号、Wi-Fi信号、电缆之间穿梭,网络边界实际上已经消亡。
“很多传统的大企业认为,只要自己购买服务器并搭建独立的机房,安排专门的技术人员就能够保护企业的数据不被泄露,能够保护企业的信息安全。但实际上,在如今的互联网时代,这种传统的方法更加容易被不法分子所攻破。”阿里云安全资深总监肖力向《中国科学报》记者介绍,这是因为从技术实力来看,绝大部分企业并不是专门做网络安全、数据安全,其设置的技术壁垒难以阻挡专业的黑客。
齐向东介绍,360安全中心每天发现木马样本近千万个,每天发现的各种软硬件漏洞、网站漏洞超过120个,“每一个木马每一个漏洞,都可能攻破预先部署的安全设备和安全软件”。这种情况下,企业的传统防护的确难以奏效。
云平台和大数据需“双剑合璧”
在采访中,有专家认为,对付大数据时代的数据安全问题,防止信息泄露,除了完善相关法制法规,更加需要云平台的防护技术,结合大数据技术来应对数据安全。
“在云计算不断深入发展的当下,将数据存储在云平台上,或许比传统的企业信息防护更加安全。”肖力介绍,以阿里云为例,阿里云在架构设计之初就同步考虑了安全架构,不仅将安全的基因植入到整个云平台和各个云产品中,也将数据安全要求嵌入产品开发生命周期的各个环节。依靠专业的云计算平台,强大的技术团队能够更好地应付来自黑客的攻击。
不同用户之间,无论是CPU、内存,还是存储和网络,都默认相互隔离,既看不到对方的数据,也不会相互影响。“就像一间五星级酒店被分割成多个房间,他们之间是相互独立和封闭的,从而确保不同租户互不干扰和数据隔离。”肖力表示。
据介绍,目前全国35%的网站的数据安全防护都依托于阿里云平台的防护。阿里云的云盾,涵盖网络安全、服务器安全、数据安全、业务安全和移动安全这五个安全领域,来保护数据安全。
360也有自己的云安全管理平台。刘洋介绍,该平台将360独有的云安全漏洞挖掘能力输出给广大用户,通过统一管理、安全可见以及网络、主机、应用、数据的分层纵深防御,为用户全面解决云安全问题。
“用大数据技术来解决大数据时代的安全问题十分必要。”齐向东进一步指出,必须建立“数据驱动安全”的思维,搭建全新的互联网安全体系—“传统安全+互联网+大数据”。也就是说,要利用漏洞挖掘技术、网络攻击技术、软件样行为分析技术以及由网络地址解析数据库、网络访问日志数据库、文件黑白名单数据库等组成大数据系统与分析技术,构建全天候全方位感知网络安全态势。“要基于强大的大数据库、利用先进的大数据技术和广泛的用户覆盖率,提前感知网络威胁态势,为大众提供未知威胁的发现与回溯功能并进行有效防护。”齐向东说。
“未来还应当联合各方力量,共建互联网安全产业链生态,来应对大数据时代的安全风险。”肖力表示。