导航:首页 > 网络数据 > 大数据安全分析研究

大数据安全分析研究

发布时间:2023-07-24 08:53:39

大数据分析有哪些基本方向

【导读】跟着大数据时代的降临,大数据剖析也应运而生。随之而来的数据仓库、数据安全、数据剖析、数据发掘等等环绕大数据的商业价值的使用逐渐成为职业人士争相追捧的利润焦点。那么,大数据剖析有哪些根本方向呢?

1.可视化剖析

不管是对数据剖析专家仍是普通用户,数据可视化是数据剖析东西最根本的要求。可视化能够直观的展现数据,让数据自己说话,让观众听到成果。

2.数据发掘算法

可视化是给人看的,数据发掘便是给机器看的。集群、切割、孤立点剖析还有其他的算法让咱们深入数据内部,发掘价值。这些算法不只要处理大数据的量,也要处理大数据的速度。

3.猜测性剖析才能

数据发掘能够让剖析员更好的理解数据,而猜测性剖析能够让剖析员根据可视化剖析和数据发掘的成果做出一些猜测性的判别。

4.语义引擎

咱们知道由于非结构化数据的多样性带来了数据剖析的新的应战,咱们需求一系列的东西去解析,提取,剖析数据。语义引擎需求被设计成能够从“文档”中智能提取信息。

5.数据质量和数据管理

数据质量和数据管理是一些管理方面的最佳实践。经过标准化的流程和东西对数据进行处理能够保证一个预先界说好的高质量的剖析成果。

6.数据存储,数据仓库

数据仓库是为了便于多维剖析和多角度展现数据按特定形式进行存储所建立起来的联系型数据库。在商业智能系统的设计中,数据仓库的构建是关键,是商业智能系统的根底,为商业智能系统供给数据抽取、转换和加载(ETL),并按主题对数据进行查询和拜访,为联机数据剖析和数据发掘供给数据平台。

以上就是小编今天给大家整理分享关于“大数据分析有哪些基本方向?”的相关内容希望对大家有所帮助。小编认为要想在大数据行业有所建树,需要考取部分含金量高的数据分析师证书,这样更有核心竞争力与竞争资本。

网络安全与大数据技术应用探讨论文

网络安全与大数据技术应用探讨论文

摘要: 随着互联网技术的高速发展与普及,现如今互联网技术已经广泛应用于人们工作与生活之中,这给人们带来了前所未有的便利,但与此同时各种网络安全问题也随之显现。基于此,本文主要介绍了大数据技术在网络安全领域中的具体应用,希望在网络系统安全方面进行研究的同时,能够为互联网事业的持续发展提供可行的理论参考。

关键词: 网络安全;大数据技术;应用分析

前言

随着近年来互联网技术的不断深入,网络安全事故也随之频频发生。出于对网络信息安全的重视,我国于2014年成立了国家安全委员会,正式将网络安全提升为国家战略部署,这同时也表示我国网络信息安全形势不容乐观,网络攻击事件处于高发状态。木马僵尸病毒、恶意勒索软件、分布式拒绝服务攻击、窃取用户敏感信息等各类网络攻击事件的数量都处于世界前列。时有发生的移动恶意程序、APT、DDOS、木马病毒等网络攻击不仅会严重阻碍网络带宽、降低网络速度、并且对电信运营商的企业声誉也会产生一定影响。根据大量数据表明,仅仅依靠传统的网络防范措施已经无法应对新一代的网络威胁,而通过精确的检测分析从而在早期预警,已经成为现阶段网络安全能力的关键所在。

1网络安全问题分析

网络安全问题不仅涉及公民隐私与信息安全,更关乎国事安全,例如雅虎的信息泄露,导致至少五亿条用户信息被窃;美国棱镜门与希拉里邮件门等等事件都使得网络安全问题进一步升级、扩大。随着互联网构架日益复杂,网络安全分析的数据量也在与日俱增,在由TB级向PB级迈进的过程,不仅数据来源丰富、内容更加细化,数据分析所需维度也更为广泛。伴随着现阶段网络性能的增长,数据源发送速率更快,对安全信息采集的速度要求也就越高,版本更新延时等导致的Odav等漏洞日渐增多,网络攻击的影响范围也就进一步扩大;例如APT此类有组织、有目标且长期潜伏渗透的多阶段组合式攻击更加难以防范,唯有分析更多种类的安全信息并融合多种手段进行检测抵御。在传统技术架构中,大多使用结构化数据库来进行数据存储,但由于数据存储的成本过高,系统往往会将原始数据进行标准化处理后再进行存储,如此易导致数据的丢失与失真以及历史数据难以保存而造成的追踪溯源困难;同时对于嘈杂的大型、非结构化数据集的执行分析以及复杂查询效率很低,导致数据的实时性及准确性难以保证,安全运营效率不高,因此传统网络安全技术已经难以满足现阶段网络安全分析的新要求。大数据技术这一概念最初由维克托.迈尔.舍恩伯格与肯尼斯.库克耶在2008年出版的《大数据时代》一书中提出的,大数据是指不采用随机分析法,而是对所有的数据进行综合分析处理。大数据技术作为现阶段信息架构发展的趋势之首,其独有的高速、多样、种类繁多以及价值密度低等特点,近年来被广泛应用于互联网的多个领域中。大数据的战略意义在于能够掌握庞大的数据信息,使海量的原始安全信息的存储与分析得以实现、分布式数据库相比传统数据库的存储成本得以降低,并且数据易于在低廉硬件上的水平扩展,极大地降低了安全投入成本;并且伴随着数据挖掘能力的大幅提高,安全信息的采集与检测响应速度更加快捷,异构及海量数据存储的支持打造了多维度、多阶段关联分析的基础,提升了分析的深度与广度。对于网络安全防御而言,通过对不同来源的数据进行综合管理、处理、分析、优化,可实现在海量数据中极速锁定目标数据,并将分析结果实时反馈,对于现阶段网络安全防御而言至关重要。

2大数据在网络安全中的应用

将大数据运用到网络安全分析中,不仅能够实现数据的优化与处理,还能够对日志与访问行为进行综合处理,从而提高事件处理效率。大数据技术在网络安全分析的效果可从以下几点具体分析:

2.1数据采集效率

大数据技术可对数据进行分布式地采集,能够实现数百兆/秒的采集速度,使得数据采集速率得到了极大的提高,这也为后续的关联分析奠定了基础。

2.2数据的存储

在网络安全分析系统中,原始数据的存储是至关重要的,大数据技术能够针对不同数据类型进行不同的数据采集,还能够主动利用不同的方式来提高数据查询的效率,比如在对日志信息进行查询时适合采用列式的存储方式,而对于分析与处理标准化的数据,则适合采用分布式的模式进行预处理,在数据处理后可将结果存放在列式存储中;或者也可以在系统中建立起MapRece的查询模块,在进行查询的时候可直接将指令放在指定的节点,完成处理后再对各个节点进行整理,如此能够确保查询的速度与反应速度。

2.3实时数据的分析与后续数据的处理

在对实时数据的分析中,可以采用关联分析算法或CEP技术进行分析,如此能够实现对数据的采集、分析、处理的综合过程,实现了更高速度以及更高效率的处理;而对于统计结果以及数据的处理,由于这种处理对时效性要求不高,因此可以采用各种数据处理技术或是利用离线处理的方式,从而能够更好地完成系统风险、攻击方面的分析。

2.4关于复杂数据的分析

在针对不同来源、不同类型的复杂数据进行分析时,大数据技术都能够更好的完成数据的分析与查询,并且能够有效完成复杂数据与安全隐患、恶意攻击等方面的处理,当网络系统中出现了恶意破坏、攻击行为,可采用大数据技术从流量、DNS的角度出发,通过多方面的数据信息分析实现全方位的防范、抵御。

3基于大数据技术构建网络系统安全分析

在网络安全系统中引入大数据技术,主要涉及以下三个模块:

3.1数据源模块

网络安全系统中的`数据及数据源会随着互联网技术的进步而倍增技术能够通过分布式采集器的形式,对系统中的软硬件进行信息采集,除了防火墙、检测系统等软件,对设备硬件的要求也在提高,比如对服务器、存储器的检查与维护工作。

3.2数据采集模块

大数据技术可将数据进行对立分析,从而构建起分布式的数据基础,能够做到原始数据从出现到删除都做出一定说明,真正实现数据的访问、追溯功能,尤其是对数据量与日俱增的今天而言,分布式数据存储能够更好地实现提高数据库的稳定性。

3.3数据分析模块

对网络安全系统的运营来说,用户的业务系统就是安全的最终保障对象,大数据分析能够在用户数据产生之初,及时进行分析、反馈,从而能够让网络用户得到更加私人化的服务体验。而对于用户而言,得其所想也会对网络系统以及大数据技术更加的信任,对于个人的安全隐私信息在系统上存储的疑虑也会大幅降低。当前网络与信息安全领域正在面临着全新的挑战,企业、组织、个人用户每天都会产生大量的安全数据,现有的安全分析技术已经难以满足高效率、精确化的安全分析所需。而大数据技术灵活、海量、快速、低成本、高容量等特有的网络安全分析能力,已经成为现阶段业界趋势所向。而对互联网企业来说,实现对数据的深度“加工处理”,则是实现数据增值的关键所在,对商业运营而言是至关重要的。

4结语

在当下时代,信息数据已经渗透到各个行业及业务领域中,成为重要的社会生产因素。正因如此,互联网数据产生的数量也在与日倍增中,这给网络安全分析工作带来了一定难度与压力,而大数据技术则能够很好的完善这一问题。在网络系统中应用大数据技术不仅能够满足人们对数据处理时所要求的高效性与精准性,并且能够在此基础上构建一套相对完善的防范预警系统,这对维护网络系统的安全起着非常关键的作用,相信大数据技术日后能够得到更加广泛的应用。

参考文献:

[1]鲁宛生.浅谈网络安全分析中大数据技术的应用[J].数码世界,2017.

[2]王帅,汪来富,金华敏等.网络安全分析中的大数据技术应用[J].电信科学,2015.

[3]孙玉.浅谈网络安全分析中的大数据技术应用[J].网络安全技术与应用,2017.

;

⑶ 大数据时代安全要怎样的分析技术

大数据时代安全要怎样的分析技术

网络时代的发展日新月异,技术与体验的改变与改进正变得异常迅速。如今,我们的网络已经从千兆迈向了万兆时代,这便使得诸多网络安全设备要分析的数据包数据量急剧上升。而随着下一代防火墙等安全产品的出现,安全网关所要进行的分析的数据量大增、安全监测的内容不断细化使得安全产品所要监测和分析比以往更多的数据。除了数据包、日志、资产数据,更多的诸如漏洞信息、配置信息、身份与访问信息、用户行为信息、应用信息、业务信息、外部情报信息等正在逐渐加入安全要素信息中。正如上述情况所说的那样,随着企业和组织安全体系架构变得越来越复杂,与之俱来的是各类安全数据正在变得越来越多。而传统的分析能力已不足以应对当下安全数据的分析。在面对新型威胁的兴起时,传统的分析方法无法对更多的安全信息做出准确分析,也就更加无从谈起更加快速的做出判定和响应。而以上信息安全所面临的这些问题,正是大数据时代带来的挑战。
在此背景下,对信息安全业而言,如何将大数据技术应用于安全领域、将大数据分析技术应用于信息安全的技术的大数据安全分析的需求正变得愈加急迫。而与此同时,安全数据的数量、速度、种类的迅速膨胀,不仅带来了海量异构数据的融合、存储和管理的问题,更是对传统的安全分析方法带来了挑战。
目前,市场上绝大多数安全分析工具和方法都是针对小数据量设计的,在面对大数据量时难以为继。新的攻击手段层出不穷,需要检测的数据越来越多,传统的分析技术已是不堪重负。
一方面,高速海量安全数据的采集和存储变得困难,而异构数据的存储和管理同样变得困难;而传统的安全分析技术对历史数据的检测能力很弱,对安全事件的调查效率十分低;以往,安全系统相互独立,无法有效地进行协同工作,对于趋势性的威胁更是无法预测,在应对当今诸如APT等高级威胁的攻击时防护效果十分薄弱。另一方面,传统的分析方法大都采用基于规则和特征的分析引擎,必须要有规则库和特征库才能工作,而规则和特征只能对已知的攻击和威胁进行描述,无法识别未知的攻击,或者是尚未被描述成规则的攻击和威胁。
可见,对于大数据安全分析而言,如何以安全数据自身的特点和安全分析为目标,让大数据安全分析的应用更加凸显其价值是十分必要的。
如今,对于信息与网络安全分析出现了两个基本趋势:情境感知的安全分析与智能化的安全分析。Gartner曾经在2010年的两份报告中分别指出:“未来的信息安全将是情境感知的和自适应的。”以及“要为企业安全智能的兴起做好准备。”
情境感知的安全分析,更多地需要利用相关性要素信息的综合研判来提升安全决策的能力,例如:资产感知、位置感知、拓扑感知、应用感知、身份感知、内容感知,等等。利用情境感知分析技术,安全分析会得以在纵深方面得到极大的扩展;而更多的安全要素信息的纳入,也拉升了分析的空间和时间范围。而安全智能则更加强调将过去分散的安全信息进行集成与关联,独立的分析方法和工具进行整合形成交互,最终实现智能化的安全分析与决策。
从长远看,借助大数据安全分析技术,能够更好地解决大量安全要素信息的采集、存储的问题,借助基于大数据分析技术的机器学习和数据挖据算法,亦能够更加智能地洞悉信息与网络安全的态势,从而更加主动、弹性地去应对新型复杂的威胁和未知多变的风险。在未来一段时期内,关于大数据安全分析技术的探究,必会成为新的市场热点。

以上是小编为大家分享的关于大数据时代安全要怎样的分析技术的相关内容,更多信息可以关注环球青藤分享更多干货

⑷ 大数据与大规模网络安全感知技术初探

大数据与大规模网络安全感知技术初探
快速发展的互联网技术不断地改变人们的生活方式,然而,多层面的安全威胁和安全风险也不断出现。对于一个大型网络,在网络安全层面,除了访问控制、入侵检测、身份识别等基础技术手段,需要安全运维和管理人员能够及时感知网络中的异常事件与整体安全态势。对于安全运维人员来说,如何从成千上万的安全事件和日志中找到最有价值、最需要处理和解决的安全问题,从而保障网络的安全状态,是他们最关心也是最需要解决的问题。与此同时,对于安全管理者和高层管理者而言,如何描述当前网络安全的整体状况,如何预测和判断风险发展的趋势,如何指导下一步安全建设与规划,则是一道持久的难题。
随着大数据技术的成熟、应用与推广,网络安全态势感知技术有了新的发展方向,大数据技术特有的海量存储、并行计算、高效查询等特点,为大规模网络安全态势感知的关键技术创造了突破的机遇。本文将对大规模网络环境下的安全态势感知、大数据技术在安全感知方面的促进做一些探讨。
对于一个大规模的网络而言,面临的风险也是巨大的,可分为广度风险和深度风险。从广度上讲,以中国移动的CMNET网络为例,所辖IP地址超过3000万个,提供对外服务的网站数千个,规模大、节点类型丰富多样,伴随其中的安全问题随网络节点数量的增加呈指数级上升。从深度上讲,下一代移动互联网安全威胁主要表现在传统攻击依然存在且手段多样、APT(高级持续性威胁)攻击逐渐增多且造成的损失不断增大。而攻击者的工具和手段呈现平台化、集成化和自动化的特点,具有更强的隐蔽性、更长的攻击与潜伏时间、更加明确和特定的攻击目标。以上造成了下一代安全威胁具有更强的杀伤能力与逃避能力。结合广度风险与深度风险来看,大规模网络所引发的安全保障的复杂度激增,主要面临的问题包括:安全数据量巨大;安全事件被割裂,从而难以感知;安全的整体状况无法描述。
网络安全感知能力具体可分为资产感知、脆弱性感知、安全事件感知和异常行为感知4个方面。资产感知是指自动化快速发现和收集大规模网络资产的分布情况、更新情况、属性等信息;脆弱性感知则包括3个层面的脆弱性感知能力:不可见、可见、可利用;安全事件感知是指能够确定安全事件发生的时间、地点、人物、起因、经过和结果;异常行为感知是指通过异常行为判定风险,以弥补对不可见脆弱性、未知安全事件发现的不足,主要面向的是感知未知的攻击。
一个相对完整的网络安全感知的能力模型与架构设计如下图所示:
随着Hadoop、NoSQL等技术的兴起,BigData大数据的应用逐渐增多和成熟,而大数据自身拥有Velocity快速处理、Volume大数据量存储、Variety支持多类数据格式三大特性。大数据的这些天生特性,恰巧可以用于大规模网络的安全感知。首先,多类数据格式可以使网络安全感知获取更多类型的日志数据,包括网络与安全设备的日志、网络运行情况信息、业务与应用的日志记录等;其次,大数据量存储与快速处理为高速网络流量的深度安全分析提供了技术支持,可以为高智能模型算法提供计算资源;最后,在异常行为的识别过程中,核心是对正常业务行为与异常攻击行为之间的未识别行为进行离群度分析,大数据使得在分析过程中采用更小的匹配颗粒与更长的匹配时间成为可能。
中国移动自2010年起在云计算和大数据方面就开始了积极探索。中国移动的“大云”系统目前已实现了分布式海量数据仓库、分布式计算框架、云存储系统、弹性计算系统、并行数据挖掘工具等关键功能。在“大云”系统的基础上,中国移动的网络安全感知也具备了一定的技术积累,进行了大规模网络安全感知和防御体系的技术研究,在利用云平台进行脆弱性发现方面的智能型任务调度算法、主机和网络异常行为发现模式等关键技术上均有突破,在安全运维中取得了一些显著的效果。
大数据的出现,扩展了计算和存储资源,提供了基础平台和大数据量处理的技术支撑,为安全态势的分析、预测创造了无限可能。

⑸ 大数据安全面临哪些风险及如何防护

现如今大数据已经逐渐改变了我们的生活方式,成为必不可少的存在,在我们享野首受大数据给我们带来的便利时,安全性无论对于企业还是个人都是必须要解决的重大课题。

总结大数据面临的三大风险问题如下

1.个人隐私问题凸显

例如大数据中的精准营销定位功能,通常是依赖于高度采集个人信息,通过多种关联技术分析来实现信息推广,精准营销。企业会掌握用户大量的数据,不排除隐私部分的敏感数据,一旦服务器遭到不法分子攻击导致数据泄露,很可能危及用户的隐私、财产甚至是人身安全。

2.数据准确与权威性

大数据通过各种渠道获取大量数据进行计算分析,企业通常直接通过分析结果进行支持决策,有时候企业只看结果,却忽略了源头数据的准确性,不准确的数据直接影响大数据分析的结果和企业的利益,错误的指导会对企业带来一定的风险与损失。

3.基础设施维护压力

数据量越大,对基础设施的性能要求就越高,同样对于网络的安全、恢复、防范依赖性就越强,一定程度上对企业设施安全的维护造成了压力,基础设施建设不完善、维护不到位,抱有没出问题就得过且过的态度,时刻面临被攻击的危险可能。

针对上述问题的防护措施如下

1.对用户早脊哗而言

虽然在互联网时代下要完全保护自己的隐私是比较困难的,但也要加强自身信息的防范意识。注册账号时,遵循最少原则,不要随意泄露敏感信息,降陆行低隐私信息被泄露的危险;

2.对企业而言

加强数据安全管理,实现数据的治理与清洗,从源头保证数据的一致性、准确性。首先升级基础服务器环境,建立多重防护、多级互联体系结构,确保大数据处理环境可信度。其次全方位实时监控、审计、防护,防止敏感数据泄露、丢失,确保数据风险可控,并不断通过体系化的大数据安全评估,形成数据安全治理的闭环管理;

3.对政策而言

应该加强对数据信息的保护,对数据的使用进行一定的监管与限制,对非法盗用、滥用数据信息者严惩,之后加强对技术安全研发使用的推广与实施,保证数据安全,加强对数据治理的力度。

大数据时代的到来,可以为我们的生活带来切实的利益,行业的数据规范正在建立并逐步趋于完善,对于我们来说,既不要因为安全风险问题而排斥大数据,也不要疏忽于对个人/企业信息的保护,合理看待和利用大数据,让其发挥真正的价值。

⑹ 大数据分析 挖掘出的五大安全线索

大数据分析:挖掘出的五大安全线索

随着安全分析技术不断成熟,企业会惊喜地发现对安全相关数据的系统分析能够为他们挖掘出很多有价值的信息,下面是5个从安全分析中挖掘出的信息:

1、挖掘出你不知道需要提出的问题

IT基础设施和安全工具产生的巨量非结构化数据让安全分析师甚至很难开始查询数据,以回答有关企业风险状态的常见问题。让分析程序回答这些显而易见的问题有时候会出现意想不到的回报,因为会出现其他模式来回答安全团队可能没想过要提出的问题。

“通常情况下,在数据被存储和访问之前,企业可能不知道他们需要什么或者他们想要解决什么问题,”OpenDNS公司首席技术官Dan Hubbard表示,“分析技术可以发现安全情报,并挖掘出我们不知道的问题。”

更重要的是,这些趋势的可视化还可以帮助更好地与业务部门沟通风险,并解决业务领导可能提出的重要问题。

安全服务供应商BTB Security公司管理合伙人Ron Schlecht表示,“他们会开始提出很好的问题,所以你应该寻找一个不同的视角,对于你应该寻找的东西,以及你应该如何看待这些问题,最好与不同的业务领导进行合作,这会让大家明白安全对整个企业的重要性。”

2、找出不同数据来源之间的关联

通常情况下,安全分析程序会在数据来源之间进行关联,而安全团队可能从来没有发现过这种关联。

“大多数安全分析程序需要将来自不同来源的数据整合到单个引擎,来进行分析,查找模式和异常情况,”Cambridge Intelligence公司北美地区总经理Corey Lanum表示,“当我的客户从不同数据来源加载数据时,他们通常立即会看到原本存储在不同数据库没有关联的数据元素之间存在的关联。”

这种类型的建模可以用于发现网络不同部分、不同部门信息之间的关联。

3、发现你永远想象不到的数据泄漏

安全分析技术给你带来的第一个惊喜是让你发现想象不到的数据泄漏的具体证据。

RSA公司高级产品营销经理Matthew Gardiner表示:“经常会挖掘出的信息是,他们会发现已经持续了一段时间的数据泄漏。”他解释说,这可能不是某种复杂的民族国家间谍活动导致的泄漏,或者黑社会性质犯罪阻止窃取的数据。

他说道,“只是数据转移到企业外部不知明的地方造成的泄漏,接下来的问题是,搞清楚如何控制数据流向。”

4、发现你从来不知道的IT操作问题

安全分析技术的优势可能会超出IT安全的范畴,转而深入IT操作。在很多情况下,对安全数据进行建模和点连接还可以发现IT操作问题,这些问题可能会影响可操作性、工作流和效率。

Schlecht表示:“让很多企业惊讶的一个好处是,安全分析还能够帮助找出IT操作问题,这是因为分析程序能够获得一定的可视性。”

例如,多年前,Schlecht曾在企业内部工作,他发现一个新的分析程序不仅能帮助发现安全问题,还能够发现企业应用程序的开发问题,而这个问题让其开发团队困扰了数小时。在检查应用程序和安全事件日志后,一些完全无关的东西帮助找出了问题的根源。

5、找出你不知道的策略违规行为

分析技术还提供了另一个惊喜:发现企业中的策略违规行为,这通常是一把双刃剑。这些不一定是恶意行为,但是确实违反了策略,麻烦的是,一旦安全团队看到这些违规行为,他们就会采取行动,而不管多么麻烦。

以上是小编为大家分享的关于大数据分析 挖掘出的五大安全线索的相关内容,更多信息可以关注环球青藤分享更多干货

⑺ 大数据环境下的网络安全分析

大数据环境下的网络安全分析
“大数据”一词常被误解。事实上,使用频率太高反而使它几乎没有什么意义了。大数据确实存储并处理大量的数据集合,但其特性体现远不止于此。

在着手解决大数据问题时,将其看作是一种观念而不是特定的规模或技术非常有益。就其最简单的表现来说,大数据现象由三个大趋势的交集所推动:包含宝贵信息的大量数据、廉价的计算资源、几乎免费的分析工具。
大数据架构和平台算是新事物,而且还在以一种非凡的速度不断发展着。商业和开源的开发团队几乎每月都在发布其平台的新功能。当今的大数据集群将会与将来我们看到的数据集群有极大不同。适应这种新困难的安全工具也将发生变化。在采用大数据的生命周期中,业界仍处于早期阶段,但公司越早开始应对大数据的安全问题,任务就越容易。如果安全成为大数据集群发展过程中的一种重要需求,集群就不容易被黑客破坏。此外,公司也能够避免把不成熟的安全功能放在关键的生产环境中。
如今,有很多特别重视不同数据类型(例如,地理位置数据)的大数据管理系统。这些系统使用多种不同的查询模式、不同的数据存储模式、不同的任务管理和协调、不同的资源管理工具。虽然大数据常被描述为“反关系型”的,但这个概念还无法抓住大数据的本质。为了避免性能问题,大数据确实抛弃了许多关系型数据库的核心功能,却也没犯什么错误:有些大数据环境提供关系型结构、业务连续性和结构化查询处理。
由于传统的定义无法抓住大数据的本质,我们不妨根据组成大数据环境的关键要素思考一下大数据。这些关键要素使用了许多分布式的数据存储和管理节点。这些要素存储多个数据副本,在多个节点之间将数据变成“碎片”。这意味着在单一节点发生故障时,数据查询将会转向处理资源可用的数据。正是这种能够彼此协作的分布式数据节点集群,可以解决数据管理和数据查询问题,才使得大数据如此不同。
节点的松散联系带来了许多性能优势,但也带来了独特的安全挑战。大数据数据库并不使用集中化的“围墙花园”模式(与“完全开放”的互联网相对而言,它指的是一个控制用户对网页内容或相关服务进行访问的环境),内部的数据库并不隐藏自己而使其它应用程序无法访问。在这儿没有“内部的”概念,而大数据并不依赖数据访问的集中点。大数据将其架构暴露给使用它的应用程序,而客户端在操作过程中与许多不同的节点进行通信。
规模、实时性和分布式处理:大数据的本质特征(使大数据解决超过以前数据管理系统的数据管理和处理需求,例如,在容量、实时性、分布式架构和并行处理等方面)使得保障这些系统的安全更为困难。大数据集群具有开放性和自我组织性,并可以使用户与多个数据节点同时通信。验证哪些数据节点和哪些客户应当访问信息是很困难的。别忘了,大数据的本质属性意味着新节点自动连接到集群中,共享数据和查询结果,解决客户任务。
嵌入式安全:在涉及大数据的疯狂竞赛中,大部分的开发资源都用于改善大数据的可升级、易用性和分析功能上。只有很少的功能用于增加安全功能。但是,你希望得到嵌入到大数据平台中的安全功能。你希望开发人员在设计和部署阶段能够支持所需要的功能。你希望安全功能就像大数据集群一样可升级、高性能、自组织。问题是,开源系统或多数商业系统一般都不包括安全产品。而且许多安全产品无法嵌入到Hadoop或其它的非关系型数据库中。多数系统提供最少的安全功能,但不足以包括所有的常见威胁。在很大程度上,你需要自己构建安全策略。
应用程序:面向大数据集群的大多数应用都是Web应用。它们利用基于Web的技术和无状态的基于REST的API。虽然全面讨论大数据安全的这个问题超出了本文的范围,但基于Web的应用程序和API给这些大数据集群带来了一种最重大的威胁。在遭受攻击或破坏后,它们可以提供对大数据集群中所存储数据的无限制访问。应用程序安全、用户访问管理及授权控制非常重要,与重点保障大数据集群安全的安全措施一样都不可或缺。
数据安全:存储在大数据集群中的数据基本上都保存在文件中。每一个客户端应用都可以维持其自己的包含数据的设计,但这种数据是存储在大量节点上的。存储在集群中的数据易于遭受正常文件容易感染的所有威胁,因而需要对这些文件进行保护,避免遭受非法的查看和复制。

⑻ 大数据安全问题及应对思路研究

大数据安全问题及应对思路研究

随着互联网、物联网、云计算等技术的快速发展,全球数据量出现爆炸式增长。与此同时,云计算为这些海量的多样化数据提供了存储和运算平台,分布式计算等数据挖掘技术又使得大数据分析规律、研判趋势的能力大大增强。在大数据不断向各个行业渗透、深刻影响国家的政治、经济、民生和国防的同时,其安全问题也将对个人隐私、社会稳定和国家安全带来巨大的潜在威胁,如何应对面临巨大挑战。

一、大数据安全关键问题

随着数字化进程不断深入,大数据逐步渗透至金融、汽车、制造、医疗等各个传统行业,甚至到社会生活的每个角落,大数据安全问题影响也日益增大。

(一)国家数据资源大量流失。互联网海量数据的跨境流动,加剧了大数据作为国家战略资源的大量流失,全世界的各类海量数据正在不断汇总到美国,短期内还看不到转变的迹象。随着未来大数据的广泛应用,涉及国家安全的政府和公用事业领域的大量数据资源也将进一步开放,但目前由于相关配套法律法规和监管机制尚不健全,极有可能造成国家关键数据资源的流失。

(二)大数据环境下用户隐私安全威胁严重。随着大数据挖掘分析技术的不断发展,个人隐私保护和数据安全变得非常紧迫。一是大数据环境下人们对个人信息的控制权明显下降,导致个人数据能够被广泛、详实的收集和分析。二是大数据被应用于攻击手段,黑客可最大限度地收集更多有用信息,为发起攻击做准备,大数据分析让黑客的攻击更精准。三是随着大数据技术发展,更多信息可以用于个人身份识别,个人身份识别信息的范围界定困难,隐私保护的数据范围变得模糊。四是以往建立在“目的明确、事先同意、使用限制”等原则之上的个人信息保护制度,在大数据场景下变得越来越难以操作。

(三)基于大数据挖掘技术的国家安全威胁日益严重。大数据时代美国情报机构已抢占先机,美国通过遍布在全球的国安局监听机构如地面卫星站、国内监听站、海外监听站等采集各种信息,对采集到的海量数据进行快速预处理、解密还原、分析比对、深度挖掘,并生成相关情报,供上层决策。2013年6月底,美中情局前雇员斯诺登爆料,美国情报机关通过思科路由器对中国内地移动运营商、中国教育和科研计算机网等骨干网络实施长达4年之久的长期监控,以获取网内海量短信数据和流量数据。

(四)基础设施安全防护能力不足引发数据资产失控。一是基础通信网络关键产品缺乏自主可控,成为大数据安全缺口。我国运营企业网络中,国外厂商设备的现网存量很大,国外产品存在原生性后门等隐患,一旦被远程利用,大量数据信息存在被窃取的安全风险。二是我国大数据安全保障体系不健全,防御手段能力建设处于起步阶段,尚未建立起针对境外网络数据和流量的监测分析机制,对棱镜监听等深层次、复杂、高隐蔽性的安全威胁难以有效防御、发现和处置。

二、国外大数据安全相关举措及我国应对思路

目前世界各国均通过出台国家战略、促进数据融合与开放、加大资金投入等推动大数据应用。相比之下,各国在涉及大数据安全方面的保障举措则起刚刚起步,主要集中在通过立法加强对隐私数据的保护。德国在2009年对《联邦数据保护法》进行修改并生效,约束范围包括互联网等电子通信领域,旨在防止因个人信息泄露导致的侵犯隐私行为;印度在2012年批准国家数据共享和开放政策的同时,通过拟定非共享数据清单以保护涉及国家安全、公民隐私、商业秘密和知识产权等数据信息;美国在2014年5月发布《大数据:把握机遇,守护价值》白皮书表示,在大数据发挥正面价值的同时,应该警惕大数据应用对隐私、公平等长远价值带来的负面影响,建议推进消费者隐私法案、通过全国数据泄露立法、修订电子通信隐私法案等。

我国在布局、鼓励和推动大数据发展应用的同时,也应提早谋划、积极应对大数据带来的安全挑战,从战略制定、法律法规、基础设施防护等方面应对大数据安全问题。

(一)将大数据资源保护上升为国家战略,建立分级分类安全管理机制。一是把数据资源视为国家战略资源,将大数据资源保护纳入到国家网络空间安全战略框架中,构建大数据环境下的信息安全体系,提高应急处置能力和安全防范能力,提升服务能力和运作效率。二是通过国家层面的战略布局,明确大数据资源保护的整体规划和近远期重点工作。三是对国内大数据资源按实施分级分类安全保护思路,保障数据安全、可靠,积极开展大数据安全风险评估工作,针对不同级别大数据特点加强安全防范。五是尽快制定不同级别的大数据采集、存储、备份、迁移、处理和发布等关键环节的安全规范和标准,配套完善相应的监管措施。

(二)完善法律法规,加大个人信息保护监管力度。一是积极推动个人信息保护法律的立法工作,探索通过技术标准、行业自律等手段解决法律出台前的个人信息保护问题。加快《网络安全法》的出台,在《网络安全法》中对电信和互联网行业用户信息保护作出明确法律界定,为相关工作开展提供法律依据。二是加强对个人隐私保护的行政监管,同时要加大对侵害个人隐私行为的打击力度,建立对个人隐私保护的测评机制,推动大数据行业的自律和监督。

(三)加强国家信息基础设施保护,提升大数据安全保障与防范能力。一是促进技术研究和创新,通过加大财政支持力度,激励关系国家安全和稳定的政府和国有企事业单位采用安全可控的产品,提升我国基础设施关键设备的安全可控水平。二是加强大数据信息安全系统建设,针对大数据的收集、处理、分析、挖掘等过程设计与配置相应的安全产品,并组成统一的、可管控的安全系统,推动建立国家级、企业级的网络个人信息保护态势感知、监控预警、测评认证平台。三是充分利用大数据技术应对网络攻击,通过大数据处理技术实现对网络异常行为的识别和分析,基于大数据分析的智能驱动型安全模型,把被动的事后分析变成主动的事前防御;基于大数据的网络攻击追踪,实现对网络攻击行为的溯源。

以上是小编为大家分享的关于大数据安全问题及应对思路研究的相关内容,更多信息可以关注环球青藤分享更多干货

⑼ 大数据背景下的信息安全问题探讨

大数据背景下的信息安全问题探讨
大数据具有体量巨大、类型繁杂、处理速度快、价值密度低四大特点,因此,对于个人来说,难以处理极其庞大的数据,只有国家和大型企业等组织或集团才有可能获取到各种敏感信息;大数据所搜集提取的个人信息可能连本人都不完全知晓,比如个人的行为特征、语言风格、爱好兴趣等。在大数据时代如何保护个人敏感信息或隐私,必将成为高难度的世界课题。
2013年6月,美国前中情局雇员斯诺登曝光了始于2007年小布什时期美国国家安全局和联邦调查局启动的代号为“棱镜”的秘密项目。美国国家安全局通过接入雅虎、谷歌、微软、苹果等9家美国互联网公司中心服务器,对邮件、图片、视频、电话等10类数据进行监控,以搜集情报,监视民众的网络活动。“棱镜”项目缘于2004年美国政府的“星风”监视计划。但是,当时小布什政府由于法律程序等敏感问题而做出让步,美国本土的监听项目有所缩减。为了“星风”计划的继续进行,小布什政府通过司法程序将“星风”监视计划分拆成由国家安全局执行的4个监视计划,包括“棱镜”、“主干道”、“码头”和“核子”,均交由美国家安全局执掌。“棱镜”项目用于监视互联网个人信息。“主干道”和“码头”项目负责存储和分析通信和互联网上数以亿兆计的“元数据”。元数据主要指通话或通信的时间、地点、使用设备、参与者等,不包括电话或邮件等的内容。“核子”项目负责内容信息的获取,截获电话通话者对话内容及关键词,通过拦截通话以及通话者所提及的地点,来实现日常的监控。由此可见,斯诺登不仅揭露了美国的大规模窃听计划,更揭示了大数据时代国家信息安全保护问题。大数据的分析与使用,无论对个人(如跟踪健康状况防范疾病)、对企业(如了解市场偏好以有效安排产品设计生产营销)乃至对国家(如防范疫情或恐怖主义)显然都有巨大的好处,从商业用途来说,谷歌、微软、雅虎等互联网公司,完全可以通过它们掌握到的数以百万计、千万计甚至亿万计的数据,经由“超级计算”,准确推断消费者的爱好及习惯、商品的销售额、疾病疫情的发展趋势。商业如此,在政治、经济、军事等方面亦存在诸多的用途和潜在利益。像“棱镜”计划里涉及的谷歌、雅虎、苹果、微软等大网站,人们每天由于各种业务需要,会把大量个人信息输入其中,但常常并不被事先告知数据的用途。而这些数据会被企业或政府用来进行一些特殊的计算或分析,如通过对大数据的分析预测来对人们尚未实施的行为进行惩罚。比如“大数据之父”舍恩伯格曾披露过一个例子:在美国有一个计划名为“预测式配警”,通过对大数据分析来预测美国某个城市的某条街道的某个时段是犯罪高峰时段,然后在那个位置部署更多的警力。从此该地区居民将长时间被监控,这是一种变相的侵犯或惩罚。他们不是因为做错事,而是因为某个计算机的算法预测他们可能做错事而被惩罚了,显然这是不公平的。美国国安局拥有的正是类似的一套基于“大数据”的新型情报收集系统,这套名为“无界爆料”的系统,以30天为周期,从全球网络系统中接收到970亿条讯息,再通过比对信用卡或者通讯记录等方式,能几近真实地还原个人的实时状况。当然,像谷歌这样的商业组织也有可能掌握同样量级的信息而进行商业预测分析。因此,必须建立一套规则予以规范和约束对大数据的收集和使用。第一,虽然这些信息储存在不同的服务器上,但这些数据是用户的资产,拥有权属于用户自己而不是这些公司,这是必须明确的,就像财产所有权一样,个人隐私数据也应该有所有权。第二,利用大数据、云计算技术给用户提供信息服务的公司或企业,需要把收集到的用户数据进行安全存储和传输,这是企业的责任和义务。第三,如果企业或政府要使用用户的信息,一定要让用户有知情权和选择权,泄露用户数据甚至牟利,不仅要被视作不道德的行为,而且是非法行为。大数据时代的数据存储和应用方式是跨地域甚至是跨国界的。作为国家层面要将大数据上升为国家战略,奥巴马政府在2012年3月将“大数据战略”上升为最高国策,像陆权、海权、空权一样,将对数据的占有和控制作为重要的国家核心能力。我国也应从国家高度重视大数据,在对其进行安全保护、政策制定需要重视三个方面:一是要正视数据霸权,要清醒认识到我国在网络控制权、关键技术和高端设备等方面,还受制于西方。二是要明确主权,数据作为一种重要的战略资源,无论是个人拥有还是国家拥有,都要纳入到主权范围里面来考虑。三是要有治权,因为有主权不一定能够管治。比如:数据存到国外,云计算跨越国境,可能不在你的主权范围之内。要区别对待不同的数据,对确需保护的数据,必须有切实可靠的手段进行有效管理。如果做不到对数据的有效管理,大数据就必然面临失控的危险。政策界定安全责任问题。大数据的安全问题涉及政府、相关企业、网络运营商、服务提供者,以及数据产生者、使用者等方方面面,必须对各自的安全责任有明晰的政策界定。信息安全风险存在于数据的全生命周期之中,从技术思路、产品开发、用户使用、服务管理,各个环节均要分担相应的安全责任。监管保障基础设施安全问题。大数据的发展离不开电信网络甚至工控系统等关键基础设施,其安全可靠同样依赖于这些基础设施,受供应链全球化、产业私有化的影响,网络与关键基础设施间的安全日趋复杂,一国的大数据可能存放在别国的网络中,一国的基础设施可能同时服务于多个国家,高度的全球相互依赖性,挑战着原有的国家主权观念。所以,关键基础设施的安全监管体系十分重要,我国需要尽快确立对供应链的实质性国家安全审查和对基础网络的常态化安全监管。
网络空间冲突管理问题。大数据的资源价值越来越高,围绕大数据的争夺和冲突就越来越激烈。大数据的生成、处理和利用方式,将极大改变各种冲突的表现方式和破坏烈度。通过立法与国际合作应对包括知识产权的保护、网络犯罪的处置、网络破坏活动特别是网络恐怖主义的打击以及网络战争的威胁。

⑽ 大数据应用模式及安全风险分析有哪些

当前各个领域数据生成速度逐渐加快,需要处理的数据量急剧膨胀。这些巨大的数据资源蕴藏着潜在的价值,需要对其进行有效的分析和利用。当前数据的特点除了数量庞大之外,数据类型也变得多样化,其中包括了结构化数据、半结构化数据以及非结构化数据。这些数量庞大、种类繁多的海量数据,给传统分析工具带来了巨大的挑战。当前对数据的分析不再是简单的生成统计报表,而是利用复杂的分析模型进行深人的分析,传统分析技术例如关系数据库技术已经不能满足其要求。在扩展性上,通过增加或更换内存、CPU、硬盘等设备原件以打一展单个节点的能力的纵向打一展(scale up)系统遇到了瓶颈;只有通过增加计算节点,连接成大规模集群,进行分布式并行计算和管理的横向打一展(scale out )系统才能满足大数据的分析需求[u。因此传统工具在扩展性上遇到了障碍,必须寻求可靠的数据存储和分析技术来分析和利用这些庞大的资源。利用云计算平台搭建Hadoop计算框架成为当前处理大数据的主要手段。然而由于云计算和Hadoop应用的特点和自身安全机制薄弱,不可避免地带来了安全风险。
1、大数据应用模式
云计算(Cloud Computing)是一种基于Internet的计算,是以并行计算(Parallel Computing )、分布式计算(Distributed Computing)和网格计算(Grid Compu-tin助为基础,融合了网络存储、虚拟化、负载均衡等技术的新兴产物。它将原本需要由个人计算机和私有数据中心执行的任务转移给具备专业存储和计算技术的大型计算中心来完成,实现了计算机软件、硬件等计算资源的充分共享[z}。企业或个人不再需要花费大量的费用在基础设施的购买上,更不需要花费精力对软硬件进行安装、配置和维护,这些都将由云计算服务商CSP( Cloud Service Provider)提供相应的服务。企业或个人只需按照计时或计量的方式支付租赁的计算资源。云计算服务商拥有大数据存储能力和计算资源,被视为外包信息服务的最佳选择[31因此大数据的应用往往与云计算相结合。
Hadoop是当前最广为人知的大数据技术实施方案,它是Google云计算中的Map/Rece}4}和GFS( Google File System)的开源实现。Hadoop提供了一种计算框架,其最为核心的技术是HDFS ( HadoopDistributed File System)以及MapReee } HDFS提供了高吞吐量的分布式文件系统,而MapReee是大型数据的分布式处理模型。Hadoop为大数据提供了一个可靠的共享存储和分析系统[5-6 }v
尽管有一些组织自建集群来运行Hadoop,但是仍有许多组织选择在租赁硬件所搭建的云端运行Hadoop或提供Hadoop服务。例如提供在公有或私有云端运行Hadoop的Cloudera,还有由Amazon提供的称为Elastic MapReee的云服务等f}l。因此将云计算与Hadoop结合处理大数据已成为一种趋势。
2、大数据安全风险分析
随着大数据应用范围越来越广,对数据安全的需求也越来越迫切。
由于云计算的特点是将数据外包给云服务商提供服务,这种服务模式将数据的所有权转移给了CSP,用户失去了对物理资源的直接控制[A1。而云中存储的大数据通常是以明文的方式存在的,CSP对数据具有底层控制权,恶意的CSP有可能在用户不知情的情况下窃取用户数据,而云计算平台亦可能受到攻击致使安全机制失效或被非法控制从而导致非授权人读取数据,给大数据安全带来了威胁。
Hadoop在设计之初并未考虑过安全问题,在Ha-doop 1. 0. 0和Cloudera CDH3版本之后,Hadoop加人了Kerberos的身份认证机制和基于ACL的访问控制机制[91。即使在安全方面增加了身份认证和访问控制策略,Hadoop的安全机制仍然非常薄弱,因为Ker-beros的认证机制只应用于客户机(Clients )、密钥分发中心(I}ey Distribution Center, I}DC )、服务器(Serv-er)之间,只是针对机器级别的安全认证,并未对Ha-doop应用平台本身进行认证[}o}。而基于ACL的访问控制策略需要通过在启用ACL之后,对hadoop-policy. xml中的属性进行配置,其中包括9条属性,它们限制了用户与组成员对Hadoop中资源的访问以及Datanode和Namenode或Jobtracke:和Tasktrackers等节点间的通信,但该机制依赖于管理员对其的配置[川,这种基于传统的访问控制列表容易在服务器端被篡改而不易察觉。而且基于ACL的访问控制策略粒度过粗,不能在MapRece过程中以细粒度的方式保护用户隐私字段。况且针对不同的用户和不同应用,访问控制列表需要经常作对应的更改,这样的操作过于繁琐且不易维护。因此Hadoop自身的安全机制是不完善的。
2.1 不同应用模式下CSP及Uers带来的安全风险
云计算中Hadoop有多种应用模式。在私有云中搭建Hadoop,即企业自己应用Hadoop,使用该平台的是企业内部各个部门的员工,外部人员无法访问和使用这些资源。这时的CSP指的是Hadoop的创建和管理者,IaaS级和PaaS级CSP为相同的实体;在公有云平台应用Hadoop , C SP有2级,IaaS级CSP,提供基础设施;PaaS级C SP,负责Hadoop的搭建和管理。这时两级CSP往往是不同的实体。

阅读全文

与大数据安全分析研究相关的资料

热点内容
企鹅号视频app叫什么 浏览:157
indd文件用ps打不开 浏览:759
磁盘清理后找不到文件 浏览:379
会计学科代码 浏览:507
文件夹选项没有了xp 浏览:167
win7更改文件格式 浏览:195
对件内文件排序通常按照什么顺序 浏览:12
win10怎样修复系统文件在哪里 浏览:772
frs文件复制服务 浏览:305
有图片文件相册不显示 浏览:354
一般网站名是什么样的 浏览:823
win10用户下有乱码文件名 浏览:973
测风塔数据有哪些 浏览:196
哪些财务数据不能作假 浏览:349
华为待机接收不到微信 浏览:199
sqlite数据库表设计 浏览:627
微信小程序可以关闭吗 浏览:81
数控编程需要掌握什么 浏览:322
找不到离线文件怎么办 浏览:134
c盘开机文件在哪里 浏览:275

友情链接