⑴ 大數據分析有哪些基本方向
【導讀】跟著大數據時代的降臨,大數據剖析也應運而生。隨之而來的數據倉庫、數據安全、數據剖析、數據發掘等等環繞大數據的商業價值的使用逐漸成為職業人士爭相追捧的利潤焦點。那麼,大數據剖析有哪些根本方向呢?
1.可視化剖析
不管是對數據剖析專家仍是普通用戶,數據可視化是數據剖析東西最根本的要求。可視化能夠直觀的展現數據,讓數據自己說話,讓觀眾聽到成果。
2.數據發掘演算法
可視化是給人看的,數據發掘便是給機器看的。集群、切割、孤立點剖析還有其他的演算法讓咱們深入數據內部,發掘價值。這些演算法不只要處理大數據的量,也要處理大數據的速度。
3.猜測性剖析才能
數據發掘能夠讓剖析員更好的理解數據,而猜測性剖析能夠讓剖析員根據可視化剖析和數據發掘的成果做出一些猜測性的判別。
4.語義引擎
咱們知道由於非結構化數據的多樣性帶來了數據剖析的新的應戰,咱們需求一系列的東西去解析,提取,剖析數據。語義引擎需求被設計成能夠從「文檔」中智能提取信息。
5.數據質量和數據管理
數據質量和數據管理是一些管理方面的最佳實踐。經過標准化的流程和東西對數據進行處理能夠保證一個預先界說好的高質量的剖析成果。
6.數據存儲,數據倉庫
數據倉庫是為了便於多維剖析和多角度展現數據按特定形式進行存儲所建立起來的聯系型資料庫。在商業智能系統的設計中,數據倉庫的構建是關鍵,是商業智能系統的根底,為商業智能系統供給數據抽取、轉換和載入(ETL),並按主題對數據進行查詢和拜訪,為聯機數據剖析和數據發掘供給數據平台。
以上就是小編今天給大家整理分享關於「大數據分析有哪些基本方向?」的相關內容希望對大家有所幫助。小編認為要想在大數據行業有所建樹,需要考取部分含金量高的數據分析師證書,這樣更有核心競爭力與競爭資本。
⑵ 網路安全與大數據技術應用探討論文
網路安全與大數據技術應用探討論文
摘要: 隨著互聯網技術的高速發展與普及,現如今互聯網技術已經廣泛應用於人們工作與生活之中,這給人們帶來了前所未有的便利,但與此同時各種網路安全問題也隨之顯現。基於此,本文主要介紹了大數據技術在網路安全領域中的具體應用,希望在網路系統安全方面進行研究的同時,能夠為互聯網事業的持續發展提供可行的理論參考。
關鍵詞: 網路安全;大數據技術;應用分析
前言
隨著近年來互聯網技術的不斷深入,網路安全事故也隨之頻頻發生。出於對網路信息安全的重視,我國於2014年成立了國家安全委員會,正式將網路安全提升為國家戰略部署,這同時也表示我國網路信息安全形勢不容樂觀,網路攻擊事件處於高發狀態。木馬僵屍病毒、惡意勒索軟體、分布式拒絕服務攻擊、竊取用戶敏感信息等各類網路攻擊事件的數量都處於世界前列。時有發生的移動惡意程序、APT、DDOS、木馬病毒等網路攻擊不僅會嚴重阻礙網路帶寬、降低網路速度、並且對電信運營商的企業聲譽也會產生一定影響。根據大量數據表明,僅僅依靠傳統的網路防範措施已經無法應對新一代的網路威脅,而通過精確的檢測分析從而在早期預警,已經成為現階段網路安全能力的關鍵所在。
1網路安全問題分析
網路安全問題不僅涉及公民隱私與信息安全,更關乎國事安全,例如雅虎的信息泄露,導致至少五億條用戶信息被竊;美國棱鏡門與希拉里郵件門等等事件都使得網路安全問題進一步升級、擴大。隨著互聯網構架日益復雜,網路安全分析的數據量也在與日俱增,在由TB級向PB級邁進的過程,不僅數據來源豐富、內容更加細化,數據分析所需維度也更為廣泛。伴隨著現階段網路性能的增長,數據源發送速率更快,對安全信息採集的速度要求也就越高,版本更新延時等導致的Odav等漏洞日漸增多,網路攻擊的影響范圍也就進一步擴大;例如APT此類有組織、有目標且長期潛伏滲透的多階段組合式攻擊更加難以防範,唯有分析更多種類的安全信息並融合多種手段進行檢測抵禦。在傳統技術架構中,大多使用結構化資料庫來進行數據存儲,但由於數據存儲的成本過高,系統往往會將原始數據進行標准化處理後再進行存儲,如此易導致數據的丟失與失真以及歷史數據難以保存而造成的追蹤溯源困難;同時對於嘈雜的大型、非結構化數據集的執行分析以及復雜查詢效率很低,導致數據的實時性及准確性難以保證,安全運營效率不高,因此傳統網路安全技術已經難以滿足現階段網路安全分析的新要求。大數據技術這一概念最初由維克托.邁爾.舍恩伯格與肯尼斯.庫克耶在2008年出版的《大數據時代》一書中提出的,大數據是指不採用隨機分析法,而是對所有的數據進行綜合分析處理。大數據技術作為現階段信息架構發展的趨勢之首,其獨有的高速、多樣、種類繁多以及價值密度低等特點,近年來被廣泛應用於互聯網的多個領域中。大數據的戰略意義在於能夠掌握龐大的數據信息,使海量的原始安全信息的存儲與分析得以實現、分布式資料庫相比傳統資料庫的存儲成本得以降低,並且數據易於在低廉硬體上的水平擴展,極大地降低了安全投入成本;並且伴隨著數據挖掘能力的大幅提高,安全信息的採集與檢測響應速度更加快捷,異構及海量數據存儲的支持打造了多維度、多階段關聯分析的基礎,提升了分析的深度與廣度。對於網路安全防禦而言,通過對不同來源的數據進行綜合管理、處理、分析、優化,可實現在海量數據中極速鎖定目標數據,並將分析結果實時反饋,對於現階段網路安全防禦而言至關重要。
2大數據在網路安全中的應用
將大數據運用到網路安全分析中,不僅能夠實現數據的優化與處理,還能夠對日誌與訪問行為進行綜合處理,從而提高事件處理效率。大數據技術在網路安全分析的效果可從以下幾點具體分析:
2.1數據採集效率
大數據技術可對數據進行分布式地採集,能夠實現數百兆/秒的採集速度,使得數據採集速率得到了極大的提高,這也為後續的關聯分析奠定了基礎。
2.2數據的存儲
在網路安全分析系統中,原始數據的存儲是至關重要的,大數據技術能夠針對不同數據類型進行不同的數據採集,還能夠主動利用不同的方式來提高數據查詢的效率,比如在對日誌信息進行查詢時適合採用列式的存儲方式,而對於分析與處理標准化的數據,則適合採用分布式的模式進行預處理,在數據處理後可將結果存放在列式存儲中;或者也可以在系統中建立起MapRece的查詢模塊,在進行查詢的時候可直接將指令放在指定的節點,完成處理後再對各個節點進行整理,如此能夠確保查詢的速度與反應速度。
2.3實時數據的分析與後續數據的處理
在對實時數據的分析中,可以採用關聯分析演算法或CEP技術進行分析,如此能夠實現對數據的採集、分析、處理的綜合過程,實現了更高速度以及更高效率的處理;而對於統計結果以及數據的處理,由於這種處理對時效性要求不高,因此可以採用各種數據處理技術或是利用離線處理的方式,從而能夠更好地完成系統風險、攻擊方面的分析。
2.4關於復雜數據的分析
在針對不同來源、不同類型的復雜數據進行分析時,大數據技術都能夠更好的完成數據的分析與查詢,並且能夠有效完成復雜數據與安全隱患、惡意攻擊等方面的處理,當網路系統中出現了惡意破壞、攻擊行為,可採用大數據技術從流量、DNS的角度出發,通過多方面的數據信息分析實現全方位的防範、抵禦。
3基於大數據技術構建網路系統安全分析
在網路安全系統中引入大數據技術,主要涉及以下三個模塊:
3.1數據源模塊
網路安全系統中的`數據及數據源會隨著互聯網技術的進步而倍增技術能夠通過分布式採集器的形式,對系統中的軟硬體進行信息採集,除了防火牆、檢測系統等軟體,對設備硬體的要求也在提高,比如對伺服器、存儲器的檢查與維護工作。
3.2數據採集模塊
大數據技術可將數據進行對立分析,從而構建起分布式的數據基礎,能夠做到原始數據從出現到刪除都做出一定說明,真正實現數據的訪問、追溯功能,尤其是對數據量與日俱增的今天而言,分布式數據存儲能夠更好地實現提高資料庫的穩定性。
3.3數據分析模塊
對網路安全系統的運營來說,用戶的業務系統就是安全的最終保障對象,大數據分析能夠在用戶數據產生之初,及時進行分析、反饋,從而能夠讓網路用戶得到更加私人化的服務體驗。而對於用戶而言,得其所想也會對網路系統以及大數據技術更加的信任,對於個人的安全隱私信息在系統上存儲的疑慮也會大幅降低。當前網路與信息安全領域正在面臨著全新的挑戰,企業、組織、個人用戶每天都會產生大量的安全數據,現有的安全分析技術已經難以滿足高效率、精確化的安全分析所需。而大數據技術靈活、海量、快速、低成本、高容量等特有的網路安全分析能力,已經成為現階段業界趨勢所向。而對互聯網企業來說,實現對數據的深度「加工處理」,則是實現數據增值的關鍵所在,對商業運營而言是至關重要的。
4結語
在當下時代,信息數據已經滲透到各個行業及業務領域中,成為重要的社會生產因素。正因如此,互聯網數據產生的數量也在與日倍增中,這給網路安全分析工作帶來了一定難度與壓力,而大數據技術則能夠很好的完善這一問題。在網路系統中應用大數據技術不僅能夠滿足人們對數據處理時所要求的高效性與精準性,並且能夠在此基礎上構建一套相對完善的防範預警系統,這對維護網路系統的安全起著非常關鍵的作用,相信大數據技術日後能夠得到更加廣泛的應用。
參考文獻:
[1]魯宛生.淺談網路安全分析中大數據技術的應用[J].數碼世界,2017.
[2]王帥,汪來富,金華敏等.網路安全分析中的大數據技術應用[J].電信科學,2015.
[3]孫玉.淺談網路安全分析中的大數據技術應用[J].網路安全技術與應用,2017.
;⑶ 大數據時代安全要怎樣的分析技術
大數據時代安全要怎樣的分析技術
網路時代的發展日新月異,技術與體驗的改變與改進正變得異常迅速。如今,我們的網路已經從千兆邁向了萬兆時代,這便使得諸多網路安全設備要分析的數據包數據量急劇上升。而隨著下一代防火牆等安全產品的出現,安全網關所要進行的分析的數據量大增、安全監測的內容不斷細化使得安全產品所要監測和分析比以往更多的數據。除了數據包、日誌、資產數據,更多的諸如漏洞信息、配置信息、身份與訪問信息、用戶行為信息、應用信息、業務信息、外部情報信息等正在逐漸加入安全要素信息中。正如上述情況所說的那樣,隨著企業和組織安全體系架構變得越來越復雜,與之俱來的是各類安全數據正在變得越來越多。而傳統的分析能力已不足以應對當下安全數據的分析。在面對新型威脅的興起時,傳統的分析方法無法對更多的安全信息做出准確分析,也就更加無從談起更加快速的做出判定和響應。而以上信息安全所面臨的這些問題,正是大數據時代帶來的挑戰。
在此背景下,對信息安全業而言,如何將大數據技術應用於安全領域、將大數據分析技術應用於信息安全的技術的大數據安全分析的需求正變得愈加急迫。而與此同時,安全數據的數量、速度、種類的迅速膨脹,不僅帶來了海量異構數據的融合、存儲和管理的問題,更是對傳統的安全分析方法帶來了挑戰。
目前,市場上絕大多數安全分析工具和方法都是針對小數據量設計的,在面對大數據量時難以為繼。新的攻擊手段層出不窮,需要檢測的數據越來越多,傳統的分析技術已是不堪重負。
一方面,高速海量安全數據的採集和存儲變得困難,而異構數據的存儲和管理同樣變得困難;而傳統的安全分析技術對歷史數據的檢測能力很弱,對安全事件的調查效率十分低;以往,安全系統相互獨立,無法有效地進行協同工作,對於趨勢性的威脅更是無法預測,在應對當今諸如APT等高級威脅的攻擊時防護效果十分薄弱。另一方面,傳統的分析方法大都採用基於規則和特徵的分析引擎,必須要有規則庫和特徵庫才能工作,而規則和特徵只能對已知的攻擊和威脅進行描述,無法識別未知的攻擊,或者是尚未被描述成規則的攻擊和威脅。
可見,對於大數據安全分析而言,如何以安全數據自身的特點和安全分析為目標,讓大數據安全分析的應用更加凸顯其價值是十分必要的。
如今,對於信息與網路安全分析出現了兩個基本趨勢:情境感知的安全分析與智能化的安全分析。Gartner曾經在2010年的兩份報告中分別指出:「未來的信息安全將是情境感知的和自適應的。」以及「要為企業安全智能的興起做好准備。」
情境感知的安全分析,更多地需要利用相關性要素信息的綜合研判來提升安全決策的能力,例如:資產感知、位置感知、拓撲感知、應用感知、身份感知、內容感知,等等。利用情境感知分析技術,安全分析會得以在縱深方面得到極大的擴展;而更多的安全要素信息的納入,也拉升了分析的空間和時間范圍。而安全智能則更加強調將過去分散的安全信息進行集成與關聯,獨立的分析方法和工具進行整合形成交互,最終實現智能化的安全分析與決策。
從長遠看,藉助大數據安全分析技術,能夠更好地解決大量安全要素信息的採集、存儲的問題,藉助基於大數據分析技術的機器學習和數據挖據演算法,亦能夠更加智能地洞悉信息與網路安全的態勢,從而更加主動、彈性地去應對新型復雜的威脅和未知多變的風險。在未來一段時期內,關於大數據安全分析技術的探究,必會成為新的市場熱點。
以上是小編為大家分享的關於大數據時代安全要怎樣的分析技術的相關內容,更多信息可以關注環球青藤分享更多干貨
⑷ 大數據與大規模網路安全感知技術初探
大數據與大規模網路安全感知技術初探
快速發展的互聯網技術不斷地改變人們的生活方式,然而,多層面的安全威脅和安全風險也不斷出現。對於一個大型網路,在網路安全層面,除了訪問控制、入侵檢測、身份識別等基礎技術手段,需要安全運維和管理人員能夠及時感知網路中的異常事件與整體安全態勢。對於安全運維人員來說,如何從成千上萬的安全事件和日誌中找到最有價值、最需要處理和解決的安全問題,從而保障網路的安全狀態,是他們最關心也是最需要解決的問題。與此同時,對於安全管理者和高層管理者而言,如何描述當前網路安全的整體狀況,如何預測和判斷風險發展的趨勢,如何指導下一步安全建設與規劃,則是一道持久的難題。
隨著大數據技術的成熟、應用與推廣,網路安全態勢感知技術有了新的發展方向,大數據技術特有的海量存儲、並行計算、高效查詢等特點,為大規模網路安全態勢感知的關鍵技術創造了突破的機遇。本文將對大規模網路環境下的安全態勢感知、大數據技術在安全感知方面的促進做一些探討。
對於一個大規模的網路而言,面臨的風險也是巨大的,可分為廣度風險和深度風險。從廣度上講,以中國移動的CMNET網路為例,所轄IP地址超過3000萬個,提供對外服務的網站數千個,規模大、節點類型豐富多樣,伴隨其中的安全問題隨網路節點數量的增加呈指數級上升。從深度上講,下一代移動互聯網安全威脅主要表現在傳統攻擊依然存在且手段多樣、APT(高級持續性威脅)攻擊逐漸增多且造成的損失不斷增大。而攻擊者的工具和手段呈現平台化、集成化和自動化的特點,具有更強的隱蔽性、更長的攻擊與潛伏時間、更加明確和特定的攻擊目標。以上造成了下一代安全威脅具有更強的殺傷能力與逃避能力。結合廣度風險與深度風險來看,大規模網路所引發的安全保障的復雜度激增,主要面臨的問題包括:安全數據量巨大;安全事件被割裂,從而難以感知;安全的整體狀況無法描述。
網路安全感知能力具體可分為資產感知、脆弱性感知、安全事件感知和異常行為感知4個方面。資產感知是指自動化快速發現和收集大規模網路資產的分布情況、更新情況、屬性等信息;脆弱性感知則包括3個層面的脆弱性感知能力:不可見、可見、可利用;安全事件感知是指能夠確定安全事件發生的時間、地點、人物、起因、經過和結果;異常行為感知是指通過異常行為判定風險,以彌補對不可見脆弱性、未知安全事件發現的不足,主要面向的是感知未知的攻擊。
一個相對完整的網路安全感知的能力模型與架構設計如下圖所示:
隨著Hadoop、NoSQL等技術的興起,BigData大數據的應用逐漸增多和成熟,而大數據自身擁有Velocity快速處理、Volume大數據量存儲、Variety支持多類數據格式三大特性。大數據的這些天生特性,恰巧可以用於大規模網路的安全感知。首先,多類數據格式可以使網路安全感知獲取更多類型的日誌數據,包括網路與安全設備的日誌、網路運行情況信息、業務與應用的日誌記錄等;其次,大數據量存儲與快速處理為高速網路流量的深度安全分析提供了技術支持,可以為高智能模型演算法提供計算資源;最後,在異常行為的識別過程中,核心是對正常業務行為與異常攻擊行為之間的未識別行為進行離群度分析,大數據使得在分析過程中採用更小的匹配顆粒與更長的匹配時間成為可能。
中國移動自2010年起在雲計算和大數據方面就開始了積極探索。中國移動的「大雲」系統目前已實現了分布式海量數據倉庫、分布式計算框架、雲存儲系統、彈性計算系統、並行數據挖掘工具等關鍵功能。在「大雲」系統的基礎上,中國移動的網路安全感知也具備了一定的技術積累,進行了大規模網路安全感知和防禦體系的技術研究,在利用雲平台進行脆弱性發現方面的智能型任務調度演算法、主機和網路異常行為發現模式等關鍵技術上均有突破,在安全運維中取得了一些顯著的效果。
大數據的出現,擴展了計算和存儲資源,提供了基礎平台和大數據量處理的技術支撐,為安全態勢的分析、預測創造了無限可能。
⑸ 大數據安全面臨哪些風險及如何防護
現如今大數據已經逐漸改變了我們的生活方式,成為必不可少的存在,在我們享野首受大數據給我們帶來的便利時,安全性無論對於企業還是個人都是必須要解決的重大課題。
總結大數據面臨的三大風險問題如下
1.個人隱私問題凸顯
例如大數據中的精準營銷定位功能,通常是依賴於高度採集個人信息,通過多種關聯技術分析來實現信息推廣,精準營銷。企業會掌握用戶大量的數據,不排除隱私部分的敏感數據,一旦伺服器遭到不法分子攻擊導致數據泄露,很可能危及用戶的隱私、財產甚至是人身安全。
2.數據准確與權威性
大數據通過各種渠道獲取大量數據進行計算分析,企業通常直接通過分析結果進行支持決策,有時候企業只看結果,卻忽略了源頭數據的准確性,不準確的數據直接影響大數據分析的結果和企業的利益,錯誤的指導會對企業帶來一定的風險與損失。
3.基礎設施維護壓力
數據量越大,對基礎設施的性能要求就越高,同樣對於網路的安全、恢復、防範依賴性就越強,一定程度上對企業設施安全的維護造成了壓力,基礎設施建設不完善、維護不到位,抱有沒出問題就得過且過的態度,時刻面臨被攻擊的危險可能。
針對上述問題的防護措施如下
1.對用戶早脊嘩而言
雖然在互聯網時代下要完全保護自己的隱私是比較困難的,但也要加強自身信息的防範意識。注冊賬號時,遵循最少原則,不要隨意泄露敏感信息,降陸行低隱私信息被泄露的危險;
2.對企業而言
加強數據安全管理,實現數據的治理與清洗,從源頭保證數據的一致性、准確性。首先升級基礎伺服器環境,建立多重防護、多級互聯體系結構,確保大數據處理環境可信度。其次全方位實時監控、審計、防護,防止敏感數據泄露、丟失,確保數據風險可控,並不斷通過體系化的大數據安全評估,形成數據安全治理的閉環管理;
3.對政策而言
應該加強對數據信息的保護,對數據的使用進行一定的監管與限制,對非法盜用、濫用數據信息者嚴懲,之後加強對技術安全研發使用的推廣與實施,保證數據安全,加強對數據治理的力度。
大數據時代的到來,可以為我們的生活帶來切實的利益,行業的數據規范正在建立並逐步趨於完善,對於我們來說,既不要因為安全風險問題而排斥大數據,也不要疏忽於對個人/企業信息的保護,合理看待和利用大數據,讓其發揮真正的價值。
⑹ 大數據分析 挖掘出的五大安全線索
大數據分析:挖掘出的五大安全線索
隨著安全分析技術不斷成熟,企業會驚喜地發現對安全相關數據的系統分析能夠為他們挖掘出很多有價值的信息,下面是5個從安全分析中挖掘出的信息:
1、挖掘出你不知道需要提出的問題
IT基礎設施和安全工具產生的巨量非結構化數據讓安全分析師甚至很難開始查詢數據,以回答有關企業風險狀態的常見問題。讓分析程序回答這些顯而易見的問題有時候會出現意想不到的回報,因為會出現其他模式來回答安全團隊可能沒想過要提出的問題。
「通常情況下,在數據被存儲和訪問之前,企業可能不知道他們需要什麼或者他們想要解決什麼問題,」OpenDNS公司首席技術官Dan Hubbard表示,「分析技術可以發現安全情報,並挖掘出我們不知道的問題。」
更重要的是,這些趨勢的可視化還可以幫助更好地與業務部門溝通風險,並解決業務領導可能提出的重要問題。
安全服務供應商BTB Security公司管理合夥人Ron Schlecht表示,「他們會開始提出很好的問題,所以你應該尋找一個不同的視角,對於你應該尋找的東西,以及你應該如何看待這些問題,最好與不同的業務領導進行合作,這會讓大家明白安全對整個企業的重要性。」
2、找出不同數據來源之間的關聯
通常情況下,安全分析程序會在數據來源之間進行關聯,而安全團隊可能從來沒有發現過這種關聯。
「大多數安全分析程序需要將來自不同來源的數據整合到單個引擎,來進行分析,查找模式和異常情況,」Cambridge Intelligence公司北美地區總經理Corey Lanum表示,「當我的客戶從不同數據來源載入數據時,他們通常立即會看到原本存儲在不同資料庫沒有關聯的數據元素之間存在的關聯。」
這種類型的建模可以用於發現網路不同部分、不同部門信息之間的關聯。
3、發現你永遠想像不到的數據泄漏
安全分析技術給你帶來的第一個驚喜是讓你發現想像不到的數據泄漏的具體證據。
RSA公司高級產品營銷經理Matthew Gardiner表示:「經常會挖掘出的信息是,他們會發現已經持續了一段時間的數據泄漏。」他解釋說,這可能不是某種復雜的民族國家間諜活動導致的泄漏,或者黑社會性質犯罪阻止竊取的數據。
他說道,「只是數據轉移到企業外部不知明的地方造成的泄漏,接下來的問題是,搞清楚如何控制數據流向。」
4、發現你從來不知道的IT操作問題
安全分析技術的優勢可能會超出IT安全的范疇,轉而深入IT操作。在很多情況下,對安全數據進行建模和點連接還可以發現IT操作問題,這些問題可能會影響可操作性、工作流和效率。
Schlecht表示:「讓很多企業驚訝的一個好處是,安全分析還能夠幫助找出IT操作問題,這是因為分析程序能夠獲得一定的可視性。」
例如,多年前,Schlecht曾在企業內部工作,他發現一個新的分析程序不僅能幫助發現安全問題,還能夠發現企業應用程序的開發問題,而這個問題讓其開發團隊困擾了數小時。在檢查應用程序和安全事件日誌後,一些完全無關的東西幫助找出了問題的根源。
5、找出你不知道的策略違規行為
分析技術還提供了另一個驚喜:發現企業中的策略違規行為,這通常是一把雙刃劍。這些不一定是惡意行為,但是確實違反了策略,麻煩的是,一旦安全團隊看到這些違規行為,他們就會採取行動,而不管多麼麻煩。
以上是小編為大家分享的關於大數據分析 挖掘出的五大安全線索的相關內容,更多信息可以關注環球青藤分享更多干貨
⑺ 大數據環境下的網路安全分析
大數據環境下的網路安全分析
「大數據」一詞常被誤解。事實上,使用頻率太高反而使它幾乎沒有什麼意義了。大數據確實存儲並處理大量的數據集合,但其特性體現遠不止於此。
在著手解決大數據問題時,將其看作是一種觀念而不是特定的規模或技術非常有益。就其最簡單的表現來說,大數據現象由三個大趨勢的交集所推動:包含寶貴信息的大量數據、廉價的計算資源、幾乎免費的分析工具。
大數據架構和平台算是新事物,而且還在以一種非凡的速度不斷發展著。商業和開源的開發團隊幾乎每月都在發布其平台的新功能。當今的大數據集群將會與將來我們看到的數據集群有極大不同。適應這種新困難的安全工具也將發生變化。在採用大數據的生命周期中,業界仍處於早期階段,但公司越早開始應對大數據的安全問題,任務就越容易。如果安全成為大數據集群發展過程中的一種重要需求,集群就不容易被黑客破壞。此外,公司也能夠避免把不成熟的安全功能放在關鍵的生產環境中。
如今,有很多特別重視不同數據類型(例如,地理位置數據)的大數據管理系統。這些系統使用多種不同的查詢模式、不同的數據存儲模式、不同的任務管理和協調、不同的資源管理工具。雖然大數據常被描述為「反關系型」的,但這個概念還無法抓住大數據的本質。為了避免性能問題,大數據確實拋棄了許多關系型資料庫的核心功能,卻也沒犯什麼錯誤:有些大數據環境提供關系型結構、業務連續性和結構化查詢處理。
由於傳統的定義無法抓住大數據的本質,我們不妨根據組成大數據環境的關鍵要素思考一下大數據。這些關鍵要素使用了許多分布式的數據存儲和管理節點。這些要素存儲多個數據副本,在多個節點之間將數據變成「碎片」。這意味著在單一節點發生故障時,數據查詢將會轉向處理資源可用的數據。正是這種能夠彼此協作的分布式數據節點集群,可以解決數據管理和數據查詢問題,才使得大數據如此不同。
節點的鬆散聯系帶來了許多性能優勢,但也帶來了獨特的安全挑戰。大數據資料庫並不使用集中化的「圍牆花園」模式(與「完全開放」的互聯網相對而言,它指的是一個控制用戶對網頁內容或相關服務進行訪問的環境),內部的資料庫並不隱藏自己而使其它應用程序無法訪問。在這兒沒有「內部的」概念,而大數據並不依賴數據訪問的集中點。大數據將其架構暴露給使用它的應用程序,而客戶端在操作過程中與許多不同的節點進行通信。
規模、實時性和分布式處理:大數據的本質特徵(使大數據解決超過以前數據管理系統的數據管理和處理需求,例如,在容量、實時性、分布式架構和並行處理等方面)使得保障這些系統的安全更為困難。大數據集群具有開放性和自我組織性,並可以使用戶與多個數據節點同時通信。驗證哪些數據節點和哪些客戶應當訪問信息是很困難的。別忘了,大數據的本質屬性意味著新節點自動連接到集群中,共享數據和查詢結果,解決客戶任務。
嵌入式安全:在涉及大數據的瘋狂競賽中,大部分的開發資源都用於改善大數據的可升級、易用性和分析功能上。只有很少的功能用於增加安全功能。但是,你希望得到嵌入到大數據平台中的安全功能。你希望開發人員在設計和部署階段能夠支持所需要的功能。你希望安全功能就像大數據集群一樣可升級、高性能、自組織。問題是,開源系統或多數商業系統一般都不包括安全產品。而且許多安全產品無法嵌入到Hadoop或其它的非關系型資料庫中。多數系統提供最少的安全功能,但不足以包括所有的常見威脅。在很大程度上,你需要自己構建安全策略。
應用程序:面向大數據集群的大多數應用都是Web應用。它們利用基於Web的技術和無狀態的基於REST的API。雖然全面討論大數據安全的這個問題超出了本文的范圍,但基於Web的應用程序和API給這些大數據集群帶來了一種最重大的威脅。在遭受攻擊或破壞後,它們可以提供對大數據集群中所存儲數據的無限制訪問。應用程序安全、用戶訪問管理及授權控制非常重要,與重點保障大數據集群安全的安全措施一樣都不可或缺。
數據安全:存儲在大數據集群中的數據基本上都保存在文件中。每一個客戶端應用都可以維持其自己的包含數據的設計,但這種數據是存儲在大量節點上的。存儲在集群中的數據易於遭受正常文件容易感染的所有威脅,因而需要對這些文件進行保護,避免遭受非法的查看和復制。
⑻ 大數據安全問題及應對思路研究
大數據安全問題及應對思路研究
隨著互聯網、物聯網、雲計算等技術的快速發展,全球數據量出現爆炸式增長。與此同時,雲計算為這些海量的多樣化數據提供了存儲和運算平台,分布式計算等數據挖掘技術又使得大數據分析規律、研判趨勢的能力大大增強。在大數據不斷向各個行業滲透、深刻影響國家的政治、經濟、民生和國防的同時,其安全問題也將對個人隱私、社會穩定和國家安全帶來巨大的潛在威脅,如何應對面臨巨大挑戰。
一、大數據安全關鍵問題
隨著數字化進程不斷深入,大數據逐步滲透至金融、汽車、製造、醫療等各個傳統行業,甚至到社會生活的每個角落,大數據安全問題影響也日益增大。
(一)國家數據資源大量流失。互聯網海量數據的跨境流動,加劇了大數據作為國家戰略資源的大量流失,全世界的各類海量數據正在不斷匯總到美國,短期內還看不到轉變的跡象。隨著未來大數據的廣泛應用,涉及國家安全的政府和公用事業領域的大量數據資源也將進一步開放,但目前由於相關配套法律法規和監管機制尚不健全,極有可能造成國家關鍵數據資源的流失。
(二)大數據環境下用戶隱私安全威脅嚴重。隨著大數據挖掘分析技術的不斷發展,個人隱私保護和數據安全變得非常緊迫。一是大數據環境下人們對個人信息的控制權明顯下降,導致個人數據能夠被廣泛、詳實的收集和分析。二是大數據被應用於攻擊手段,黑客可最大限度地收集更多有用信息,為發起攻擊做准備,大數據分析讓黑客的攻擊更精準。三是隨著大數據技術發展,更多信息可以用於個人身份識別,個人身份識別信息的范圍界定困難,隱私保護的數據范圍變得模糊。四是以往建立在「目的明確、事先同意、使用限制」等原則之上的個人信息保護制度,在大數據場景下變得越來越難以操作。
(三)基於大數據挖掘技術的國家安全威脅日益嚴重。大數據時代美國情報機構已搶佔先機,美國通過遍布在全球的國安局監聽機構如地面衛星站、國內監聽站、海外監聽站等採集各種信息,對採集到的海量數據進行快速預處理、解密還原、分析比對、深度挖掘,並生成相關情報,供上層決策。2013年6月底,美中情局前雇員斯諾登爆料,美國情報機關通過思科路由器對中國內地移動運營商、中國教育和科研計算機網等骨幹網路實施長達4年之久的長期監控,以獲取網內海量簡訊數據和流量數據。
(四)基礎設施安全防護能力不足引發數據資產失控。一是基礎通信網路關鍵產品缺乏自主可控,成為大數據安全缺口。我國運營企業網路中,國外廠商設備的現網存量很大,國外產品存在原生性後門等隱患,一旦被遠程利用,大量數據信息存在被竊取的安全風險。二是我國大數據安全保障體系不健全,防禦手段能力建設處於起步階段,尚未建立起針對境外網路數據和流量的監測分析機制,對棱鏡監聽等深層次、復雜、高隱蔽性的安全威脅難以有效防禦、發現和處置。
二、國外大數據安全相關舉措及我國應對思路
目前世界各國均通過出台國家戰略、促進數據融合與開放、加大資金投入等推動大數據應用。相比之下,各國在涉及大數據安全方面的保障舉措則起剛剛起步,主要集中在通過立法加強對隱私數據的保護。德國在2009年對《聯邦數據保護法》進行修改並生效,約束范圍包括互聯網等電子通信領域,旨在防止因個人信息泄露導致的侵犯隱私行為;印度在2012年批准國家數據共享和開放政策的同時,通過擬定非共享數據清單以保護涉及國家安全、公民隱私、商業秘密和知識產權等數據信息;美國在2014年5月發布《大數據:把握機遇,守護價值》白皮書表示,在大數據發揮正面價值的同時,應該警惕大數據應用對隱私、公平等長遠價值帶來的負面影響,建議推進消費者隱私法案、通過全國數據泄露立法、修訂電子通信隱私法案等。
我國在布局、鼓勵和推動大數據發展應用的同時,也應提早謀劃、積極應對大數據帶來的安全挑戰,從戰略制定、法律法規、基礎設施防護等方面應對大數據安全問題。
(一)將大數據資源保護上升為國家戰略,建立分級分類安全管理機制。一是把數據資源視為國家戰略資源,將大數據資源保護納入到國家網路空間安全戰略框架中,構建大數據環境下的信息安全體系,提高應急處置能力和安全防範能力,提升服務能力和運作效率。二是通過國家層面的戰略布局,明確大數據資源保護的整體規劃和近遠期重點工作。三是對國內大數據資源按實施分級分類安全保護思路,保障數據安全、可靠,積極開展大數據安全風險評估工作,針對不同級別大數據特點加強安全防範。五是盡快制定不同級別的大數據採集、存儲、備份、遷移、處理和發布等關鍵環節的安全規范和標准,配套完善相應的監管措施。
(二)完善法律法規,加大個人信息保護監管力度。一是積極推動個人信息保護法律的立法工作,探索通過技術標准、行業自律等手段解決法律出台前的個人信息保護問題。加快《網路安全法》的出台,在《網路安全法》中對電信和互聯網行業用戶信息保護作出明確法律界定,為相關工作開展提供法律依據。二是加強對個人隱私保護的行政監管,同時要加大對侵害個人隱私行為的打擊力度,建立對個人隱私保護的測評機制,推動大數據行業的自律和監督。
(三)加強國家信息基礎設施保護,提升大數據安全保障與防範能力。一是促進技術研究和創新,通過加大財政支持力度,激勵關系國家安全和穩定的政府和國有企事業單位採用安全可控的產品,提升我國基礎設施關鍵設備的安全可控水平。二是加強大數據信息安全系統建設,針對大數據的收集、處理、分析、挖掘等過程設計與配置相應的安全產品,並組成統一的、可管控的安全系統,推動建立國家級、企業級的網路個人信息保護態勢感知、監控預警、測評認證平台。三是充分利用大數據技術應對網路攻擊,通過大數據處理技術實現對網路異常行為的識別和分析,基於大數據分析的智能驅動型安全模型,把被動的事後分析變成主動的事前防禦;基於大數據的網路攻擊追蹤,實現對網路攻擊行為的溯源。
以上是小編為大家分享的關於大數據安全問題及應對思路研究的相關內容,更多信息可以關注環球青藤分享更多干貨
⑼ 大數據背景下的信息安全問題探討
大數據背景下的信息安全問題探討
大數據具有體量巨大、類型繁雜、處理速度快、價值密度低四大特點,因此,對於個人來說,難以處理極其龐大的數據,只有國家和大型企業等組織或集團才有可能獲取到各種敏感信息;大數據所搜集提取的個人信息可能連本人都不完全知曉,比如個人的行為特徵、語言風格、愛好興趣等。在大數據時代如何保護個人敏感信息或隱私,必將成為高難度的世界課題。
2013年6月,美國前中情局雇員斯諾登曝光了始於2007年小布希時期美國國家安全局和聯邦調查局啟動的代號為「棱鏡」的秘密項目。美國國家安全局通過接入雅虎、谷歌、微軟、蘋果等9家美國互聯網公司中心伺服器,對郵件、圖片、視頻、電話等10類數據進行監控,以搜集情報,監視民眾的網路活動。「棱鏡」項目緣於2004年美國政府的「星風」監視計劃。但是,當時小布希政府由於法律程序等敏感問題而做出讓步,美國本土的監聽項目有所縮減。為了「星風」計劃的繼續進行,小布希政府通過司法程序將「星風」監視計劃分拆成由國家安全局執行的4個監視計劃,包括「棱鏡」、「主幹道」、「碼頭」和「核子」,均交由美國家安全局執掌。「棱鏡」項目用於監視互聯網個人信息。「主幹道」和「碼頭」項目負責存儲和分析通信和互聯網上數以億兆計的「元數據」。元數據主要指通話或通信的時間、地點、使用設備、參與者等,不包括電話或郵件等的內容。「核子」項目負責內容信息的獲取,截獲電話通話者對話內容及關鍵詞,通過攔截通話以及通話者所提及的地點,來實現日常的監控。由此可見,斯諾登不僅揭露了美國的大規模竊聽計劃,更揭示了大數據時代國家信息安全保護問題。大數據的分析與使用,無論對個人(如跟蹤健康狀況防範疾病)、對企業(如了解市場偏好以有效安排產品設計生產營銷)乃至對國家(如防範疫情或恐怖主義)顯然都有巨大的好處,從商業用途來說,谷歌、微軟、雅虎等互聯網公司,完全可以通過它們掌握到的數以百萬計、千萬計甚至億萬計的數據,經由「超級計算」,准確推斷消費者的愛好及習慣、商品的銷售額、疾病疫情的發展趨勢。商業如此,在政治、經濟、軍事等方面亦存在諸多的用途和潛在利益。像「棱鏡」計劃里涉及的谷歌、雅虎、蘋果、微軟等大網站,人們每天由於各種業務需要,會把大量個人信息輸入其中,但常常並不被事先告知數據的用途。而這些數據會被企業或政府用來進行一些特殊的計算或分析,如通過對大數據的分析預測來對人們尚未實施的行為進行懲罰。比如「大數據之父」舍恩伯格曾披露過一個例子:在美國有一個計劃名為「預測式配警」,通過對大數據分析來預測美國某個城市的某條街道的某個時段是犯罪高峰時段,然後在那個位置部署更多的警力。從此該地區居民將長時間被監控,這是一種變相的侵犯或懲罰。他們不是因為做錯事,而是因為某個計算機的演算法預測他們可能做錯事而被懲罰了,顯然這是不公平的。美國國安局擁有的正是類似的一套基於「大數據」的新型情報收集系統,這套名為「無界爆料」的系統,以30天為周期,從全球網路系統中接收到970億條訊息,再通過比對信用卡或者通訊記錄等方式,能幾近真實地還原個人的實時狀況。當然,像谷歌這樣的商業組織也有可能掌握同樣量級的信息而進行商業預測分析。因此,必須建立一套規則予以規范和約束對大數據的收集和使用。第一,雖然這些信息儲存在不同的伺服器上,但這些數據是用戶的資產,擁有權屬於用戶自己而不是這些公司,這是必須明確的,就像財產所有權一樣,個人隱私數據也應該有所有權。第二,利用大數據、雲計算技術給用戶提供信息服務的公司或企業,需要把收集到的用戶數據進行安全存儲和傳輸,這是企業的責任和義務。第三,如果企業或政府要使用用戶的信息,一定要讓用戶有知情權和選擇權,泄露用戶數據甚至牟利,不僅要被視作不道德的行為,而且是非法行為。大數據時代的數據存儲和應用方式是跨地域甚至是跨國界的。作為國家層面要將大數據上升為國家戰略,奧巴馬政府在2012年3月將「大數據戰略」上升為最高國策,像陸權、海權、空權一樣,將對數據的佔有和控製作為重要的國家核心能力。我國也應從國家高度重視大數據,在對其進行安全保護、政策制定需要重視三個方面:一是要正視數據霸權,要清醒認識到我國在網路控制權、關鍵技術和高端設備等方面,還受制於西方。二是要明確主權,數據作為一種重要的戰略資源,無論是個人擁有還是國家擁有,都要納入到主權范圍裡面來考慮。三是要有治權,因為有主權不一定能夠管治。比如:數據存到國外,雲計算跨越國境,可能不在你的主權范圍之內。要區別對待不同的數據,對確需保護的數據,必須有切實可靠的手段進行有效管理。如果做不到對數據的有效管理,大數據就必然面臨失控的危險。政策界定安全責任問題。大數據的安全問題涉及政府、相關企業、網路運營商、服務提供者,以及數據產生者、使用者等方方面面,必須對各自的安全責任有明晰的政策界定。信息安全風險存在於數據的全生命周期之中,從技術思路、產品開發、用戶使用、服務管理,各個環節均要分擔相應的安全責任。監管保障基礎設施安全問題。大數據的發展離不開電信網路甚至工控系統等關鍵基礎設施,其安全可靠同樣依賴於這些基礎設施,受供應鏈全球化、產業私有化的影響,網路與關鍵基礎設施間的安全日趨復雜,一國的大數據可能存放在別國的網路中,一國的基礎設施可能同時服務於多個國家,高度的全球相互依賴性,挑戰著原有的國家主權觀念。所以,關鍵基礎設施的安全監管體系十分重要,我國需要盡快確立對供應鏈的實質性國家安全審查和對基礎網路的常態化安全監管。
網路空間沖突管理問題。大數據的資源價值越來越高,圍繞大數據的爭奪和沖突就越來越激烈。大數據的生成、處理和利用方式,將極大改變各種沖突的表現方式和破壞烈度。通過立法與國際合作應對包括知識產權的保護、網路犯罪的處置、網路破壞活動特別是網路恐怖主義的打擊以及網路戰爭的威脅。
⑽ 大數據應用模式及安全風險分析有哪些
當前各個領域數據生成速度逐漸加快,需要處理的數據量急劇膨脹。這些巨大的數據資源蘊藏著潛在的價值,需要對其進行有效的分析和利用。當前數據的特點除了數量龐大之外,數據類型也變得多樣化,其中包括了結構化數據、半結構化數據以及非結構化數據。這些數量龐大、種類繁多的海量數據,給傳統分析工具帶來了巨大的挑戰。當前對數據的分析不再是簡單的生成統計報表,而是利用復雜的分析模型進行深人的分析,傳統分析技術例如關系資料庫技術已經不能滿足其要求。在擴展性上,通過增加或更換內存、CPU、硬碟等設備原件以打一展單個節點的能力的縱向打一展(scale up)系統遇到了瓶頸;只有通過增加計算節點,連接成大規模集群,進行分布式並行計算和管理的橫向打一展(scale out )系統才能滿足大數據的分析需求[u。因此傳統工具在擴展性上遇到了障礙,必須尋求可靠的數據存儲和分析技術來分析和利用這些龐大的資源。利用雲計算平台搭建Hadoop計算框架成為當前處理大數據的主要手段。然而由於雲計算和Hadoop應用的特點和自身安全機制薄弱,不可避免地帶來了安全風險。
1、大數據應用模式
雲計算(Cloud Computing)是一種基於Internet的計算,是以並行計算(Parallel Computing )、分布式計算(Distributed Computing)和網格計算(Grid Compu-tin助為基礎,融合了網路存儲、虛擬化、負載均衡等技術的新興產物。它將原本需要由個人計算機和私有數據中心執行的任務轉移給具備專業存儲和計算技術的大型計算中心來完成,實現了計算機軟體、硬體等計算資源的充分共享[z}。企業或個人不再需要花費大量的費用在基礎設施的購買上,更不需要花費精力對軟硬體進行安裝、配置和維護,這些都將由雲計算服務商CSP( Cloud Service Provider)提供相應的服務。企業或個人只需按照計時或計量的方式支付租賃的計算資源。雲計算服務商擁有大數據存儲能力和計算資源,被視為外包信息服務的最佳選擇[31因此大數據的應用往往與雲計算相結合。
Hadoop是當前最廣為人知的大數據技術實施方案,它是Google雲計算中的Map/Rece}4}和GFS( Google File System)的開源實現。Hadoop提供了一種計算框架,其最為核心的技術是HDFS ( HadoopDistributed File System)以及MapReee } HDFS提供了高吞吐量的分布式文件系統,而MapReee是大型數據的分布式處理模型。Hadoop為大數據提供了一個可靠的共享存儲和分析系統[5-6 }v
盡管有一些組織自建集群來運行Hadoop,但是仍有許多組織選擇在租賃硬體所搭建的雲端運行Hadoop或提供Hadoop服務。例如提供在公有或私有雲端運行Hadoop的Cloudera,還有由Amazon提供的稱為Elastic MapReee的雲服務等f}l。因此將雲計算與Hadoop結合處理大數據已成為一種趨勢。
2、大數據安全風險分析
隨著大數據應用范圍越來越廣,對數據安全的需求也越來越迫切。
由於雲計算的特點是將數據外包給雲服務商提供服務,這種服務模式將數據的所有權轉移給了CSP,用戶失去了對物理資源的直接控制[A1。而雲中存儲的大數據通常是以明文的方式存在的,CSP對數據具有底層控制權,惡意的CSP有可能在用戶不知情的情況下竊取用戶數據,而雲計算平台亦可能受到攻擊致使安全機制失效或被非法控制從而導致非授權人讀取數據,給大數據安全帶來了威脅。
Hadoop在設計之初並未考慮過安全問題,在Ha-doop 1. 0. 0和Cloudera CDH3版本之後,Hadoop加人了Kerberos的身份認證機制和基於ACL的訪問控制機制[91。即使在安全方面增加了身份認證和訪問控制策略,Hadoop的安全機制仍然非常薄弱,因為Ker-beros的認證機制只應用於客戶機(Clients )、密鑰分發中心(I}ey Distribution Center, I}DC )、伺服器(Serv-er)之間,只是針對機器級別的安全認證,並未對Ha-doop應用平台本身進行認證[}o}。而基於ACL的訪問控制策略需要通過在啟用ACL之後,對hadoop-policy. xml中的屬性進行配置,其中包括9條屬性,它們限制了用戶與組成員對Hadoop中資源的訪問以及Datanode和Namenode或Jobtracke:和Tasktrackers等節點間的通信,但該機制依賴於管理員對其的配置[川,這種基於傳統的訪問控制列表容易在伺服器端被篡改而不易察覺。而且基於ACL的訪問控制策略粒度過粗,不能在MapRece過程中以細粒度的方式保護用戶隱私欄位。況且針對不同的用戶和不同應用,訪問控制列表需要經常作對應的更改,這樣的操作過於繁瑣且不易維護。因此Hadoop自身的安全機制是不完善的。
2.1 不同應用模式下CSP及Uers帶來的安全風險
雲計算中Hadoop有多種應用模式。在私有雲中搭建Hadoop,即企業自己應用Hadoop,使用該平台的是企業內部各個部門的員工,外部人員無法訪問和使用這些資源。這時的CSP指的是Hadoop的創建和管理者,IaaS級和PaaS級CSP為相同的實體;在公有雲平台應用Hadoop , C SP有2級,IaaS級CSP,提供基礎設施;PaaS級C SP,負責Hadoop的搭建和管理。這時兩級CSP往往是不同的實體。