導航:首頁 > 數據分析 > 大數據存儲面臨的問題有哪些

大數據存儲面臨的問題有哪些

發布時間:2023-07-20 02:53:35

1. 國內大數據需求所面臨的典型存儲挑戰

國內大數據需求所面臨的典型存儲挑戰
大數據讓零售無需店面,在最大限度降低投資同時,加快現金流周轉效率。大數據使各行各業商家提高獲取優質客戶資源和提升利潤空間的同時,也使競爭進入「一兵一卒」用戶爭奪戰之中。

大數據時代,企業數據量和數據種類出現飛速增長。大數據時代,全球應用數量從幾年前的以十萬為單位計算,到了以百萬為單位計算。10年前,IT從業人員只是以百萬計算,數據生成來源也比較單一,但現在,IT服務使用者已經上升到十幾億的消費者,數據生成來源更為豐富,是名副其實的大數據時代。同時,IT資源的配置和管理要滿足高度虛擬化或集群IT架構的需求。企業應用部署效率、業務穩定服務性能,以及動態有效滿足OLTP和OLAP性能要求,直接決定著企業核心競爭力。企業要求存儲更靈活、更動態、性能更穩定,以支撐大量用戶對各種IT服務交付的能力。此外,大數據時代還需要集中、統一和自動化管理的功能。
中國市場針對大數據的需求所面臨的典型的存儲挑戰:
1.業務關鍵型性能:就「存儲是否能滿足目前業務關鍵應用性能」的調查結果顯示,接受調查人員(總計455名受訪者)中28.1%表示在未來12個月考慮部署新型存儲。36.5%用戶在未來12-24個月考慮部署新存儲。大數據時代,應用使用者的快速增加,對存儲並行處理能力提出了更高要求。此外,生產應用虛擬化產生大量隨機讀取,這就對傳統IOPs和時間延遲提出了挑戰。
2.存儲利用率:大數據時代數據量快速增加。如何通過存儲容量優化,降低存儲容量和網路資源需求,降低數據保護過程對生產環境的性能影響,是控制大數據存儲新增開支的關鍵。
3. 容量優化系統性能:為了提高存儲資源利用率和業務連續性,存儲廠商近年紛紛推出各種企業級功能。為了降低存儲管理強度,中端以上存儲具有多種工作負載性能監控、動態資源配置和自動化端對端管理功能。然而,傳統存儲控制器處理能力有限,啟動這些企業級功能需要消耗存儲控制器資源。用戶往往要在存儲資源優化和生產性能之間做取捨。
4.在大數據時代如何利用各種已有存儲資源,為大數據時代的業務發展提供高可擴展和業務連續性是關鍵。傳統存儲下,不同廠商的存儲之間無法實現快照、復制、備份和恢復,由此帶來數據保護的大量開支。同時,帶來存儲資源浪費。
大數據環境對系統性能要求非常苛刻,要滿足應用OLTP和大數據分析OLAP,以及業務關鍵型應用的低延遲需求,傳統地通過增加控制器和硬碟這一解決方式不僅帶來高昂的采購、運維成本和佔地空間成本,而且還會導致資源的閑置,從而進一步降低了企業的IT總擁有成本。

2. 大數據存在的安全問題有哪些

【導讀】互聯網時代,數據已成為公司的重要資產,許多公司會使用大數據等現代技術來收集和處理數據。大數據的應用,有助於公司改善業務運營並預測行業趨勢。那麼,大數據存在的安全問題有哪些呢?今天就跟隨小編一起來了解下吧!

一、分布式系統

大數據解決方案將數據和操作分布在許多系統中,以實現更快的處理和分析。這種分布式系統可以平衡負載,避免單點故障。但是這樣的系統容易受到安全威脅,黑客只要攻擊一個點就可以滲透整個網路。

二.數據存取

大數據系統需要訪問控制來限制對敏感數據的訪問,否則,任何用戶都可以訪問機密數據,有些用戶可能會出於惡意使用。此外,網路犯罪分子可以入侵與大數據系統相連的系統,竊取敏感數據。因此,使用大數據的公司需要檢查和驗證每個用戶的身份。

三.數據不正確

網路犯罪分子可以通過操縱存儲的數據來影響大數據系統的准確性。因此,網路犯罪分子可以創建虛假數據,並將這些數據提供給大數據系統。比如醫療機構可以利用大數據系統研究患者的病歷,而黑客可以修改這些數據,產生不正確的診斷結果。

四.侵犯隱私

大數據系統通常包含機密數據,這是很多人非常關心的問題。這樣的大數據隱私威脅已經被全世界的專家討論過了。此外,網路犯罪分子經常攻擊大數據系統以破壞敏感數據。這種數據泄露已經成為頭條新聞,導致數百萬人的敏感數據被盜。

五、雲安全性不足

大數據系統收集的數據通常存儲在雲中,這可能是一個潛在的安全威脅。網路犯罪分子破壞了許多知名公司的雲數據。如果存儲的數據沒有加密,並且沒有適當的數據安全性,就會出現這些問題。

以上就是小編今天給大家整理分享關於「大數據存在的安全問題有哪些?」的相關內容希望對大家有所幫助。小編認為要想在大數據行業有所建樹,需要考取部分含金量高的數據分析師證書,這樣更有核心競爭力與競爭資本。

3. 大數據面臨哪些安全與隱私問題

(一)大數據遭受異常流量攻擊
大數據所存儲的數據非常巨大,往往採用分布式的方式進行存儲,而正是由於這種存儲方式,存儲的路徑視圖相對清晰,而數據量過大,導致數據保護,相對簡單,黑客較為輕易利用相關漏洞,實施不法操作,造成安全問題。由於大數據環境下終端用戶非常多,且受眾類型較多,對客戶身份的認證環節需要耗費大量處理能力。由於APT攻擊具有很強的針對性,且攻擊時間長,一旦攻擊成功,大數據分析平台輸出的最終數據均會被獲取,容易造成的較大的信息安全隱患。
(二)大數據信息泄露風險
大數據平台的信息泄露風險在對大數據進行數據採集和信息挖掘的時候,要注重用戶隱私數據的安全問題,在不泄露用戶隱私數據的前提下進行數據挖掘。需要考慮的是在分布計算的信息傳輸和數據交換時保證各個存儲點內的用戶隱私數據不被非法泄露和使用是當前大數據背景下信息安全的主要問題。同時,當前的大數據數據量並不是固定的,而是在應用過程中動態增加的,但是,傳統的數據隱私保護技術大多是針對靜態數據的,所以,如何有效地應對大數據動態數據屬性和表現形式的數據隱私保護也是要注重的安全問題。最後,大數據的數據遠比傳統數據復雜,現有的敏感數據的隱私保護是否能夠滿足大數據復雜的數據信息也是應該考慮的安全問題。
(三)大數據傳輸過程中的安全隱患
數據生命周期安全問題。伴隨著大數據傳輸技術和應用的快速發展,在大數據傳輸生命周期的各個階段、各個環節,越來越多的安全隱患逐漸暴露出來。比如,大數據傳輸環節,除了存在泄漏、篡改等風險外,還可能被數據流攻擊者利用,數據在傳播中可能出現逐步失真等。又如,大數據傳輸處理環節,除數據非授權使用和被破壞的風險外,由於大數據傳輸的異構、多源、關聯等特點,即使多個數據集各自脫敏處理,數據集仍然存在因關聯分析而造成個人信息泄漏的風險。
基礎設施安全問題。作為大數據傳輸匯集的主要載體和基礎設施,雲計算為大數據傳輸提供了存儲場所、訪問通道、虛擬化的數據處理空間。因此,雲平台中存儲數據的安全問題也成為阻礙大數據傳輸發展的主要因素。
個人隱私安全問題。在現有隱私保護法規不健全、隱私保護技術不完善的條件下,互聯網上的個人隱私泄露失去管控,微信、微博、QQ等社交軟體掌握著用戶的社會關系,監控系統記錄著人們的聊天、上網、出行記錄,網上支付、購物網站記錄著人們的消費行為。但在大數據傳輸時代,人們面臨的威脅不僅限於個人隱私泄露,還在於基於大數據傳輸對人的狀態和行為的預測。近年來,國內多省社保系統個人信息泄露、12306賬號信息泄露等大數據傳輸安全事件表明,大數據傳輸未被妥善處理會對用戶隱私造成極大的侵害。因此,在大數據傳輸環境下,如何管理好數據,在保證數據使用效益的同時保護個人隱私,是大數據傳輸時代面臨的巨大挑戰之一。
(四)大數據的存儲管理風險
大數據的數據類型和數據結構是傳統數據不能比擬的,在大數據的存儲平台上,數據量是非線性甚至是指數級的速度增長的,各種類型和各種結構的數據進行數據存儲,勢必會引發多種應用進程的並發且頻繁無序的運行,極易造成數據存儲錯位和數據管理混亂,為大數據存儲和後期的處理帶來安全隱患。當前的數據存儲管理系統,能否滿足大數據背景下的海量數據的數據存儲需求,還有待考驗。不過,如果數據管理系統沒有相應的安全機制升級,出現問題後則為時已晚。

4. 我國發展大數據存在哪些問題

您好,一是信息孤島普遍存在。跨部門、跨行業的數據共享仍不順暢,有價值的公共信息資源和商業數據開放程度低,基本處於死鎖狀態,無法順暢流動。
二是對大數據產業發展規律認識不足。全社會尚未形成對大數據產業發展規律的客觀、科學的認識,一些地方誤將數據中心建設視為大數據產業發展重點,盲目追逐硬體設施投資,輕視了數據資源匯聚、積累、處理與應用能力建設,未能主動推進大數據產業發展與應用需求間的對接。
三是技術創新與支撐能力不足。大數據需要從底層晶元到基礎軟體再到應用分析軟體等信息產業全產業鏈的支撐,無論是新型計算平台、分布式計算架構,還是大數據處理、分析和呈現方面與國外均存在較大差距,難以滿足各行各業大數據應用需求。
四是數據資源建設和應用水平低。用戶普遍不重視數據資源的建設,即使有數據意識的機構也大多隻重視數據的簡單存儲,很少針對後續應用需求進行加工整理。數據資源普遍存在質量差,標准規范缺乏,管理能力弱,數據價值難以被有效挖掘利用的問題。
五是信息安全和數據管理體系尚未建立。數據所有權、隱私權等相關法律法規和信息安全、開放共享等標准規范缺乏,技術安全防範和管理能力不夠,尚未建立起兼顧安全與發展的數據開放、管理和信息安全保障體系,制約了大數據發展。
六是人才隊伍建設亟須加強。綜合掌握數學、統計學、計算機等相關學科及應用領域知識的綜合性數據科學人才缺乏,遠不能滿足發展需要,尤其是缺乏既熟悉行業業務需求,又掌握大數據技術與管理的綜合型人才。

5. 大數據面臨哪些安全與隱私問題

在大數據環境下,人們上傳的數據會面臨這些問題:
一:數據安全隱患問題;注要表現在(一)大數據遭受異常攻擊,造成安全隱患。(二)大數據泄露風險。(三)大數據傳輸過程的安全隱患。(四)大數據存儲管理風險。
二、大數據隱私問題;主要表現在(一)個人隱私保護。(二)傳統安全措施難以適配。(三)數據訪問控制愈加復雜。

6. 大數據安全層面的風險主要包括

大數據在應用和存儲中存在著一系列安全風險,包括以下幾個層面:
數據泄露風險:大數據的存儲和傳輸,容易面臨數據泄露的風險。這些數據可能是敏感性數據,如個人身份信息、財務信息、醫療記錄等。
數據完整性風險:大數據存儲和傳輸中,數據可能會遭受損壞、篡改或丟失,因此需要採取保護措施,保證大數據的完整性。
許可權管理風險:「大數據時代」涉及眾多數據源,管理人員要對各類數據源的許可權進行仔細的分析和考慮,設置合適的許可權,避免數據泄漏、篡改等風險。
命令注入風險:黑客利用安全漏洞,通過構造特殊的輸入進行攻擊,從而在系統內執行惡意命令,造成系統癱瘓、用戶數據丟失等風險。
惡意軟體攻擊:惡意軟體是指那些被創建來入侵計算機、網路或移動設備的軟體,通過惡意指令來獲取敏感數據,竊取隱私信息,或者破壞系統的完整性。
供應鏈風險:大數據往往依賴於雲服務、第三方應用等,這些供應商存在安全問題時,會直接影響大數據的安全。
數據處理風險:大數據可能存在各種數據處理問題,如特徵選擇錯誤、處沒爛理數據集不準確、應用演算法核閉缺陷等,從而導致大數據的隱私和安全問題。
這些安全風險需要引起我們的注意,企業或個人在使用、處理與存儲大數據時,應制定安全策略和措施,加強數據管理與安枯氏漏全運維,從而有效地緩解數據的安全風險。

7. 大數據爆發性增長 存儲技術面臨難題

大數據爆發性增長 存儲技術面臨難題

隨著大數據應用的爆發性增長,大數據已經衍生出了自己獨特的架構,而且也直接推動了存儲、網路以及計算技術的發展。畢竟處理大數據這種特殊的需求是一個新的挑戰。硬體的發展最終還是由軟體需求推動的。大數據本身意味著非常多需要使用標准存儲技術來處理的數據。大數據可能由TB級(或者甚至PB級)信息組成,既包括結構化數據(資料庫、日誌、SQL等)以及非結構化數據(社交媒體帖子、感測器、多媒體數據)。此外,大部分這些數據缺乏索引或者其他組織結構,可能由很多不同文件類型組成。從目前技術發展的情況來看,大數據存儲技術的發展正面臨著以下幾個難題:

1、容量問題

這里所說的「大容量」通常可達到PB級的數據規模,因此,海量數據存儲系統也一定要有相應等級的擴展能力。與此同時,存儲系統的擴展一定要簡便,可以通過增加模塊或磁碟櫃來增加容量,甚至不需要停機。

「大數據」應用除了數據規模巨大之外,還意味著擁有龐大的文件數量。因此如何管理文件系統層累積的元數據是一個難題,處理不當的話會影響到系統的擴展能力和性能,而傳統的NAS系統就存在這一瓶頸。所幸的是,基於對象的存儲架構就不存在這個問題,它可以在一個系統中管理十億級別的文件數量,而且還不會像傳統存儲一樣遭遇元數據管理的困擾。基於對象的存儲系統還具有廣域擴展能力,可以在多個不同的地點部署並組成一個跨區域的大型存儲基礎架構。

2、延遲問題

「大數據」應用還存在實時性的問題。有很多「大數據」應用環境需要較高的IOPS性能,比如HPC高性能計算。此外,伺服器虛擬化的普及也導致了對高IOPS的需求,正如它改變了傳統IT環境一樣。為了迎接這些挑戰,各種模式的固態存儲設備應運而生,小到簡單的在伺服器內部做高速緩存,大到全固態介質的可擴展存儲系統等等都在蓬勃發展。

3、並發訪問

一旦企業認識到大數據分析應用的潛在價值,他們就會將更多的數據集納入系統進行比較,同時讓更多的人分享並使用這些數據。為了創造更多的商業價值,企業往往會綜合分析那些來自不同平台下的多種數據對象。包括全局文件系統在內的存儲基礎設施就能夠幫助用戶解決數據訪問的問題,全局文件系統允許多個主機上的多個用戶並發訪問文件數據,而這些數據則可能存儲在多個地點的多種不同類型的存儲設備上。

4、安全問題

某些特殊行業的應用,比如金融數據、醫療信息以及政府情報等都有自己的安全標准和保密性需求。雖然對於IT管理者來說這些並沒有什麼不同,而且都是必須遵從的,但是,大數據分析往往需要多類數據相互參考,而在過去並不會有這種數據混合訪問的情況,因此大數據應用也催生出一些新的、需要考慮的安全性問題。

5、成本問題

成本問題「大」,也可能意味著代價不菲。而對於那些正在使用大數據環境的企業來說,成本控制是關鍵的問題。想控製成本,就意味著我們要讓每一台設備都實現更高的「效率」,同時還要減少那些昂貴的部件。

對成本控制影響最大的因素是那些商業化的硬體設備。因此,很多初次進入這一領域的用戶以及那些應用規模最大的用戶都會定製他們自己的「硬體平台」而不是用現成的商業產品,這一舉措可以用來平衡他們在業務擴展過程中的成本控制戰略。為了適應這一需求,現在越來越多的存儲產品都提供純軟體的形式,可以直接安裝在用戶已有的、通用的或者現成的硬體設備上。此外,很多存儲軟體公司還在銷售以軟體產品為核心的軟硬一體化裝置,或者與硬體廠商結盟,推出合作型產品。

6、數據的積累

許多大數據應用都會涉及到法規遵從問題,這些法規通常要求數據要保存幾年或者幾十年。比如醫療信息通常是為了保證患者的生命安全,而財務信息通常要保存7年。而有些使用大數據存儲的用戶卻希望數據能夠保存更長的時間,因為任何數據都是歷史記錄的一部分,而且數據的分析大都是基於時間段進行的。要實現長期的數據保存,就要求存儲廠商開發出能夠持續進行數據一致性檢測的功能以及其他保證長期高可用的特性。同時還要實現數據直接在原位更新的功能需求。

7、數據的靈活性

大數據存儲系統的基礎設施規模通常都很大,因此必須經過仔細設計,才能保證存儲系統的靈活性,使其能夠隨著應用分析軟體一起擴容及擴展。在大數據存儲環境中,已經沒有必要再做數據遷移了,因為數據會同時保存在多個部署站點。一個大型的數據存儲基礎設施一旦開始投入使用,就很難再調整了,因此它必須能夠適應各種不同的應用類型和數據場景。

存儲介質正在改變,雲計算倍受青睞

存儲之於安防的地位,其已經不僅是一個設備而已,而是已經升華到了一個解決方案平台的地步。作為圖像數據和報警事件記錄的載體,存儲的重要性是不言而喻的。

安防監控應用對存儲的需求是什麼?首先,海量存儲的需求。其次,性能的要求。第三,價格的敏感度。第四,集中管理的要求。第五,網路化要求。安防監控技術發展到今天經歷了三個階段,即:模擬化、數字化、網路化。與之相適應,監控數據存儲也經歷了多個階段,即:VCR模擬數據存儲、DVR數字數據存儲,到現在的集中網路存儲,以及發展到雲存儲階段,正是在一步步迎合這種市場需求。在未來,安防監控隨著高清化,網路化,智能化的不斷發展,將對現有存儲方案帶來不斷挑戰,包括容量、帶寬的擴展問題和管理問題。那麼,基於大數據戰略的海量存儲系統--雲存儲就倍受青睞了。

基於大數據戰略的安防存儲優勢明顯

當前社會對於數據的依賴是前所未有的,數據已變成與硬資產和人同等重要的重要資料。如何存好、保護好、使用好這些海量的大數據,是安防行業面臨的重要問題之一。那麼基於大數據戰略的安防存儲其優勢何在?

目前的存儲市場上,原有的視頻監控方案容量、帶寬難以擴展。客戶往往需要采購更多更高端的設備來擴充容量,提高性能,隨之帶來的是成本的急劇增長以及系統復雜性的激增。同時,傳統的存儲模式很難在完全沒有業務停頓的情況下進行升級,擴容會對業務帶來巨大影響。其次,傳統的視頻監控方案難於管理。由於視頻監控系統一般規模較大,分布特徵明顯,大多獨立管理,這樣就把整個系統分割成了多個管理孤島,相互之間通信困難,難以協調工作,以提高整體性能。除此之外,綠色、安全等也是傳統視頻監控方案所面臨的突出問題。

基於大數據戰略的雲存儲技術與生俱來的高擴展、易管理、高安全等特性為傳統存儲面臨的問題帶來了解決的契機。利用雲存儲,用戶可以方便的進行容量、帶寬擴展,而不必停止業務,或改變系統架構。同時,雲存儲還具有高安全、低成本、綠色節能等特點。基於雲存儲的視頻監控解決方案是客戶應對挑戰很好的選擇。王宇說,進入二十一世紀,雲存儲作為一種新的存儲架構,已逐步走入應用階段,雲存儲不僅輕松突破了SAN的性能瓶頸,而且可以實現性能與容量的線性擴展,這對於擁有大量數據的安防監控用戶來說是一個新選擇。

以英特爾推出的Hadoop分布式文件系統(HDFS)為例,其提供了一個高度容錯性和高吞吐量的海量數據存儲解決方案。目前已經在各種大型在線服務和大型存儲系統中得到廣泛應用,已經成為海量數據存儲的事實標准。

隨著信息系統的快速發展,海量的信息需要可靠存儲的同時,還能被大量的使用者快速地訪問。傳統的存儲方案已經從構架上越來越難以適應近幾年來的信息系統業務的飛速發展,成為了業務發展的瓶頸和障礙。HDFS通過一個高效的分布式演算法,將數據的訪問和存儲分布在大量伺服器之中,在可靠地多備份存儲的同時還能將訪問分布在集群中的各個伺服器之上,是傳統存儲構架的一個顛覆性的發展。最重要的是,其可以滿足以下特性:可自我修復的分布式文件存儲系統,高可擴展性,無需停機動態擴容,高可靠性,數據自動檢測和復制,高吞吐量訪問,消除訪問瓶頸,使用低成本存儲和伺服器構建。

以上是小編為大家分享的關於大數據爆發性增長 存儲技術面臨難題的相關內容,更多信息可以關注環球青藤分享更多干貨

8. 雲計算時代大數據遇到哪些困難

現階斷大數據的困難主要在如下幾點:
1、信息壁壘降低了大數據產業專資源配置效率。大數據屬產業發展必須實現數據信息的自由流動和共享,如果數據不開放、不共享,數據整合就不能實現,數據價值也會大大降低。
2、 政府部門是社會信息的主要控制者,其信息又分別被不同部門和區域控制,而不同部門和區域間的數據標准各異,信息資源也就難以實現共享。
3、數據安全管理薄弱增加了大數據產業的發展風險。
數據安全和隱私保護是大數據產業發展的世界性難題,這主要體現在三個方面:其一,數據的海量存儲增加了數據安防的難度,可能造成大量數據損壞或丟失,造成難以想像的後果;其二,在大數據時代,數據的多元性和復雜性要求人們形成更強的安全意識,但現實中不論企業還是個人的安全意識還沒有從傳統的非信息時代轉變過來,存在巨大潛在風險;其三,網路攻擊帶來了數據安全風險,隨著大數據在政府、金融、公共事業等領域的廣泛運用,數據泄露帶來的損失遠遠超出行業范疇,而是全局性的國家安全問題。

閱讀全文

與大數據存儲面臨的問題有哪些相關的資料

熱點內容
聯通查詢賬號密碼修改 瀏覽:774
文件頭線到上紙邊距離是多少 瀏覽:36
蘋果手機怎樣備份文件在哪裡 瀏覽:425
zemax在哪裡編程ZPL 瀏覽:563
如何撤銷word空白頁 瀏覽:296
什麼叫網路連接超時 瀏覽:49
京東熱點代碼 瀏覽:484
慧博app下載的文件放在哪裡 瀏覽:859
PDF文件橫向太長顯示不出來 瀏覽:974
js緩存文件怎麼打開 瀏覽:983
網頁如何打開編程碼 瀏覽:369
網站被終止安全訪問怎麼辦 瀏覽:672
用微信送達文件 瀏覽:655
win7硬碟安裝文件損壞 瀏覽:394
最終幻想14版本職業 瀏覽:175
紅警2哪個版本好 瀏覽:290
app開發短視頻頁面用什麼技術 瀏覽:471
魅族mx3手機後台運行程序圖標怎麼去掉 瀏覽:344
微信號突然被永久封 瀏覽:298
代碼質量度量模型 瀏覽:338

友情鏈接