❶ 工業企業數據一年多少TB
工業企業數據一年20TB左右。
調查顯示,我國工業企業的數據資源存量普遍不大,66%的企業數據總量都在20TB以下,還不到一個省級電信運營商日增數據量的十分之一;管理手段比較落後,51%的企業仍在使用文檔或更原始的方式進行數據的管理。數據孤島情況普遍,企業對自身可用的數據資產缺乏全面了解。無論從管理手段上,還是技術手段上,都遠遠不能支撐工業互聯網發展應用後數據管理的風險和復雜度。
❷ 在互聯網+及大數據時代,組織及管理者面臨著哪些新的挑戰和機遇
大數據泛指巨量的數據集,因可從中挖掘出有價值的信息而受到重視。《華爾街日報》將大數據時代、智能化生產和無線網路革命稱為引領未來繁榮的三大技術變革。有報告指出數據是一種生產資料,大數據是下一個創新、競爭、生產力提高的前沿。世界經濟論壇的報告認定大數據為新財富,價值堪比石油。因此,發達國家紛紛將開發利用大數據作為奪取新一輪競爭制高點的重要抓手。
大數據時代的來臨
互聯網特別是移動互聯網的發展,加快了信息化向社會經濟各方面、大眾日常生活的滲透。有資料顯示,1998年全球網民平均每月使用流量是1MB(兆位元組),2000年是10MB,2003年是100MB,2008年是1GB(1GB等於1024MB),2014年將是10GB。全網流量累計達到1EB(即10億GB或1000PB)的時間在2001年是一年,在2004年是一個月,在2007年是一周,而2013年僅需一天,即一天產生的信息量可刻滿1.88億張DVD光碟。我國網民數居世界之首,每天產生的數據量也位於世界前列。淘寶網站每天有超過數千萬筆交易,單日數據產生量超過50TB(1TB等於1000GB),存儲量40PB(1PB等於1000TB)。網路公司目前數據總量接近1000PB,存儲網頁數量接近1萬億頁,每天大約要處理60億次搜索請求,幾十PB數據。一個8Mbps(兆比特每秒)的攝像頭一小時能產生3.6GB數據,一個城市若安裝幾十萬個交通和安防攝像頭,每月產生的數據量將達幾十PB。醫院也是數據產生集中的地方。現在,一個病人的CT影像數據量達幾十GB,而全國每年門診人數以數十億計,並且他們的信息需要長時間保存。總之,大數據存在於各行各業,一個大數據時代正在到來。
信息爆炸不自今日起,但近年來人們更加感受到大數據的來勢迅猛。一方面,網民數量不斷增加,另一方面,以物聯網和家電為代表的聯網設備數量增長更快。2007年全球有5億個設備聯網,人均0.1個;2013年全球將有500億個設備聯網,人均70個。隨著寬頻化的發展,人均網路接入帶寬和流量也迅速提升。全球新產生數據年增40%,即信息總量每兩年就可以翻番,這一趨勢還將持續。目前,單一數據集容量超過幾十TB甚至數PB已不罕見,其規模大到無法在容許的時間內用常規軟體工具對其內容進行抓取、管理和處理。
數據規模越大,處理的難度也越大,但對其進行挖掘可能得到的價值更大,這就是大數據熱的原因。首先,大數據反映輿情和民意。網民在網上產生的海量數據,記錄著他們的思想、行為乃至情感,這是信息時代現實社會與網路空間深度融合的產物,蘊含著豐富的內涵和很多規律性信息。根據中國互聯網路信息中心統計,2012年底我國網民數為5.64億,手機網民為4.2億,通過分析相關數據,可以了解大眾需求、訴求和意見。其次,企業和政府的信息系統每天源源不斷產生大量數據。根據一個公司的調研報告,全球企業的信息存儲總量已達2.2ZB(1ZB等於1000EB),年增67%。醫院、學校和銀行等也都會收集和存儲大量信息。政府可以部署感測器等感知單元,收集環境和社會管理所需的信息。2011年,英國《自然》雜志曾出版專刊指出,倘若能夠更有效地組織和使用大數據,人類將得到更多的機會發揮科學技術對社會發展的巨大推動作用。
大數據應用的領域
大數據技術可運用到各行各業。宏觀經濟方面,IBM日本公司建立經濟指標預測系統,從互聯網新聞中搜索影響製造業的480項經濟數據,計算采購經理人指數的預測值。印第安納大學利用谷歌公司提供的心情分析工具,從近千萬條網民留言中歸納出六種心情,進而對道瓊斯工業指數的變化進行預測,准確率達到87%。製造業方面,華爾街對沖基金依據購物網站的顧客評論,分析企業產品銷售狀況;一些企業利用大數據分析實現對采購和合理庫存量的管理,通過分析網上數據了解客戶需求、掌握市場動向。有資料顯示,全球零售商因盲目進貨導致的銷售損失每年達1000億美元,這方面的數據分析大有作為。
在農業領域,矽谷有個氣候公司,從美國氣象局等資料庫中獲得幾十年的天氣數據,將各地降雨、氣溫、土壤狀況與歷年農作物產量的相關度做成精密圖表,預測農場來年產量,向農戶出售個性化保險。在商業領域,沃爾瑪公司通過分析銷售數據,了解顧客購物習慣,得出適合搭配在一起出售的商品,還可從中細分顧客群體,提供個性化服務。在金融領域,華爾街「德溫特資本市場」公司分析3.4億微博賬戶留言,判斷民眾情緒,依據人們高興時買股票、焦慮時拋售股票的規律,決定公司股票的買入或賣出。阿里公司根據在淘寶網上中小企業的交易狀況篩選出財務健康和講究誠信的企業,對他們發放無需擔保的貸款。目前已放貸300多億元,壞賬率僅0.3%。
在醫療保健領域,「谷歌流感趨勢」項目依據網民搜索內容分析全球范圍內流感等病疫傳播狀況,與美國疾病控制和預防中心提供的報告對比,追蹤疾病的精確率達到97%。社交網路為許多慢性病患者提供臨床症狀交流和診治經驗分享平台,醫生藉此可獲得在醫院通常得不到的臨床效果統計數據。基於對人體基因的大數據分析,可以實現對症下葯的個性化治療。在社會安全管理領域,通過對手機數據的挖掘,可以分析實時動態的流動人口來源、出行,實時交通客流信息及擁堵情況。利用簡訊、微博、微信和搜索引擎,可以收集熱點事件,挖掘輿情,還可以追蹤造謠信息的源頭。美國麻省理工學院通過對十萬多人手機的通話、簡訊和空間位置等信息進行處理,提取人們行為的時空規律性,進行犯罪預測。在科學研究領域,基於密集數據分析的科學發現成為繼實驗科學、理論科學和計算科學之後的第四個範例,基於大數據分析的材料基因組學和合成生物學等正在興起。
報告推測,如果把大數據用於美國的醫療保健,一年產生潛在價值3000億美元,用於歐洲的公共管理可獲得年度潛在價值2500億歐元;服務提供商利用個人位置數據可獲得潛在的消費者年度盈餘6000億美元;利用大數據分析,零售商可增加運營利潤60%,製造業設備裝配成本會減少50%。
大數據技術的挑戰和啟示
目前,大數據技術的運用仍存在一些困難與挑戰,體現在大數據挖掘的四個環節中。首先在數據收集方面。要對來自網路包括物聯網和機構信息系統的數據附上時空標志,去偽存真,盡可能收集異源甚至是異構的數據,必要時還可與歷史數據對照,多角度驗證數據的全面性和可信性。其次是數據存儲。要達到低成本、低能耗、高可靠性目標,通常要用到冗餘配置、分布化和雲計算技術,在存儲時要按照一定規則對數據進行分類,通過過濾和去重,減少存儲量,同時加入便於日後檢索的標簽。第三是數據處理。有些行業的數據涉及上百個參數,其復雜性不僅體現在數據樣本本身,更體現在多源異構、多實體和多空間之間的交互動態性,難以用傳統的方法描述與度量,處理的復雜度很大,需要將高維圖像等多媒體數據降維後度量與處理,利用上下文關聯進行語義分析,從大量動態而且可能是模稜兩可的數據中綜合信息,並導出可理解的內容。第四是結果的可視化呈現,使結果更直觀以便於洞察。目前,盡管計算機智能化有了很大進步,但還只能針對小規模、有結構或類結構的數據進行分析,談不上深層次的數據挖掘,現有的數據挖掘演算法在不同行業中難以通用。
大數據技術的運用前景是十分光明的。當前,我國正處在全面建成小康社會征程中,工業化、信息化、城鎮化、農業現代化任務很重,建設下一代信息基礎設施,發展現代信息技術產業體系,健全信息安全保障體系,推進信息網路技術廣泛運用,是實現四化同步發展的保證。大數據分析對我們深刻領會世情和國情,把握規律,實現科學發展,做出科學決策具有重要意義,我們必須重新認識數據的重要價值。
為了開發大數據這一金礦,我們要做的工作還很多。首先,大數據分析需要有大數據的技術與產品支持。發達國家一些信息技術(IT)企業已提前發力,通過加大開發力度和兼並等多種手段,努力向成為大數據解決方案提供商轉型。國外一些企業打出免費承接大數據分析的招牌,既是為了練兵,也是為了獲取情報。過分依賴國外的大數據分析技術與平台,難以迴避信息泄密風險。有些日常生活信息看似無關緊要,其實從中也可摸到國家經濟和社會脈搏。因此,我們需要有自主可控的大數據技術與產品。美國政府2012年3月發布《大數據研究與發展倡議》,這是繼1993年宣布「信息高速公路」之後又一重大科技部署,聯邦政府和一些部委已安排資金用於大數據開發。我們與發達國家有不少差距,更需要國家政策支持。
中國人口居世界首位,將會成為產生數據量最多的國家,但我們對數據保存不夠重視,對存儲數據的利用率也不高。此外,我國一些部門和機構擁有大量數據卻不願與其他部門共享,導致信息不完整或重復投資。政府應通過體制機制改革打破數據割據與封鎖,應注重公開信息,應重視數據挖掘。美國聯邦政府建立統一數據開放門戶網站,為社會提供信息服務並鼓勵挖掘與利用。例如,提供各地天氣與航班延誤的關系,推動航空公司提升正點率。
大數據的挖掘與利用應當有法可依。去年底全國人大通過的加強網路信息保護的決定是一個好的開始,當前要盡快制定「信息公開法」以適應大數據時代的到來。現在很多機構和企業擁有大量客戶信息。應當既鼓勵面向群體、服務社會的數據挖掘,又要防止侵犯個體隱私;既提倡數據共享,又要防止數據被濫用。此外,還需要界定數據挖掘、利用的許可權和范圍。大數據系統本身的安全性也是值得特別關注的,要注意技術安全性和管理制度安全性並重,防止信息被損壞、篡改、泄露或被竊,保護公民和國家的信息安全。
大數據時代呼喚創新型人才。預測大數據將為全球帶來440萬個IT新崗位和上千萬個非IT崗位。預測美國到2018年需要深度數據分析人才44萬—49萬,缺口14萬—19萬人;需要既熟悉本單位需求又了解大數據技術與應用的管理者150萬,這方面的人才缺口更大。中國是人才大國,但能理解與應用大數據的創新人才更是稀缺資源。
大數據是新一代信息技術的集中反映,是一個應用驅動性很強的服務領域,是具有無窮潛力的新興產業領域;目前,其標准和產業格局尚未形成,這是我國實現跨越式發展的寶貴機會。我們要從戰略上重視大數據的開發利用,將它作為轉變經濟增長方式的有效抓手,但要注意科學規劃,切忌一哄而上。
❸ 現在企業級的資料庫一般數據量是多大
這怎麼好比,根據使用資料庫的類型,資料庫的架構,表的數量,企業規模業務形態的不同,使用時間長短不同,數據量也不同啊,比如我們公司,批發企業,前一套「進銷存」(SQL2000)四年庫是8G多,現在一套ERP(Sybase12.5),一年半,庫是3G多。同行另一家公司,一百多家連鎖葯房的企業,二年數據量都有21G(Sybase12.5)。
❹ 大數據的產生背景是什麼
大數據有兩種含義:
一種是大批量的數據。量級有多大?比如通常讀一本幾百萬字的電子小說,每天專注地快速地閱讀,少說用時也需7-15天,而文檔在手機、電腦上存儲佔用空間有多大呢?10MB而已,也就是說如果按照7天處理10MB文字,推算1GB的內容需耗時710+天,相當於兩年時間,而當下互聯網企業每天產生的數據量是10GB-10000GB不等,這樣的數據量,如果用一個人去處理的話,每天的數據量得花20年到20000年,在時間長度和成本上而言幾乎是不可能實現的,因為這才是一天的數據量。同樣可以感受一下存儲成本:大家手機、電腦都有存儲空間,手機256GB應該為主流了,電腦2TB(2048GB)左右,即便存儲空間應景很大,而實際企業生產中用不了幾天就存儲不下了。大家想像一下,如果打開一個1GB大小的EXCEL或者TXT文本文檔會發生什麼現象呢?有興趣的小夥伴可以試一試,你會發現電腦變得超級慢超級卡,而且你甚至都打不開這個文檔。
第二種就是大數據處理技術,簡稱大數據。對企業而言企業絕對不能接受上述現象的發生,因為數據處理不了,相當於干再多活都不知道哪些賺了哪些賠了,企業是要靠賺錢來存活的,如果為了處理數據再購買更高性能的機器作為伺服器去處理這些信息,那成本將會極其高昂,企業負擔不起,於是乎就有人發出這樣的疑問:
有沒有一種可以讓很多台廉價的機器組建成一台牛逼的機器的技術?就好比合體技能一樣?
有需求就有大牛,很快,一項新的計算機計算技術框架——分布式數據處理框架誕生了,目的很明確,就是解決了上面提到的疑問——讓很多台廉價的機器組合起來變成了一個牛逼的、專門針對短時間內處理大量數據的系統,這就叫大數據處理技術。
如果你還是覺得理解不透徹,可以去多易教育的官網看看帶有圖片和講解視頻的專欄,通俗易懂的讓你迅速了解什麼是大數據,畢竟多易是大數據培訓行業的領頭羊嘛!
❺ 大數據是什麼多大的數據叫大數據
你好
多大的數據才算「大數據」
什麼是大數據有一個故事,說的是一位顧客訂購披薩時,披薩店可以立即調出這位顧客的許多信息,比如送披薩上門必有的家庭、單位等地址和電話,顧客的消費習慣從而推薦適合他的披薩種類,顧客名下的銀行卡透支情況從而確定他的支付方式,甚至顧客要自取披薩時,還能根據顧客名下車輛的停放位置預估他的到店時間等等。
從這個故事,我們可以看出大數據的一些關鍵特徵,比如容量大、類型多、關聯性強、有價值等等。「大數據是以高容量、多樣性、存取速度快、應用價值高為主要特徵的數據集合,正快速發展為對數量巨大、來源分散、格式多樣的數據進行採集、存儲和關聯分析,從中發現新知識、創造新價值、提升新能力的新一代信息技術和服務業態。」工信部信息化和軟體服務業司副司長李冠宇接受經濟日報·中國經濟網記者采訪時說。
若能給你帶來幫助,請幫忙點擊採納,謝謝!!!
❻ 一TB等於多少GB多少MB
1TB=1024GB=1048576MB
換算公式:
1TB=1024GB;
1GB=1024MB
所以1024GB為1024×1024MB=1048576MB。
(6)企業日增數據量多少gb擴展閱讀:
數據量的提升:
截止到2012年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。
國際數據公司(IDC)的研究結果表明,2008年全球產生的數據量為0.49ZB,2009年的數據量為0.8ZB,2010年增長為1.2ZB,2011年的數量更是高達1.82ZB,相當於全球每人產生200GB以上的數據。
而到2012年為止,人類生產的所有印刷材料的數據量是200PB,全人類歷史上說過的所有話的數據量大約是5EB。
IBM的研究稱,每一天,全世界會上傳超過5億張圖片,每分鍾就有20小時時長的視頻被分享。然而,即使是人們每天創造的全部信息——包括語音通話、電子郵件和信息在內的各種通信,以及上傳的全部圖片、視頻與音樂,其信息量也無法匹及每一天所創造出的關於人們自身的數字信息量。這樣的趨勢會持續下去。