A. 怎麼理解現今時代是「大數據時代」
一切都可以以數據的形式表現出來,人們可以通過大數據手段做到許多曾經難以做到的事。
隨著信息技術的不斷發展,我們已經開始進入所謂的“大數據時代”。在這個時代當中,大資料庫對一切行為都有了一個數據化的表達,用量化的方式來分析我們生活中所遇到的一切。
這其實就是大數據在生活當中的表現,雖然我們還沒有意識到自己已經被影響,但是大數據確實無時無刻不在影響著人們的人生進程。
在生活可以被數據化的今天,大數據時代已經悄然來到。
B. 互聯網大數據有哪些好處多
大數據是大量、高速、多變的信息,它需要新型的處理方式去促成更強的決策能力、洞察力與最佳化處理。大數據為企業獲得更為深刻、全面的洞察能力提供了前所未有的空間與潛力。
藉助大數據及相關技術,我們可針對不同行為特徵的客戶進行針對性營銷,甚至能從「將一個產品推薦給一些合適的客戶」到「將一些合適的產品推薦給一個客戶」,得以更聚焦客戶,進行個性化精準營銷。
大數據時代下的精準營銷是指通過大數據獲取對象的喜好,行為偏好,對不同對象進行不同營銷。大數據精準營銷的核心可以概括為幾大關鍵詞:用戶、需求、識別、體驗。
億美軟通推出數據雲服務,延續億美的客戶服務、客戶營銷、客戶管理的公司經營理念,通過龐大的消費數據資源,為客戶提供數據驗證,精準營銷等數據級服務。簡單說就是為企業提供數據驗證和數據篩選業務。
C. 為什麼現在大部分互聯網公司使用的資料庫是MySQL
放在很久以前,MySQL是很少受待見的
,而現在MySQL越來越受到重視,包括銀行在內的一些系統也會採用MySQL。
放在很久以前,MySQL是很少受待見的
為什麼國內絕大多數互聯網公司使用的資料庫都是MySQL呢?主要原因可以歸結為以下這幾類:
1、LNMP架構模式的推動
Linux+Nginx+MySQL+PHP這種架構選型在中小型互聯網公司使用是最多的,也是最主流的。像淘寶早期也是這種技術選型。因為PHP+MySQL是「黃金搭檔」,加上PHP開源框架太多,市場佔有率很高,所以也催生了MySQL的發展。
2、大型公司去IOE化的推動:
在以前,一般的不差錢的大型企業在信息化這塊的選型較多的就是IOE(IBM小型機AIX系統+Oracle資料庫+EMC存儲),因為IOE能支撐龐大的業務、很穩定、說出去也是高大尚的。
但是IOE不是一般中小型企業能承擔的,IOE的投入巨大。所以在前幾年國內不少大型互聯網企業稱要去IOE化,2013年5月阿里巴巴最後一台IBM小型機下線,2013年07月淘寶廣告系統使用的Oracle資料庫下線,都是阿里巴巴在去IOE化路上的重要里程碑。
為什麼要去IOE呢?IOE的架構模式都是利用小型機和高端存儲設備來提供高性能的處理與存儲服務,這種架構是集中式的架構(比如將所有的數據集中在一個資料庫中),當性能不足時,就通過增加硬體(CPU/內存/磁碟)的方式來提高處理能力,而這種集中式架構不適應當下的大數據需求了。
去IOE的重要實施方案中有一點就是將集中式的Oracle換為分布式的MySQL集群,MySQL可以通過水平擴展來解決性能問題
。
去IOE的重要實施方案中有一點就是將集中式的Oracle換為分布式的MySQL集群,MySQL可以通過水平擴展來解決性能問題
3、開源免費
較Oracle、SQL
Server而言,MySQL是開源免費的
(雖然MySQL被Oracle了),不像Oracle和SQL
Server是需要商業付費的,而且價格昂貴。
較Oracle、SQL
Server而言,MySQL是開源免費的
以上就是我的觀點,對於這個問題大家是怎麼看待的呢?歡迎在下方評論區交流
~
我是科技領域創作者,歡迎關注我了解更多科技知識!
D. 大數據常用哪些資料庫(什麼是大資料庫)
通常資料庫分為關系型資料庫和非關系型資料庫,關系型資料庫的優勢到現在也是無可替代的,比如MySQL、SQLServer、Oracle、DB2、SyBase、Informix、PostgreSQL以及比較小型的Aess等等資料庫,這些數據納卜庫支持復雜的SQL操作和事務機制,適合小量數據讀寫場景;但是到了大數據時代,人們更多的數據和物聯網加入的數據已經超出了關系資料庫的承載范圍。
大數據時代初期,隨著數據請求並發量大不斷增大,一般都是採用的集群同虧搭步數據的方式處理,就是將資料庫分成了很多的小庫,每個資料庫的數據內容是不變的,都是保存了源資料庫的數據副本,通過同步或者非同步方式保證數據的一致性,每個庫設定特定的讀寫方式,比如主資料庫負責寫操作,從資料庫是負責讀操作,等等根據業務復雜程度以此類推,將業務在物理層面上進行了分離,但是這種方式依舊存在一定的負載壓力的問題,企業數據在不斷的擴增中,後面就採用分庫分表的方式解決,對讀寫負載進行分離,但是這種實現依舊存在不足,且需要不斷進行資料庫伺服器擴容。
NoSQL資料庫大致分為5種類型
1、列族資料庫:BigTable、HBase、Cassandra、AmazonSimpleDB、HadoopDB等,下面簡單介紹幾個
(1)Cassandra:Cassandra是一個列存儲資料庫,支持跨數據中心的數據復制。它的數據模型提供列索引,log-structured修改,支持反規范化,實體化視圖和嵌入超高速緩存。
(2)HBase:ApacheHbase源於Google的Bigtable,是一個開源、分布式、面向列存儲的模型。在Hadoop和HDFS之上提供了像Bigtable一銷茄拿樣的功能。
(3)AmazonSimpleDB:AmazonSimpleDB是一個非關系型數據存儲,它卸下資料庫管理的工作。開發者使用Web服務請求存儲和查詢數據項
(4)ApacheAumulo:ApacheAumulo的有序的、分布式鍵值數據存儲,基於Google的BigTable設計,建立在ApacheHadoop、Zookeeper和Thrift技術之上。
(5)Hypertable:Hypertable是一個開源、可擴展的資料庫,模仿Bigtable,支持分片。
(6)AzureTables:為要求大量非結構化數據存儲的應用提供NoSQL性能。表能夠自動擴展到TB級別,能通過REST和ManagedAPI訪問。
2、鍵值資料庫:Redis、SimpleDB、Scalaris、Memcached等,下面簡單介紹幾個
(1)Riak:Riak是一個開源,分布式鍵值資料庫,支持數據復制和容錯。(2)Redis:Redis是一個開源的鍵值存儲。支持主從式復制、事務,Pub/Sub、Lua腳本,還支持給Key添加時限。
(3)Dynamo:Dynamo是一個鍵值分布式數據存儲。它直接由亞馬遜Dynamo資料庫實現;在亞馬遜S3產品中使用。
(4)OracleNoSQLDatabase:來自Oracle的鍵值NoSQL資料庫。它支持事務ACID(原子性、一致性、持久性和獨立性)和JSON。
(5)OracleNoSQLDatabase:具備數據備份和分布式鍵值存儲系統。
(6)Voldemort:具備數據備份和分布式鍵值存儲系統。
(7)Aerospike:Aerospike資料庫是一個鍵值存儲,支持混合內存架構,通過強一致性和可調一致性保證數據的完整性。
3、文檔資料庫:MongoDB、CouchDB、Perservere、Terrastore、RavenDB等,下面簡單介紹幾個
(1)MongoDB:開源、面向文檔,也是當下最人氣的NoSQL資料庫。
(2)CounchDB:ApacheCounchDB是一個使用JSON的文檔資料庫,使用Javascript做MapRece查詢,以及一個使用HTTP的API。
(3)Couchbase:NoSQL文檔資料庫基於JSON模型。
(4)RavenDB:RavenDB是一個基於.NET語言的面向文檔資料庫。
(5)MarkLogic:MarkLogicNoSQL資料庫用來存儲基於XML和以文檔為中心的信息,支持靈活的模式。
4、圖資料庫:Neo4J、InfoGrid、OrientDB、GraphDB,下面簡單介紹幾個
(1)Neo4j:Neo4j是一個圖資料庫;支持ACID事務(原子性、獨立性、持久性和一致性)。
(2):一個圖資料庫用來維持和遍歷對象間的關系,支持分布式數據存儲。
(3):是結合使用了內存和磁碟,提供了高可擴展性,支持SPARQ、RDFS和Prolog推理。
5、內存數據網格:Hazelcast、OracleCoherence、TerracottaBigMemorry、GemFire、Infinispan、GridGain、GigaSpaces,下面簡單介紹幾個
(1)Hazelcast:HazelcastCE是一個開源數據分布平台,它允許開發者在資料庫集群之上共享和分割數據。
(2)OracleCoherence:Oracle的內存數據網格解決方案提供了常用數據的快速訪問能力,一致性支持事務處理能力和數據的動態劃分。
(3)TerracottaBigMemory:來自Terracotta的分布式內存管理解決方案。這項產品包括一個Ehcache界面、Terracotta管理控制台和BigMemory-Hadoop連接器。
(4)GemFire:VmwarevFabricGemFire是一個分布式數據管理平台,也是一個分布式的數據網格平台,支持內存數據管理、復制、劃分、數據識別路由和連續查詢。
(5)Infinispan:Infinispan是一個基於Java的開源鍵值NoSQL數據存儲,和分布式數據節點平台,支持事務,peer-to-peer及client/server架構。
(6)GridGain:分布式、面向對象、基於內存、SQLNoSQL鍵值資料庫。支持ACID事務。
(7)GigaSpaces:GigaSpaces內存數據網格能夠充當應用的記錄系統,並支持各種各樣的高速緩存場景。
E. 互聯網和大數據時代對管理實踐提出了什麼新要求
2012年10月29日,《中國雲•移動互聯網創新大獎賽決賽頒獎典禮暨創新創業論壇》在北航舉行。會上,中國雲產業聯盟聯席理事長,中國科學院院士、北航懷進鵬校長做主題報告。他表示在大數據時代面臨三大挑戰:1.軟體和數據處理能力。2.資源和共享管理的挑戰。3.數據處理的可信能力。現場速記如下。
中國科學院院士懷進鵬:尊敬的各位臨時,特別是從美國專程趕來參加我們這次論壇的陸奇先生,親愛的益民老總、李彥宏老總,我今天快點講,把時間留給陸奇先生,因為他晚上還要趕飛機,所以能夠讓他有更多的時間介紹在這個領域激動人心的事件,以及對未來的思考。
互聯網技術,我們都知道IT追求的目標,是追求更強更快和更高。所以,從過去微電子技術創造了很多新的機會,我們知道的摩爾定律,傳輸的通訊技術,給我們插入優秀的管道,計算和存儲能力的不斷增強,使得現在的超級計算機和存儲得以加強,但是現在由於新的發展形式,以及技術本身的壁壘,完全靠著傳統方式的增長,已經出現極大的局限性,最最重要的就是互聯網是我們一次重大變革的基礎。
最近也一本書說是第5次科技革命或者第3次工業革命。無一例外就是把互聯網應用和社會生活結合起來,成為一個最重要的發展內容。而從現在的大型企業和IT廠商的發展和實際運行的情況,我們已經看到數據確實成為戰略和經濟發展的一個重要基礎設施。這也得益於我們所談到的對信息技術快速的發展,而導致我們現在是以數據和服務為中心前提下開展新的工作和新的探索。數據整個的變化出現了一個巨量的增長。我們看全球數據增長的內容,每天現在的大數據量,以及現在目前完成的內容來看,90%的數字內容和十年前、二十年前、六十年前相比,有一個巨大的變化。但回過來,面對這么大的數據空間,我們可能帶來的一個新的挑戰就出現了,比如說到2007年的時候,Facebook使用數據倉庫存儲15個TB的數據,但到了2010年,每天是壓縮過的數據,都不是數據倉庫來存放的數據就比過去總和多4倍,商業並行數據很少有超過100個節點以上。現在雅虎的Hadoop集群超過4000個節點,Facebook倉庫節點超過2700個。而在大量的數據應用當中,還有在科學的私人計算、醫學的數據。也就是說大量的數據現在實時性開始影響我們整個的工作,生活,甚至經濟。
F. 互聯網大數據有哪些好處
大數據是大量、高速、多變的信息,它需要新型的處理方式去促成更強的決策能力回、洞察力與最佳化處答理。大數據為企業獲得更為深刻、全面的洞察能力提供了前所未有的空間與潛力。
藉助大數據及相關技術,我們可針對不同行為特徵的客戶進行針對性營銷,甚至能從「將一個產品推薦給一些合適的客戶」到「將一些合適的產品推薦給一個客戶」,得以更聚焦客戶,進行個性化精準營銷。
大數據時代下的精準營銷是指通過大數據獲取對象的喜好,行為偏好,對不同對象進行不同營銷。大數據精準營銷的核心可以概括為幾大關鍵詞:用戶、需求、識別、體驗。
億美軟通推出數據雲服務,延續億美的客戶服務、客戶營銷、客戶管理的公司經營理念,通過龐大的消費數據資源,為客戶提供數據驗證,精準營銷等數據級服務。簡單說就是為企業提供數據驗證和數據篩選業務。
G. 國家大資料庫在哪裡
中心基地-北京
2015年1月16日,由藍汛與北京市供銷總社共同投資的藍訊首鳴國際數據中心項目啟動儀式在北京天竺綜合保稅區舉行。據了解,該數據中心是北京首個國家級、超大規模雲數據中心,產業園佔地面積8萬平方米,包含9棟數據中心機房和1棟感知體驗中心。
南方基地-貴州
2015年7月9日,首個國家級數據中心 ——災備中心落戶貴州,該大資料庫災備中心在貴州揭牌,這標志著大數據專項行動第一階段任務順利落。位於貴州貴安新區的國家旅遊大資料庫災備中心機房內,有著一根特殊的網路虛擬專線,這條專線跨越了北京與貴州之間2200多公里的距離,實現了國家旅遊局北京機房與貴州災備中心數據的同步傳輸和異地備份。
多年以來,200餘個大數據信息產業項目簽約落戶貴州,富士康、阿里巴巴、騰訊、華為等大型企業搶灘貴州發展。中國電信雲計算貴州信息園1.1期、中國移動(貴州)大數據中心、中國聯通貴安雲數據中心一期建成運營。中電樂觸、高新翼雲、翔明科技等第三方數據中心已建成並投運,目前數據中心伺服器達到2.2萬台;北京供銷社數據中心、惠普數據中心等一批項目已經啟動,預計今後將達5萬台伺服器規模。
北方基地-內蒙古
「烏蘭察布國家大數據災備中心啟動大會於2016年7月8日早上八點正式啟動」內蒙古主席布小林將出席會議。烏蘭察布市委市政府依據自身地理位置優越,地質板塊穩定,電力資源豐富,氣候冷涼適宜,臨近京津冀經濟圈核心市場等優勢,將信息產業作為戰略性新興產業來發展,致力於將烏蘭察布市打造成面向華北、服務京津的國家級雲計算產業基地,為承接高科技產業、加快產業轉型升級提供強有力的支撐。 市委市政府將為該建設國家大數據災備中心項目提供充足的土地與極具競爭力的投資政策吸引廣大企業參與建設
H. 在互聯網+及大數據時代,組織及管理者面臨著哪些新的挑戰和機遇
大數據泛指巨量的數據集,因可從中挖掘出有價值的信息而受到重視。《華爾街日報》將大數據時代、智能化生產和無線網路革命稱為引領未來繁榮的三大技術變革。有報告指出數據是一種生產資料,大數據是下一個創新、競爭、生產力提高的前沿。世界經濟論壇的報告認定大數據為新財富,價值堪比石油。因此,發達國家紛紛將開發利用大數據作為奪取新一輪競爭制高點的重要抓手。
大數據時代的來臨
互聯網特別是移動互聯網的發展,加快了信息化向社會經濟各方面、大眾日常生活的滲透。有資料顯示,1998年全球網民平均每月使用流量是1MB(兆位元組),2000年是10MB,2003年是100MB,2008年是1GB(1GB等於1024MB),2014年將是10GB。全網流量累計達到1EB(即10億GB或1000PB)的時間在2001年是一年,在2004年是一個月,在2007年是一周,而2013年僅需一天,即一天產生的信息量可刻滿1.88億張DVD光碟。我國網民數居世界之首,每天產生的數據量也位於世界前列。淘寶網站每天有超過數千萬筆交易,單日數據產生量超過50TB(1TB等於1000GB),存儲量40PB(1PB等於1000TB)。網路公司目前數據總量接近1000PB,存儲網頁數量接近1萬億頁,每天大約要處理60億次搜索請求,幾十PB數據。一個8Mbps(兆比特每秒)的攝像頭一小時能產生3.6GB數據,一個城市若安裝幾十萬個交通和安防攝像頭,每月產生的數據量將達幾十PB。醫院也是數據產生集中的地方。現在,一個病人的CT影像數據量達幾十GB,而全國每年門診人數以數十億計,並且他們的信息需要長時間保存。總之,大數據存在於各行各業,一個大數據時代正在到來。
信息爆炸不自今日起,但近年來人們更加感受到大數據的來勢迅猛。一方面,網民數量不斷增加,另一方面,以物聯網和家電為代表的聯網設備數量增長更快。2007年全球有5億個設備聯網,人均0.1個;2013年全球將有500億個設備聯網,人均70個。隨著寬頻化的發展,人均網路接入帶寬和流量也迅速提升。全球新產生數據年增40%,即信息總量每兩年就可以翻番,這一趨勢還將持續。目前,單一數據集容量超過幾十TB甚至數PB已不罕見,其規模大到無法在容許的時間內用常規軟體工具對其內容進行抓取、管理和處理。
數據規模越大,處理的難度也越大,但對其進行挖掘可能得到的價值更大,這就是大數據熱的原因。首先,大數據反映輿情和民意。網民在網上產生的海量數據,記錄著他們的思想、行為乃至情感,這是信息時代現實社會與網路空間深度融合的產物,蘊含著豐富的內涵和很多規律性信息。根據中國互聯網路信息中心統計,2012年底我國網民數為5.64億,手機網民為4.2億,通過分析相關數據,可以了解大眾需求、訴求和意見。其次,企業和政府的信息系統每天源源不斷產生大量數據。根據一個公司的調研報告,全球企業的信息存儲總量已達2.2ZB(1ZB等於1000EB),年增67%。醫院、學校和銀行等也都會收集和存儲大量信息。政府可以部署感測器等感知單元,收集環境和社會管理所需的信息。2011年,英國《自然》雜志曾出版專刊指出,倘若能夠更有效地組織和使用大數據,人類將得到更多的機會發揮科學技術對社會發展的巨大推動作用。
大數據應用的領域
大數據技術可運用到各行各業。宏觀經濟方面,IBM日本公司建立經濟指標預測系統,從互聯網新聞中搜索影響製造業的480項經濟數據,計算采購經理人指數的預測值。印第安納大學利用谷歌公司提供的心情分析工具,從近千萬條網民留言中歸納出六種心情,進而對道瓊斯工業指數的變化進行預測,准確率達到87%。製造業方面,華爾街對沖基金依據購物網站的顧客評論,分析企業產品銷售狀況;一些企業利用大數據分析實現對采購和合理庫存量的管理,通過分析網上數據了解客戶需求、掌握市場動向。有資料顯示,全球零售商因盲目進貨導致的銷售損失每年達1000億美元,這方面的數據分析大有作為。
在農業領域,矽谷有個氣候公司,從美國氣象局等資料庫中獲得幾十年的天氣數據,將各地降雨、氣溫、土壤狀況與歷年農作物產量的相關度做成精密圖表,預測農場來年產量,向農戶出售個性化保險。在商業領域,沃爾瑪公司通過分析銷售數據,了解顧客購物習慣,得出適合搭配在一起出售的商品,還可從中細分顧客群體,提供個性化服務。在金融領域,華爾街「德溫特資本市場」公司分析3.4億微博賬戶留言,判斷民眾情緒,依據人們高興時買股票、焦慮時拋售股票的規律,決定公司股票的買入或賣出。阿里公司根據在淘寶網上中小企業的交易狀況篩選出財務健康和講究誠信的企業,對他們發放無需擔保的貸款。目前已放貸300多億元,壞賬率僅0.3%。
在醫療保健領域,「谷歌流感趨勢」項目依據網民搜索內容分析全球范圍內流感等病疫傳播狀況,與美國疾病控制和預防中心提供的報告對比,追蹤疾病的精確率達到97%。社交網路為許多慢性病患者提供臨床症狀交流和診治經驗分享平台,醫生藉此可獲得在醫院通常得不到的臨床效果統計數據。基於對人體基因的大數據分析,可以實現對症下葯的個性化治療。在社會安全管理領域,通過對手機數據的挖掘,可以分析實時動態的流動人口來源、出行,實時交通客流信息及擁堵情況。利用簡訊、微博、微信和搜索引擎,可以收集熱點事件,挖掘輿情,還可以追蹤造謠信息的源頭。美國麻省理工學院通過對十萬多人手機的通話、簡訊和空間位置等信息進行處理,提取人們行為的時空規律性,進行犯罪預測。在科學研究領域,基於密集數據分析的科學發現成為繼實驗科學、理論科學和計算科學之後的第四個範例,基於大數據分析的材料基因組學和合成生物學等正在興起。
報告推測,如果把大數據用於美國的醫療保健,一年產生潛在價值3000億美元,用於歐洲的公共管理可獲得年度潛在價值2500億歐元;服務提供商利用個人位置數據可獲得潛在的消費者年度盈餘6000億美元;利用大數據分析,零售商可增加運營利潤60%,製造業設備裝配成本會減少50%。
大數據技術的挑戰和啟示
目前,大數據技術的運用仍存在一些困難與挑戰,體現在大數據挖掘的四個環節中。首先在數據收集方面。要對來自網路包括物聯網和機構信息系統的數據附上時空標志,去偽存真,盡可能收集異源甚至是異構的數據,必要時還可與歷史數據對照,多角度驗證數據的全面性和可信性。其次是數據存儲。要達到低成本、低能耗、高可靠性目標,通常要用到冗餘配置、分布化和雲計算技術,在存儲時要按照一定規則對數據進行分類,通過過濾和去重,減少存儲量,同時加入便於日後檢索的標簽。第三是數據處理。有些行業的數據涉及上百個參數,其復雜性不僅體現在數據樣本本身,更體現在多源異構、多實體和多空間之間的交互動態性,難以用傳統的方法描述與度量,處理的復雜度很大,需要將高維圖像等多媒體數據降維後度量與處理,利用上下文關聯進行語義分析,從大量動態而且可能是模稜兩可的數據中綜合信息,並導出可理解的內容。第四是結果的可視化呈現,使結果更直觀以便於洞察。目前,盡管計算機智能化有了很大進步,但還只能針對小規模、有結構或類結構的數據進行分析,談不上深層次的數據挖掘,現有的數據挖掘演算法在不同行業中難以通用。
大數據技術的運用前景是十分光明的。當前,我國正處在全面建成小康社會征程中,工業化、信息化、城鎮化、農業現代化任務很重,建設下一代信息基礎設施,發展現代信息技術產業體系,健全信息安全保障體系,推進信息網路技術廣泛運用,是實現四化同步發展的保證。大數據分析對我們深刻領會世情和國情,把握規律,實現科學發展,做出科學決策具有重要意義,我們必須重新認識數據的重要價值。
為了開發大數據這一金礦,我們要做的工作還很多。首先,大數據分析需要有大數據的技術與產品支持。發達國家一些信息技術(IT)企業已提前發力,通過加大開發力度和兼並等多種手段,努力向成為大數據解決方案提供商轉型。國外一些企業打出免費承接大數據分析的招牌,既是為了練兵,也是為了獲取情報。過分依賴國外的大數據分析技術與平台,難以迴避信息泄密風險。有些日常生活信息看似無關緊要,其實從中也可摸到國家經濟和社會脈搏。因此,我們需要有自主可控的大數據技術與產品。美國政府2012年3月發布《大數據研究與發展倡議》,這是繼1993年宣布「信息高速公路」之後又一重大科技部署,聯邦政府和一些部委已安排資金用於大數據開發。我們與發達國家有不少差距,更需要國家政策支持。
中國人口居世界首位,將會成為產生數據量最多的國家,但我們對數據保存不夠重視,對存儲數據的利用率也不高。此外,我國一些部門和機構擁有大量數據卻不願與其他部門共享,導致信息不完整或重復投資。政府應通過體制機制改革打破數據割據與封鎖,應注重公開信息,應重視數據挖掘。美國聯邦政府建立統一數據開放門戶網站,為社會提供信息服務並鼓勵挖掘與利用。例如,提供各地天氣與航班延誤的關系,推動航空公司提升正點率。
大數據的挖掘與利用應當有法可依。去年底全國人大通過的加強網路信息保護的決定是一個好的開始,當前要盡快制定「信息公開法」以適應大數據時代的到來。現在很多機構和企業擁有大量客戶信息。應當既鼓勵面向群體、服務社會的數據挖掘,又要防止侵犯個體隱私;既提倡數據共享,又要防止數據被濫用。此外,還需要界定數據挖掘、利用的許可權和范圍。大數據系統本身的安全性也是值得特別關注的,要注意技術安全性和管理制度安全性並重,防止信息被損壞、篡改、泄露或被竊,保護公民和國家的信息安全。
大數據時代呼喚創新型人才。預測大數據將為全球帶來440萬個IT新崗位和上千萬個非IT崗位。預測美國到2018年需要深度數據分析人才44萬—49萬,缺口14萬—19萬人;需要既熟悉本單位需求又了解大數據技術與應用的管理者150萬,這方面的人才缺口更大。中國是人才大國,但能理解與應用大數據的創新人才更是稀缺資源。
大數據是新一代信息技術的集中反映,是一個應用驅動性很強的服務領域,是具有無窮潛力的新興產業領域;目前,其標准和產業格局尚未形成,這是我國實現跨越式發展的寶貴機會。我們要從戰略上重視大數據的開發利用,將它作為轉變經濟增長方式的有效抓手,但要注意科學規劃,切忌一哄而上。