㈠ 大數據雲計算能否把握事物的本質和規律
當然可以,數據驅動已經是被公認的繼實驗觀測、演繹推理、計算模擬之後的人類認知世界的第四範式,通過大數據和雲計算,我們可以發現很多以前未知的知識,更好認知世界,甚至預測未來。雲計算革命把人類文明推向更高的層次,人類將進入一個真正理性的新科學時代,人們對精神世界的研究也將邏輯化、工具化。
大數據:就是數據量非常大,需要用雲計算來處理。新摩爾定律:人類自有史以來累積的數據總量,每過18個月,就會翻一番雲存儲:用雲計算的方法來構建分布式存儲系統,通過網路對外提供存儲服務,如HDFS、cStor等,雲資料庫:用雲計算的方法來構建分布式資料庫,通過網路對外提供數據管理服務,如HBase、數據立方等。
本書介紹了基於雲計算的大數據處理技術,重點介紹了一款高效的、實時分析處理海量數據的強有力工具數據立方。全書通過對當前主流的大數據處理系統進行深入剖析,闡述了數據立方產生的背景,介紹了數據立方的整體架構以及安裝和詳細開發流程,並給出了4個完整的數據立方綜合應用實例。
㈡ 大數據時代 大學哪些專業涉及大數據技術與應用
大數據時代 大學哪些專業涉及大數據技術與應用
早在1980年,未來學家阿爾文?托夫勒在 《第三次浪潮》一書中,就將大數據譽為「第三次浪潮的華彩樂章」。現在的大數據更是站在互聯網的風口浪尖上,是公眾津津樂道的熱門詞彙。同時這股熱潮也催熱了大學里的大數據專業。
到底什麼是大數據?本科專業中哪個專業是和它相對應的?一般開設在哪些院系?對外經濟貿易大學信息學院副院長華迎教授詳解這個大家關注的熱門專業。
一、專業解析
什麼是大數據?
進入互聯網時代,中國的網民人數已超7億,大數據的應用涉及到生活的方方面面。例如,你在網站上買書,商家就會根據你的喜好和其他購書者的評價給你推薦另外的書籍;手機定位數據和交通數據可以幫助城市規劃;甚至用戶的搜索習慣和股市都有很大關系。
在談到大數據的時候,人們往往知道的就是數據很大,但大數據≠大的數據。對外經濟貿易大學信息學院副院長華迎教授介紹:「現在的大數據包括來自於多種渠道的多類數據,其中主要來源網路數據。數據分析不是新的,一直都有,但是為什麼叫大數據呢?主要是因為網路數據的格式、體量、價值,都超出了傳統數據的規模。對這些海量信息的採集、存儲、分析、整合、控制而得到的數據就是大數據。大數據技術的意義不在於掌握龐大的數據信息,而在於對這些數據進行專業化處理,通過『加工』實現數據的『增值』,更好地輔助決策。」
數據科學與大數據技術專業
本科專業中和大數據相對應的是「數據科學與大數據技術」專業,它是2015年教育部公布的新增專業。2016年3月公布的《高校本科專業備案和審批結果》中,北京大學、對外經濟貿易大學和中南大學3所高校首批獲批開設「數據科學與大數據技術」專業。隨後第二年又有32所高校獲批「數據科學與大數據技術」專業。兩次獲批的名單中顯示,該專業學制為四年,大部分為工學。
「數據科學與大數據技術是個交叉性很強的專業,很難說完全歸屬於哪個獨立的學科。所以,不同的學校有的是信息學院申報,有的.是計算機學院牽頭申報,有的設在統計學院,還有的在經管學院。像北京大學這個專業是放在理學下,授予理學學位。大多數是設在工學計算機門類下,授予的是工學學位。」華迎教授說:「數據科學很早就存在,是個比較經典的學科,現在和大數據技術結合形成了這個專業。目前教育部設定的本科專業名稱為『數據科學與大數據技術』,專科名稱是『大數據技術與應用』。」
數據科學與大數據技術學什麼?
以對外經濟貿易大學該專業為例,專業知識結構包括數學、統計、計算機和大數據分析四大模塊,具體課程設置如下:
數學:數學分析一、數學分析二、高等代數、離散數學。統計學:概率論與數理統計、多元統計分析、隨機過程。計算機:數據結構、計算機組成原理、操作系統、資料庫系統原理、C++程序設計、Java程序設計、Python與大數據分析、科學計算與Matlab應用、R語言等。大數據分析:數據科學導論、機器學習與數據挖掘、信息檢索與數據處理、自然語言處理、智能計算、推薦系統原理、大數據分析技術基礎、數據可視化、大數據存儲與管理、大數據分析實踐等課程。
華迎教授介紹:「數據科學與大數據技術是一門實踐性很強的新興交叉復合型學科,無論是開設在哪個學院下,數學、統計學、計算機三大塊課程是必須得有。各高校在這幾門背景學科的基礎上,交叉融合其他的專業知識技能。如我校在數學、統計學、計算機知識體系模塊中又增加了體現學校特色的財經類行業應用和外語模塊,以提升學生的行業應用能力和國際化水平。根據各校偏重的專業方向,課程設置有所差異,感興趣的同學可以具體查看各校的專業和課程設置情況。」
二、專業與就業
行業增速快 人才缺口180萬
隨著移動互聯網和智能終端的普及,信息技術與經濟社會的交匯融合,引發了數據迅猛增長。新摩爾定律認為,人類有史以來的數據總量,每過18個月就會翻一番。而海量的數據蘊含著巨大生產力和商機。
2011年至2014年四年間,我國大數據處於起步階段,每年均增長在20%以上。2015年,大數據市場規模已達到98.9億元。2016年增速達到45%,超過160億元。預計2020年,我國大數據市場規模將超過8000億元,有望成世界第一數據資源大國。但數據開放度低、技術薄弱、人才缺失、行業應用不深入等都是產業發展中亟待解決的問題。
根據領英發布《2016年中國最熱職位人才報告》顯示,有六類熱門職位的人才當前都處於供不應求狀態,稀缺程度各有不同,其中,數據分析人才的供給指數最低,僅為0.05,屬於高度稀缺。
中國商業聯合會數據分析專業委員會資料顯示,未來3至5年,中國需要180萬數據人才,但截至目前,中國大數據從業人員只有約30萬人。同時,大數據行業選才的標准也在不斷變化。初期,大數據人才的需求主要集中在ETL研發、系統架構開發、數據倉庫研究等偏硬體領域,以IT、計算機背景的人才居多。隨著大數據往各垂直領域延伸發展,對統計學、數學專業的人才,數據分析、數據挖掘、人工智慧等偏軟體領域的需求加大。
大數據主要就業方向
2015年9月國務院印發《促進大數據發展行動綱要》,系統部署大數據發展工作。《綱要》明確提出了七方面政策機制,其中第六條就是加強專業人才培養,建立健全多層次、多類型的大數據人才培養體系。目前,大數據主要有三大就業方向:大數據系統研發類、大數據應用開發類和大數據分析類。具體崗位如:大數據分析師、大數據工程師等。
「大數據分析師是用適當的統計分析方法對收集來的大量數據進行分析,強調的是數據的應用,側重於統計層面內容會多一些。比如做產品經理,可以通過數據建立金融模型,來推出一些理財產品。而大數據工程師則側重於技術,主要是圍繞大數據平台系統級的研發,偏開發層面。」華迎教授介紹:「我們把大數據分析在業務中使用的流程總結起來,分為以下幾個步驟:數據獲取和預處理、數據存儲管理、數據分析建模、數據可視化。在這個應用流程中,畢業生可以根據自己的興趣和特長,在不同的環節選擇就業。」
三、報考指南
院校開設情況
教育部關於公布2015年度普通高等學校本科專業備案和審批結果的通知教育部關於公布2016年度普通高等學校本科專業備案和審批結果的通知在「教育部2015年度普通高等學校本科專業備案和審批結果」中北京大學、中南大學、對外經貿大學成為首批開設 「數據科學與大數據技術」本科專業的高校,隨後中國人民大學、北京郵電大學、復旦大學等32所高校成為第二批成功申請該專業的高校。目前,我國已有35所高校獲批「數據科學與大數據技術」本科專業,第三批申請結果也即將公布。
數據科學與大數據技術是個交叉性強、跨學科的專業,很難說是完全歸屬與那個獨立的學科。高校牽頭申報的學院不同,培養重點和授予的學位可能不一樣。因為課程來自於不同的學院,也有高校是聯合一些學院單獨成立機構來申報。從名單可以看出,在大部分開設院校中該專業都屬於工學類,有個別院校將其歸屬在理學門類,授予理學學位。
有志於學習數據科學與大數據技術專業的學生,可以從大學的傳統優勢領域和行業背景考慮選擇。比如,復旦大學的大數據技術本科專業是設在大數據學院下;北京大學是在數學院開設了該專業,偏數學的內容更多一些。對外經濟貿易大學該專業設在信息學院,因為財經是學校傳統優勢,專業還會偏重經濟、金融等相關學科領域的知識。
錄取分數不低
從2017年數據科學與大數據技術專業的錄取情況看,該專業的錄取分數還是比較高的。以對外經濟貿易大學和重慶理工大學為例,2017年對外經貿大學數據科學與大數據技術專業在京理科一批錄取最高分653分,最低分646分,平均分650分,平均分高出北京一本批次線113分。
重慶理工大學理學院院長李波介紹,學校理學院有金融數學、數學與應用數學、信息與計算科學、應用統計學、應用物理學、新能源科學與工程專業,數據科學與大數據技術是2017年獲批後開設的。盡管該專業屬於本科二批招生,但首批數據科學與大數據技術專業所招73名學生的平均分超一本線20分左右,並且第一志願錄取率達百分之百。
只招理科生 注意大類招生
考生報考時要注意,目前獲批開設的院校並非在所有省都有招生計劃,還有的高校是按大類招生。如北京郵電大學該專業2017年本科就是按計算機大類招生。隨著各省高考改革的實施,越來越多的省份加入新高考的序列,未來會有更多的高校施行按大類招生。
值得注意的是,數據科學與大數據技術只招理科生,但女生的比例並不低。據華迎教授介紹:「第一年招生時,我們以為這純工科專業絕大部分都會是男生報考,錄取後發現女生還是很多的,女生比例大概佔了這個專業總人數的一半兒。」 重慶理工大學2017年的首批73名學生中,男生45人,女生28人,女生比例占總人數38%。
㈢ 為什麼說「大數據帶給我們的是一種意義更為深遠的摩爾定律」
大數據帶給我們的是一種意義更為深遠的摩爾定律,意思就是說大數據就像工業革命的摩爾定律一樣,會對我們的經濟生活方方面面產生重大的影響。
㈣ 什麼是 摩爾定律 主要內容是什麼
在計算機領域有一個人所共知的「摩爾定律」,它是英特爾公司創始人之一戈登•摩爾(Gordon Moore)於1965年在總結存儲器晶元的增長規律時(據說當時在准備一個講演),發現「微晶元上集成的晶體管數目每12個月翻一番」。當然這種表述沒有經過什麼論證,只是一種現象的歸納。但是後來的發展卻很好地驗證了這一說法,使其享有了「定律」的榮譽。後來表述為「集成電路的集成度每18個月翻一番」,或者說「三年翻兩番」。這些表述並不完全一致,但是它表明半導體技術是按一個較高的指數規律發展的。 就在摩爾定律提出3年後,英特爾公司誕生了。從它1971年推出第一片微處理器Intel 4004至今,微處理器使用的晶體管數量的增長情況基本上符合摩爾定律。有人認為英特爾刻意要求公司的技術發展符合摩爾定律。2002年11月美國《財富》雜志采訪摩爾先生時,年已古稀的摩爾先生說:「開始時公司並沒有把摩爾定律作為一個驅動力來看待,說老實話,我是直到10~15年前才能夠啟齒用摩爾定律來稱呼它的。開始我們只是試圖用我們認為合適的方法來推動存儲器晶元電路技術的發展……起初我們僅僅是想盡快推進技術的發展,但後來發現,發展幾乎總是沿著同一條曲線前進。要說我們真正地刻意按照定律推動技術朝此方向發展那是從最近幾代技術才開始的。」這表明晶元工業一開始就比較准確地遵循著這條定律的軌跡發展著。只是後來英特爾才把它寫進了公司的發展計劃,這也比較符合在特定階段的發展實際。 今天,我們手頭使用的電腦有幾台沒有「Intel」的標記呢?可以說,英特爾的微處理器(即我們常說的CPU)引導了計算機工業的發展,同時也代表了計算機工業的發展軌跡。一系列與電腦相關的產業,甚至軟體也都按摩爾定律的指數規律發展。根據新摩爾定律,互聯網用戶每9個月增加一倍,同時信息流量與帶寬也增加一倍。實際上,在產業競爭的驅動下,不按這樣的速度研發新的產品,企業就有被淘汰的危險。 目前,大規模晶元生產已達到0.25微米工藝。微電子工業發展每下一步的線寬大約是前一步的0.7倍,因而0.25微米的下一步是0.18微米,其後是0.13微米、0.09微米、0.06微米。如果晶元生產仍然能以3年翻一番的速度發展,那麼在十幾年之後,就必然會面臨硅晶元技術0.05微米的物理極限。摩爾定律是否已經遭遇到挑戰了呢?其實不然,從發展的角度來說,即使硅晶元技術達到了極限,人們還會發明其他的替代技術,如人們熱心的量子計算機、生物計算機等;即使英特爾公司走到了終點,還會有其他的公司接上來。這就是技術經濟時代新技術發展的基本規律。換個角度說,微處理器的發展歷程實際上只是技術科學發展的一個縮影。就拿我們身邊的汽車工業來說,其更新換代的速度也是令人眼花繚亂的。如果說半導體工業的「摩爾增速」已令人驚奇不已,那麼接下來可能會帶給我們更大驚奇的是生物技術的增速發展,我們做好心理准備了嗎? 在微晶元方面有一個顯著的特點,即它的技術指標非常容易量化。無論是晶元上晶體管的數量還是晶元的運算速度等指標,都直接反映出計算機領域的發展速度。在其他產業中並不是都有這樣清晰量化的指標,但是在先進技術競爭的環境下,一般高新技術產業的技術水平按指數規律發展卻是一個不爭的事實。
㈤ 大數據摩爾定律是什麼
在測量和測試計算機應用程序時,科學家和工程師每天都會收集大量的數據。例如,世界上最大的被稱為大型強子對撞機的粒子持有者對撞機每秒產生大約40太位元組的數據。波音公司的噴氣發動機每三十分鍾就會產生大約十兆兆位元組的數據。當一架Jumbo噴氣式飛機跨大西洋航行時,噴氣式飛機上的四台發動機可產生大約640太位元組的數據。如果將這種數據乘以每天平均2500次的航班,每天產生的數據量是驚人的;這就是所謂的大數據。
歡迎關注大數據周刊
從大量的數據中得出結論並獲得可操作的數據是一項艱巨的任務,大數據包含了這個問題。大數據帶來了新的數據處理方式。比如:深度的數據分析工具,數據集成工具,搜索工具,報告工具和維護工具,幫助處理大數據以從中獲取價值。
國際數據公司(IDC)對音樂,視頻文件和其他數據文件進行了分析。研究表明,系統產生的數據量每年翻一番。這是摩爾定律的一般概念。
摩爾定律如何改變?
當談到微處理器的力量時,可能會經歷摩爾定律的最後一個寬度。如果處理能力增加了,其他計算領域將不得不被檢查。從雲計算的能力來看,雲計算提供了可共享的資源,處理能力將提高創新能力,提高業務效率。
為了提高微處理器的處理能力,有一項新的技術正在研究和測試中。英特爾正在德克薩斯州測試光子學。 Photonics使用光線傳輸數據的速度更快,而且不會造成信號損失。這降低了電力的產生並使數據以光速傳播。這個實驗將有助於摩爾定律增加其過程流量和能力,重新開始一個新的循環。
摩爾定律之後,人工智慧又如何呢?
人工智慧已經成為下一個主流的技術範例,這使得人工智慧需要新的力量,因為摩爾定律和Dennard標度不夠強。摩爾定律指出,晶元特定區域的晶體管數量將在兩年後翻倍。在Dennard縮放中,保持晶體管所需的功率量正在縮小。
過去幾年來,英特爾已經減少了生產具有更密集和更小晶體管的新晶元的步伐。幾年前,小型晶體管效率的提高也停滯不前,這導致了功耗的問題。
AI如何處理更多的數據負載需要更強大的晶元。
科學家和大數據
大數據來源非常多。例如,在現實世界中收集的數據令人震驚地多樣化,並且負載巨大。 RF信號,振動,壓力,磁性,聲音,溫度,光線,電壓等的測量都以不同形式和高速度記錄。
摩爾定律在哪裡?
一個晶體管的物理長度和其他關鍵邏輯的重要維度將逐漸縮小到2028年,但3D概念已經占據了中心位置。與內存有關的行業已經接受了三維架構提升NAND快閃記憶體容量,緩解小型化的壓力。這並不意味著摩爾定律的結束。
結論
摩爾定律在處理大數據方面依然有效,但在使用3D架構方面更具經濟意義。人工智慧將在未來幾年帶來日益增長的處理能力需求,而晶元製造公司必須生產真正快速的處理器來處理工作量。