A. 什麼是雲計算什麼是大數據二者有何聯系
雲計算的關鍵詞在於「整合」,無論你是通過現在已經很成熟的傳統的虛擬機切分型技術,還是通過google後來所使用的海量節點聚合型技術,他都是通過將海量的伺服器資源通過網路進行整合,調度分配給用戶,從而解決用戶因為存儲計算資源不足所帶來的問題。
大數據正是因為數據的爆發式增長帶來的一個新的課題內容,如何存儲如今互聯網時代所產生的海量數據,如何有效的利用分析這些數據等等。
他倆之間的關系你可以這樣來理解,雲計算技術就是一個容器,大數據正是存放在這個容器中的水,大數據是要依靠雲計算技術來進行存儲和計算的。
(1)大數據與雲計算的使用擴展閱讀:
雲計算常與網格計算、效用計算、自主計算相混淆。
網格計算:分布式計算的一種,由一群鬆散耦合的計算機組成的一個超級虛擬計算機,常用來執行一些大型任務;
效用計算:IT資源的一種打包和計費方式,比如按照計算、存儲分別計量費用,像傳統的電力等公共設施一樣;
自主計算:具有自我管理功能的計算機系統。
事實上,許多雲計算部署依賴於計算機集群(但與網格的組成、體系結構、目的、工作方式大相徑庭),也吸收了自主計算和效用計算的特點。
被普遍接受的雲計算特點如下:
(1) 超大規模
「雲」具有相當的規模,Google雲計算已經擁有100多萬台伺服器, Amazon、IBM、微軟、Yahoo等的「雲」均擁有幾十萬台伺服器。企業私有雲一般擁有數百上千台伺服器。「雲」能賦予用戶前所未有的計算能力。
(2) 虛擬化
雲計算支持用戶在任意位置、使用各種終端獲取應用服務。所請求的資源來自「雲」,而不是固定的有形的實體。應用在「雲」中某處運行,但實際上用戶無需了解、也不用擔心應用運行的具體位置。只需要一台筆記本或者一個手機,就可以通過網路服務來實現我們需要的一切,甚至包括超級計算這樣的任務。
(3) 高可靠性
「雲」使用了數據多副本容錯、計算節點同構可互換等措施來保障服務的高可靠性,使用雲計算比使用本地計算機可靠。
(4) 通用性
雲計算不針對特定的應用,在「雲」的支撐下可以構造出千變萬化的應用,同一個「雲」可以同時支撐不同的應用運行。
(5) 高可擴展性
「雲」的規模可以動態伸縮,滿足應用和用戶規模增長的需要。
(6) 按需服務
「雲」是一個龐大的資源池,你按需購買;雲可以像自來水,電,煤氣那樣計費。
大數據特徵:
1 容量(Volume):數據的大小決定所考慮的數據的價值和潛在的信息;
2 種類(Variety):數據類型的多樣性;
3 速度(Velocity):指獲得數據的速度;
4 可變性(Variability):妨礙了處理和有效地管理數據的過程。
5 真實性(Veracity):數據的質量
6 復雜性(Complexity):數據量巨大,來源多渠道
7 價值(value):合理運用大數據,以低成本創造高價值
想要系統的認知大數據,必須要全面而細致的分解它,著手從三個層面來展開:
第一層面是理論,理論是認知的必經途徑,也是被廣泛認同和傳播的基線。在這里從大數據的特徵定義理解行業對大數據的整體描繪和定性;從對大數據價值的探討來深入解析大數據的珍貴所在;洞悉大數據的發展趨勢;從大數據隱私這個特別而重要的視角審視人和數據之間的長久博弈。
第二層面是技術,技術是大數據價值體現的手段和前進的基石。在這里分別從雲計算、分布式處理技術、存儲技術和感知技術的發展來說明大數據從採集、處理、存儲到形成結果的整個過程。
第三層面是實踐,實踐是大數據的最終價值體現。在這里分別從互聯網的大數據,政府的大數據,企業的大數據和個人的大數據四個方面來描繪大數據已經展現的美好景象及即將實現的藍圖。
B. 大數據和雲計算有什麼不同,學哪個好
1、大數據的定義
著名的麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統資料庫軟體工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特徵。
研究機構Gartner給出的定義是「大數據」是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。
大數據(big data),指無法在一定時間范圍內用常規軟體工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
大數據技術的戰略意義不在於掌握龐大的數據信息,而在於對這些含有意義的數據進行專業化處理。換而言之,如果把大數據比作一種產業,那麼這種產業實現盈利的關鍵,在於提高對數據的「加工能力」,通過「加工」實現數據的「增值」。
2、雲計算的定義
美國國家標准與技術研究院(NIST)定義:雲計算是一種按使用量付費的模式,這種模式提供可用的、便捷的、按需的網路訪問, 進入可配置的計算資源共享池(資源包括網路、伺服器、存儲、應用軟體、服務),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務供應商進行很少的交互。
雲計算(cloudcomputing)是基於互聯網的相關服務的增加、使用和交付模式,通常涉及通過互聯網來提供動態易擴展且經常是虛擬化的資源。
簡單來說:雲計算是硬體資源的虛擬化,而大數據是海量數據的高效處理。雖然從這個解釋來看也不是完全貼切,但是卻可以幫助對這兩個名字不太明白的人很快理解其區別。當然,如果解釋更形象一點的話,雲計算相當於我們的計算機和操作系統,將大量的硬體資源虛擬化後在進行分配使用。
在宣州區的時候可以參考自己個人喜好以及難易程度來選擇(大數據比雲計算要稍復雜一些)
C. 大數據和雲計算的區別是什麼啊
一、大數據與雲計算的概念及特點
大數據:在維基網路中,大數據(big data)是用於數據集的一個術語,是指大小超出了常用軟體工具在運行時間內可以承受的收集,管理和處理數據能力的數據集。與傳統海量數據相比,它不僅在數據規模上呈幾何倍數的增長,還在於它集收集,分類,處理,分析於一體,能夠充分挖掘出一份數據的潛在價值。
雲計算:根據美國國家標准與技術研究院定義:雲計算是一種按使用量付費的模式,這種模式提供可用的、便捷的、按需的網路訪問,進入可配置的計算資源共享池(資源包括網路,伺服器,存儲,應用軟體,服務),這些資源能夠被快速提供,只需投人很少的管理工作,或與服務供應商進行很少的交互。也就是說雲計算既是一種商業模式,也是一種計算模式。
二、大數據和雲計算的區別及聯系
雲計算是一種商業模式,也是一種計算模式。所以,雲計算是在大數據的基礎上進行的,大數據的目的主要是通過海量數據發現潛在價值,使人們更好的理解和把握信息,雲計算更傾向於提供服務,二者相互關聯。
1、大數據和雲計算的區別
1)目的不同:大數據是為了發掘信息價值,而雲計算主要是通過互聯網管理資源,提供相應的服務。
2)對象不同:大數據的對象是數據,雲計算的對象是互聯網資源以及應用等。
3)背景不同:大數據的出現在於用戶和社會各行各業所產生大的數據呈現幾何倍數的增長;雲計算的出現在於用戶服務需求的增長,以及企業處理業務的能力的提高。
4)價值不同:大數據的價值在於發掘數據的有效信息,雲計算則可以大量節約使用成本。
2、大數據和雲計算的聯系
大數據和雲計算的相同點在於它們都是數據存儲和處理服務,都需要佔用大量的存儲和計算資源,因而都要用到海量數據存儲技術、海量數據管理技術等/隨著數據量的遞增、數據處理復雜程度的增加,相應的性能和擴展瓶頸將會越來越大。在這種情況下,雲計算所具備的彈性伸縮和動態調配、資源的虛擬化,按需使用,以及綠色節能等基本要素正好契合了新型大數據處理技術的需求。在數據量爆發增長以及對數據處理要求越來越高的先當下,實現大數據和雲計算的結合,才能最大程度上發揮二者的優勢,滿足用戶的需求,帶來更高的商業價值。
三、如何理解大數據與雲計算的關系
簡單來說就是,大數據的超大容量自然需要容量大,速度快,安全的存儲,滿足這種要求的存儲離不開雲計算。高速產生的大數據只有通過雲計算的方式才能在可等待的時間內對其進行處理。同時,雲計算是提高對大數據的分析與理解能力的一個可行方案。大數據的價值也只有通過數據挖掘才能從低價值密度的數據中發現其潛在價值,而大數據挖掘技術的實現離不開雲計算技術。總之,雲計算是大數據處理的核心支撐技術,是大數據挖掘的主流方式。沒有互聯網,就沒有虛擬化技術為核心的雲計算技術,沒有雲計算就沒有大數據處理的支撐技術。
其實,雲計算是工業時代的電,大數據就是福特生產線,雲存儲就是鋼鐵工業。也就是說,沒有鋼鐵,就沒有電,就不會有大規模工業化生產。沒有雲計算,大數據不會出來,如果雲計算沒有解決雲存儲的問題,也不會出來。
四、大數據和雲計算的發展前景
1、提升網路質量。隨著互聯網以及移動互聯網的持續發展網路將會更加繁忙,用於監測網路狀態的信令數據也會快速增長。通過對海量運維信息以及信令數據的智能分析,能夠提高網路維護的實時性,預測網路流量峰值,預警異常流量。從而有效地防止網路擁塞和系統宕機,從而提高網路服務質量,提升用戶體驗。
2、提升客戶價值通過使用大數據分析、數據挖掘等工具和方法,企業能夠整合來自市場部門、銷售部門、服務部門的數據,從各種不同的角度全面了解自己的客戶,對客戶形象進行精準刻畫,以尋找目標客戶,制定有針對性的營銷計劃、產品組合或商業決策,提升客戶價值。
3、提升行業信息化水平。智慧城市的發展以及教育、醫療、交通、環境保護等關繫到國計民生的行業,都具有極大的信息化需求。
4、提高用戶體驗。高速的信息處理,更優質的服務,能夠更好地滿足用戶需要,使用戶能夠以最廉價的成本為生活帶來更好的便利,最大程度上提高了用戶的生活學習工作質量。
D. 大數據、雲計算、數據中心這三者之間有什麼區別和聯系
不少人把數據中心、雲計算數據中心、大數據搞混淆,覺得這三者是一樣的產品,其實有顯著的區別,數據中心機房是一整套復雜的設施,如今,雲計算即將成為信息 社會 的公共資源,而數據中心則是支撐雲計算服務的基礎設施,所以自從雲計算橫空出世,一切信息技術都開始圍著它轉,雲計算有如神一樣地存在著,下面看看數據中心、雲計算、大數據之間有什麼區別和聯系?
一、大數據
1、 大數據(Big Data)又稱為巨量資料,指需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產,「大數據」是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
2、大數據技術的戰略意義不在於掌握龐大的數據信息,而在於對這些含有意義的數據進行專業化處理。換言之,如果把大數據比作一種產業,那麼這種產業實現盈利的關鍵,在於提高對數據的「加工能力」,通過「加工」實現數據的「增值」。
3、移動互聯網的大數據主要來自四個方面
(1)、內容數據:
Web2.0時代以後,每個人都成為了媒體,都在網路上生產內容,包括文字、圖片、視頻等等。
(2)、電商數據:
隨著電子商務的發展,線上交易量已經占據整個零售業交易的大部分。每一筆交易都包含了買家、賣家以及商品背後的整條價值鏈條的信息。
(3)、社交數據:
隨著移動社交成為最主要的社交方式,社交不僅僅只有人與人之間的交流作用,社交數據中包括了人的喜好、生活軌跡、消費能力、價值取向等各種重要的用戶畫像信息。
(4)、物聯網數據:
各行各業都出現了物聯網的需求和解決方案,每時每刻都在產生巨量的監測數據。那麼如此之多的數據,包含著很多有價值的信息,這些信息並不是以直觀的形式呈現出來的,需要有辦法對這些數據進行處理,無論是計算、存儲還是通信,都提出了很高的要求,雲計算的相關技術就是對巨量數據的計算、存儲和通信的解決方案。
二、雲計算
雲計算是一種基於互聯網的計算方式,通過這種方式,共享的軟硬體資源和信息可以按需提供給計算機和其他設備。典型的雲計算提供商往往提供通用的網路業務應用,可以通過瀏覽器等軟體或者其他Web服務來訪問,而軟體和數據都存儲在伺服器上。雲計算服務通常提供通用的通過瀏覽器訪問的在線商業應用,軟體和數據可存儲在數據中心。
三、數據中心
數據中心是全球協作的特定設備網路,用來在internet網路基礎設施上傳遞、加速、展示、計算、存儲數據信息,數據中心大部分電子元件都是由低壓直流電源驅動運行的。數據中心面臨的物理問題是伺服器本身和用來連接這些伺服器到其他應用環境的電纜。
四、三者之間的聯系:
1、大數據和雲計算的概念區別:
大數據說的是一種移動互聯網和物聯網背景下的應用場景,各種應用產生的巨量數據,需要處理和分析,挖掘有價值的信息;雲計算說的是一種技術解決方案,就是利用這種技術可以解決計算、存儲、資料庫等一系列IT基礎設施的按需構建的需求,兩者並不是同一個層面的東西。
2、大數據與雲計算的關系,以上介紹了大數據和雲計算的區別,兩者之間又有著非常緊密的聯系,大數據是雲計算非常重要的應用場景,而雲計算則為大數據的處理和數據挖掘都提供了最佳的技術解決方案。
3、大數據必然與雲計算相關(大數據和雲計算沒有必然聯系,你要作大數據,可以用雲計算,也可以不用),數據中心是雲計算的基礎,從技術上看,大數據與雲計算的關系就像一枚硬幣的正反面一樣密不可分,大數據必然無法用單台的計算機進行處理,必須採用分布式架構。它的特色在於對海量數據進行分布式數據挖掘,但它必須依託雲計算的分布式處理、分布式資料庫和雲存儲、虛擬化技術,隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。
4、數據中心是雲計算的基礎設施,我們通常講到的伺服器資源分配,帶寬分配,業務支撐能力,流量防護和清洗能力,都是基於數據中心的大小,和其帶寬的容量,數據中心分布在不同的核心城市,輻射到周邊城市,提供基礎支撐,其一般都符合國家機房一級標准,具備極強的容災能力,多數廠商會選擇兩地三中心等方式來架設機房,雲計算是在數據中心的基礎上提供的從基礎服務到增值服務的一種閑置資源利用。
5、但有一點不變的是,不管雲計算怎樣去變化,必然需要依託數據中心實現落地。可以說,數據中心是雲計算的根,雲計算是數據中心「葉子」,雲計算通過「光合作用」促進數據中心的發展,而數據中心得壯大又為雲計算發展提供了堅實的基礎,這三者起到相互依存,互相促進的作用。
E. 雲計算大數據能運用於哪些地方
這個問題看怎麼理解了,其實可以說雲計算山伏運、大逗梁數據可以應用於任何需要信息化的領域,只不過運用的程度不同而已。
雲計算是一種基礎計算方式,通過虛擬化、自動化、標准化、流程化等手段實現計算資源的統一、專業化運行,而其用戶則可以按需使用、付費,省去了自己建設和管理的過程。
大數據則是有效利用已有信息進行分析,進而支持決策或根據規律預測未來發展,隨著信息化的發展,可以說也將越來越廣泛甚廳雀至無處不在。
這兩種技術同時也相輔相成,雲計算為大數據提供了底層支撐,大數據也可以幫助進行雲計算的管理、運行等。
其實現在熱門的人工智慧、區塊鏈等也都或多或少依賴與上述兩種技術的支撐。
F. 大數據和雲計算的聯合在我們生活中有哪些應用
雲計算的應用:
雲音樂:在雲音樂以前,由於設備的存儲容量問題,在下載歌曲的時候必須要刪除一部分,才能把新的保存,而雲音樂的出現,使得我們可以不受容量限制,隨時隨地,想聽就聽。
雲存儲:這個相信大家都有所了解,目前的各類APP或者手機都附帶的有一定容量的雲空間,可以把自己的資料進行備份,這樣不管是換設備或者是跨地區都不用擔心。
在線辦公軟體:不知道你有沒有發現,自雲計算開始,辦公室的概念開始逐漸變得模糊,諸如騰訊視頻會議,華為welink,等的視頻會議或是金山的協同編輯,飛書,釘釘等協同軟體,都讓辦公跨越了地域障礙,也縮短了工作間的銜接。
大數據的應用:
金融:在金融行業可以概括以下兩個方面:大數據營銷,根據顧客的消費習慣,消費頻率和常去的消費地點進行針對型的推薦;風險防控,根據用戶的消費習慣和流水,進行綜合評估,判斷信用情況,也適用於股權融資等。
商務:電商的數據通常是別叫龐大且復雜的,通過這些數據可以分析出潮流趨勢,消費趨勢,地區特性和習慣等。
醫療:醫療器械行業有著很多的病案,病理報告,痊癒計劃方案,葯品匯報這些。在將來,憑借數據管理平台人們能夠 搜集不一樣病案和醫治計劃方案,及其患者的本質特徵,能夠 創建對於病症特性的資料庫查詢。
G. 雲計算和大數據有什麼區別
雲計算和大數據能做什麼,很多人都分不清楚,那麼雲計算與大數據的關系是什麼呢?今天就給大家簡單的分析一下。
雲計算:雲計算是通過互聯網提供全球用戶計算力、存儲服務,為互聯網信息處理提供硬體基礎。雲計算,簡單說就是把你自己電腦里的或者公司伺服器上的硬碟、CPU都放到網上,統一動態調用,現在比較有名的雲計算服務商是亞馬遜的AWS。
大數據:大數據運用日趨成熟的雲計算技術從浩瀚的互聯網信息海洋中獲得有價值的信息進行信息歸納、檢索、整合,為互聯網信息處理提供軟體基礎。大數據,簡單說,就是把所有的數據放到一起分析,找到關聯,實現預測。這里的所有數據對應的是之前的抽樣調研取得的部分數據。
雲計算與大數據的關系:
雲計算是基礎,沒有雲計算,無法實現大數據存儲與計算。大數據是應用,沒有大數據,雲計算就缺少了目標與價值。兩者都需要人工智慧的參與,人工智慧是互聯網信息系統有序化後的一種商業應用。這才是:雲計算與大數據真正的出口!
而商業智能中的智能從何而來?方法之一就是通過大數據這個工具來對大量數據進行處理,從而得出一些關聯性的結論,從這些關聯性中來獲得答案,因此,大數據是商業智能的一種工具。 而大數據要分析大量的數據,這對於系統的計算能力和處理能力要求是非常高的,傳統的方式是需要一個超級計算機來進行處理,但這樣就導致了計算能力空的時候閑著、忙的時候又不夠的問題, 而雲計算的彈性擴展和水平擴展的模式很適合計算能力按需調用,因此,雲計算為大數據提供了計算能力和資源等物質基礎。
H. 什麼事雲計算和大數據的解釋
雲計算與大數據概述
雲計算(cloud computing)是基於互聯網的相關服務的增加、使用和交付模式,通常涉及通過互聯網來提供動態易擴展且經常是虛擬化的資源。雲是網路、互聯網的一種比喻說法。過去在圖中往往用雲來表示電信網,後來也用來表示互聯網和底層基礎設施的抽象。狹義雲計算指IT基礎設施的交付和使用模式,指通過網路以按需、易擴展的方式獲得所需資源;廣義雲計算指服務的交付和使用模式,指通過網路以按需、易擴展的方式獲得所需服務。這種服務可以是IT和軟體、互聯網轎盯相關,也可是其他服務。它意味著計算能力也可作為一種商品通過互聯網進行流通。
大數據(big data),或稱海量數據,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。大數據的4V特點:Volume、Velocity、Variety、Veracity。
從技術上看,大數據與雲計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單台的計算機進行處理,必須採用分布式計算架構。它的特色在於對海量數據的挖掘,但它必須依託雲計算的分布式處理、分布式資料庫、雲存儲和虛擬化技術。
大數據管理,分布式進行文件系統,如Hadoop、Maprece數據分割與訪問執行;同時SQL支持,以Hive+HADOOP為代表的SQL界面支持,在大數據技術上用雲計算構建下一代數據倉庫成為熱門話題。從慧旦系統需求來看,大數據的架構對系統提出了新的挑戰:
1、集成度更高。一個標准機箱最大限度完成特定任務。
2、配置更合理、速度更快。存儲、控制器、I/O通道、內存、CPU、網路均衡設計,針對數據倉庫訪問最優設計,比傳統類似平台高出一個數量級以上。
3、整體能耗更低。同等計算任務,能耗最低。
4、系統更加穩定可靠。能夠消除各種單點故障環節,統一一個部件、器件的品質和標准。
5、管理維護費用低。數據藏的常規管理全部集成。
6、可規劃和預見的系統擴容、升級路線圖。
雲計算與大數據的關系
簡單來說:雲計算是硬體資源的虛擬化,而大數據是海量數據的高效處理。雖然從這個解釋來看也不是完全貼切,但是卻可以幫助對這兩個名字不太明白的人很快理解其區別。當然,如果解釋更形象一點的話,雲計算相當於我們的計算機和操作系統,將大量的硬體資源虛擬化後在進行分配使用。
可以說,大數據相當於海量數據的閉碧和「資料庫」,通觀大數據領域的發展我們也可以看出,當前的大數據發展一直在向著近似於傳統資料庫體驗的方向發展,一句話就是,傳統資料庫給大數據的發展提供了足夠大的空間。
大數據的總體架構包括三層:數據存儲,數據處理和數據分析。數據先要通過存儲層存儲下來,然後根據數據需求和目標來建立相應的數據模型和數據分析指標體系對數據進行分析產生價值。
而中間的時效性又通過中間數據處理層提供的強大的並行計算和分布式計算能力來完成。三者相互配合,這讓大數據產生最終價值。
不看現在雲計算發展情況,未來的趨勢是:雲計算作為計算資源的底層,支撐著上層的大數據處理,而大數據的發展趨勢是,實時互動式的查詢效率和分析能力,借用Google一篇技術論文中的話:「動一下滑鼠就可以在妙極操作PB級別的數據」,確實讓人興奮不能止。
I. 大數據、雲計算、人工智慧之間有什麼樣的關系_什麼是大數據,雲計算和人工智慧他們有哪些應用
給你解釋一下這些術語:
雲計算:就是個炒得很熱的商業概念,其實說白了就是將計算任務轉移到伺服器端,用戶只需要個顯示器就行了,不過伺服器的計算資源可以轉包。當然,要想衡隱大規模商業化,這里還有些問題,特別是隱私保護問題。
大數據:說白了就是數據太多了。如今幾兆的數據在20年前也是大數據。但如今所說的大數據特殊在哪呢?如今的問題是數據實在是太多了,這已經超過了傳統計算機的處理能力(區別與量子計算機),所以對於大數據我們不得不用一些折衷的辦法(比如數據挖掘),就是說沒必要所有數據都需要精確管理,實際上有效數據很有限,前塌用數據挖掘的方法把這些有限的知識提取出來就行了。·此外,數據抽樣,數據壓縮也是解決大數據問題的一些策略。
數據挖掘:從數據中提取潛在知識,這些知識可以描述或者預測數據的特性。有代表性的數據挖掘任務包括關聯規則分析、數據分類、數據聚類等,這些你在任一本數據挖掘教材都可以了解。下面我說說和大數據的區別:數據挖掘只是大數據處理的一個方法。馬雲所說的大數據,或者如今商業領域所說的大數據,實際上指慧攔圓的就是數據挖掘,其實真正所謂大數據,或者Science雜志中提到的大數據,或者奧巴馬提出的大數據發展戰略,我的理解是,這些都遠遠大於數據挖掘的范疇,當然數據挖掘是其中很重要的一個方法。真正目的是如何將大數據進行有效管理。
機器學習:這個詞很虛,泛指了一大類計算機演算法。重點是學習這個詞,如果想讓計算機有效學習,目前絕大多數方法都採用了迭代的方法。所以在科研界,只要是採用了這種迭代並不斷逼近的策略,一般都可以歸到機器學習的范疇。此外,所謂學習,肯定要知道學什麼,這就是所謂訓練集,從訓練集數據中計算機要學到其中的某個一般規律,然後用一些別的數據(即測試集)來看看學得好不好,之後才能用於實際應用。所以,選取合適的訓練集也是個學問。
模式識別:意思就是模式的識別。模式多種多樣,可以是語言,可以是圖像,可以是事物一些有意義的模塊,這些都算。所以總體來說,模式識別這個詞我是覺得有點虛,倒是具體的人臉圖像識別、聲音識別等,這些倒是挺實在的。也許是我不太了解吧。
另外說說你的其他問題。
傳統分析方法不包括數據挖掘。對於數據分析這塊我不是很了解,不過可以肯定的是,傳統分析都有一定的分析方向,比如我就想知道這兩個商品的關聯情況,那我查查資料庫就行了。數據挖掘雖說有些歷史,不過也挺時髦的,它是自動將那些關聯程度大的商品告訴你,這期間不需要用戶指定數據分析的具體對象。
如果想應對大數據時代,數據挖掘這門課是少不了的。此外對資料庫,特別是並行資料庫、分布式資料庫,最好了解點。至於機器學習和模式識別,這些總的來說和數據挖掘關系不太大,除了一些特殊的領域外。
總之,概念挺熱,但大數據還很不成熟,無論從研究上還是商業化上。我目前在作大數據背景下的演算法研究,說實話,目前基本沒有拓展性非常強的演算法,所以未來大數據的發展方向,我也挺迷茫。
PS:將數據挖掘應用於商業,最最重要的就是如何確定挖掘角度,這需要你對具體應用的領域知識非常了解,需要你有非常敏銳的眼光。至於數據挖掘的具體演算法,這些就交給我們專門搞研究的吧!(對演算法的理解也很重要,這可以把演算法拓展到你的應用領域)