① 大數據形成的利潤指的是什麼,請解釋一下
關於「大數據」概念的產生
1.「大數據」的名稱來自於未來學家托夫勒所著的《第三次浪潮》
盡管「大數據」這個詞直到最近才受到人們的高度關注,但早在1980年,著名未來學家托夫勒在其所著的《第三次浪潮》中就熱情地將「大數據」稱頌為 「第三次浪潮的華彩樂章」。《自然》雜志在2008年9月推出了名為「大數據」的封面專欄。從2009年開始「大數據」才成為互聯網技術行業中的熱門詞彙。
2.最早應用「大數據」的是麥肯錫公司(McKinsey)
對「大數據」進行收集和分析的設想,來自於世界著名的管理咨詢公司麥肯錫公司。麥肯錫公司看到了各種網路平台記錄的個人海量信息具備潛在的商業價值,於是投入大量人力物力進行調研,在2011年6月發布了關於「大數據」的報告,該報告對「大數據」的影響、關鍵技術和應用領域等都進行了詳盡的分析。麥肯錫的報告得到了金融界的高度重視,而後逐漸受到了各行各業關注。
3.「大數據」的特點由維克托·邁爾-舍恩伯格和肯尼斯·庫克耶在《「大數據」時代》中提出
維克托·邁爾-舍恩伯格和肯尼斯·克耶編寫的《大數據時代》中提出:「大數據」的4V特點:Volume(數據量大)、Velocity(輸入和處理速度快)、Variety(數據多樣性)、Value(價值密度低)。這些特點基本上得到了大家的認可,凡提到「大數據」特點的文章,基本上採用了這4 個特點。
4.在雲計算出現之後「大數據」才凸顯其真正價值
自從有了雲計算伺服器,「大數據」才有了可以運行的軌道,才可以實現其真正的價值。有人就形象地將各種「大數據」的應用比作一輛輛「汽車」,支撐起這些「汽車」運行的「高速公路」就是雲計算。最著名的實例就是Google搜索引擎。面對海量Web數據,Google於2006年首先提出雲計算的概念。支撐Google內部各種「大數據」應用的,正是Google公司自行研發的雲計算伺服器。
眾說紛紜的表達
《大數據時代》的作者維克托·邁爾·舍恩伯格解釋:了解什麼是「大數據」的定義非常關鍵。首先要明確的是,「大數據」並不是很大或者很多數據。根據維克托在書中的描述,「大數據」並不是一部分數據樣本,而是關於某個現象的所有數據。第二點,由於掌握了關於某個現象的所有數據,那麼在統計時就能接受更多不準確的信息。第三,「大數據」的分析著重在了解「什麼」而不是「為什麼」。比如人們可以通過各種相關數據來了解未來將會發生什麼,而不是這些事情發生的原因。要探尋原因會更難,很多時候,知道會發生什麼已經足夠了。以上這些就是「大數據」的核心,有足夠多的數據,允許數據中存在不準確的信息和不去探尋事件發生的原因而是探尋會發生什麼事件。
維基網路對「大數據」的解讀是:「大數據」(Bigdata),或稱巨量數據、海量數據、大資料,指的是所涉及的數據量規模巨大到無法通過人工,在合理時間內達到截取、管理、處理、並整理成為人類所能解讀的信息。
網路對「大數據」的定義為:「大數據」(bigdata),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。
傳媒專家劉建明教授認為:「大數據」同信息是不可分離的,是指信息浩大數量的統計與技術運作。作為人類認知社會方法的一次飛躍,「大數據」技術將給企業運營、政府管理和媒體傳播的科學化創造有效機制。
「大數據」的基本判斷標准
什麼樣的數據才是「大數據」?透過層層的迷霧和眾說紛紜,可以講:有了雲計算伺服器才有了「大數據」應用的價值。
維克托曾說過:「假設你要測量一個葡萄園的溫度,但是整個葡萄園只有一個溫度測量儀,那你就必須確保這個測試儀是精確的而且能夠一直工作。反過來,如果每100棵葡萄樹就有一個測量儀,有些測試的數據可能會是錯誤的,也可能會更加混亂,但眾多的讀數合起來就可以提供一個更加准確的結果。因為這裡麵包含了更多的數據,而它提供的價值不僅能抵消掉錯誤數據造成的影響,還能提供更多的額外價值。現在想想增加讀數頻率的這個事情。如果每隔一分鍾就測量一下溫度,十次甚至百次的話,不僅讀數可能出錯,連時間先後都可能搞混。試想,如果信息在網路中流動,那麼一條記錄很可能在傳輸過程中被延遲,在其到達的時候已經沒有意義了,甚至乾脆在奔涌的信息洪流中徹底迷失。雖然得到的信息不再准確,但收集到的數量龐大的信息讓我們放棄嚴格精確的選擇變得更為劃算……為了高頻率而放棄了精確性,結果觀察到了一些本可能被錯過的變化。雖然如果能夠下足夠多的工夫,這些錯誤是可以避免的,但在很多情況下,與致力於避免錯誤相比,對錯誤的包容會帶來更多好處。為了規模的擴大,我們接受適量錯誤的存在。」其中描述葡萄園測量儀採集的數據就是大數據。
大數據實質上是全面、混雜的並且具有數據量大、輸入和處理速度快、數據多樣性、價值密度低特點的數據。
② 大數據的4v特性
大數據的4v特徵分別是Volume(大量性)、Velocity(高速性)、Variety(多樣性)、Value(價值性)。
Volume(大量性)
截至目前,人類生產的所有印刷材料的數量是200PB,而歷史上全人類總共說過得話的數據量大約是5EB。當前,典型個人計算機硬碟的容量為TB量洞兄級,而一些大企業的數據量已經接近EB量級。
2. Velocity(高速性)
這是大數據區於傳統數據挖掘的最顯著特徵。根據IDC的「數鏈攜字宇宙」的報告,預計到2020年,全球數據使用量將達到35.2ZB。在如此海量的數據面前,處理數據的效率就是企業的生命。
3. Variety(多樣性)
這種典型的多樣性也讓數據唄分為結構化數據和非結構化數據。相對於以往便儲存的以資料庫或文本為主的結構變化數據,非結構化數據越來越多,包括網路日誌、音頻、視頻、圖片、地理位置信息等。這些多類型的數據對數據的處理能力提出了更高要求。
4. Value(價值性)
價值密度的高低與數據總量的大小成反比。如何快速對有價值數據「提純」成為目前大數據背景下待解決的難題。
③ 大數據概念最早是在哪一年提出的
2008年八月中旬
大數據(big data),是指無法在可承受的時間范圍內用常規軟體工具進行捕捉、管理和處理的數據集合。
在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》 中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有數據進行分析處理。大數據的4V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。
對於「大數據」(Big data)研究機構Gartner給出了這樣的定義。「大數據」是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
根據維基網路的定義,大數據是指無法在可承受的時間范圍內用常規軟體工具進行捕捉、管理和處理的數據集合。
大數據技術的戰略意義不在於掌握龐大的數據信息,而在於對這些含有意義的數據進行專業化處理。換言之,如果把大數據比作一種產業,那麼這種產業實現盈利的關鍵,在於提高對數據的「加工能力」,通過「加工」實現數據的「增值」。
④ 人人都在說大數據,那大數據概念是怎麼產生的
概念產生:
「大數據」的名稱來自於未來學家托夫勒所著的《第三次浪潮》 盡管「大數據」這個詞直到最近才受到人們的高度關注,但早在1980年,著名未來學家托夫勒在其所著的《第三次浪潮》中就熱情地將「大數據」稱頌為「第三次浪潮的華彩樂章」。《自然》雜志在2008年9月推出了名為「大數據」的封面專欄。從2009年開始「大數據」才成為互聯網技術行業中的熱門詞彙。
⑤ ppt 什麼是大數據
大數據(Big
Data)又稱為巨量資料,指需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。「大數據」概念最早由維克托·邁爾·舍恩伯格和肯尼斯·庫克耶在編寫《大數據時代》中提出,指不用隨機分析法(抽樣調查)的捷徑,而是採用所有數據進行分析處理。大數據有4V特點,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。
⑥ 什麼是3V,4v,5V特徵,這些特徵對大數據計算過程帶來什麼樣的挑戰
IBM提出了大數據」5V」特點:
一、Volume:數據量大,包括採集、存儲和計算的量都非常大。大數據的專起始計屬量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。
二、Variety:種類和來源多樣化。包括結構化、半結構化和非結構化數據,具體表現為網路日誌、音頻、視頻、圖片、地理位置信息等等,多類型的數據對數據的處理能力提出了更高的要求。
三、Value:數據價值密度相對較低,或者說是浪里淘沙卻又彌足珍貴。隨著互聯網以及物聯網的廣泛應用,信息感知無處不在,信息海量,但價值密度較低,如何結合業務邏輯並通過強大的機器演算法來挖掘數據價值,是大數據時代最需要解決的問題。
四、Velocity:數據增長速度快,處理速度也快,時效性要求高。比如搜索引擎要求幾分鍾前的新聞能夠被用戶查詢到,個性化推薦演算法盡可能要求實時完成推薦。這是大數據區別於傳統數據挖掘的顯著特徵。
五、Veracity:數據的准確性和可信賴度,即數據的質量。
————————————————
版權聲明:本文為CSDN博主「arsaycode」的原創文章.........