解析大數據與傳統數據的區別_大數據與傳統數據相比

『壹』大數據與傳統數據相比,有什麼不同呢

首先，大數據通常是由機器自動生成的。在新數據的產生過程中，並不會涉及人工參與，內它們完全由機器容自動生成。如果你分析一下傳統的數據源，它們通常會涉及人工的因素。其次，大數據通常是一種全新的數據源，並非僅僅是對已有數據的擴展收集。有時，「數量更多的相同類型數據」也可以達到另一個極端，從而變成一種新的數據。再次，很多大數據源的設計並不友好。
傳統數據源通常在最開始就被嚴格地定義。數據的每一個比特都有重要的價值，否則就不會包含這個數據比特。隨著存儲空間的開銷變得微乎其微，大數據源在最開始通常不會被嚴格地定義，而是去收集所有可能使用到的各種信息。因此，在分析大數據時，可能會遇到各種雜亂無章、充斥著垃圾的數據。

『貳』如何理解傳統數據與大數據之間的區別

針對大數據帶給教育的機遇與挑戰，與讀者深入探討和分享大數據與傳統數據的區別，及其行業落地的進展情況。

二、大數據時代潛藏的教育危機

「不得不承認，對於學生，我們知道得太少」——這是卡耐基·梅隆大學（Carnegie Mellon University）教育學院研究介紹中的一句自白，也同樣是美國十大教育類年會中出鏡率最高的核心議題。這種對於學生認識的匱乏，在21世紀之前長達數百甚至上千年的教育史中並沒有產生什麼消極的效應，但卻在信息技術革命後的近十年來成為教育發展的致命痼疾。

「過去，對於學生來說，到學校上學學習知識具有無可辯駁的重要性，而那是因為當時人們能夠接觸知識的渠道太少，離開學校就無法獲取成體系的知識」斯坦福大學教授Arnetha Ball在AERA（美國教育研究會）大會主旨發言中說道，「但是，互聯網的普及將學校的地位從神壇上拉了下來。」Ball的擔心不無道理。根據Kids Count Census Data Online發布的數據，2012年全美在家上學（Home-Schooling）的5-17歲學生已達到197萬人，相對逐年價下降的出生人口，這一人口比重十分可觀。

與此同時，應運而生的則是內容越來越精緻的網上課堂，而創立於2009年並迅速風靡全球的可汗學院（Khan Academy）正是其中的傑出代表。從知名學府的公開課到可汗學院，這種網路學習模式受到熱捧恰恰證明了：人們對於學習的熱情並沒有過去，但是人們已經極端希望與傳統的學院式授課模式告別。一成不變，甚至「目中無人」的傳統集體教學模式在適應越來越多元化、也越來越追求個性化的學生群體時顯得捉襟見肘。

可汗學院模式不但支持學生自主選擇感興趣的內容，還可以快速跳轉到自己適合的難度，從而提高了學習的效率。學習者沒有學習的壓力，時長、時機、場合、回顧遍數都可以由自己控制。

可以想像，如果可汗學院的模式進一步發展，與計算機自適應（CAT）的評估系統相聯系，讓使用者可以通過自我評估實現對學習進度的掌握以及學習資料的精準獲取，那麼它將形成互聯網產品的「閉環」，其優勢與力量將是顛覆性的。

而如果傳統教育的課程模式不革新，課堂形態不脫胎換骨，教師角色與意識不蛻變，那麼學校的存在就只有對現代化學習資源匱乏的學生才有意義；而對於能夠自主獲得更適宜學習資源的學生來說，去學校可能只是為了完成一項社會角色賦予的義務，甚至談不上必要性，也就更談不上愉快的體驗或興趣的驅使了。

大數據的研究可以幫助教育研究者重新審視學生的需求，通過高新的技術以及細致的分析找到怎樣的課程、課堂、教師是能夠吸引學生的。但問題在於，社會發展給予教育研究者的時間窗口並不寬裕，因為有太多人同樣在試圖通過大數據挖掘設法瓜分學生們有限的精力與注意力。而且從某種程度上，他們做得遠比教育研究者更有動力與誠意。

首當其沖的是游戲的設計者——青少年是其主要消費群體。撇開馳名世界的暴雪公司（Blizzard Entertainment），美國藝電公司（Electronic Arts Inc.），日本任天堂公司（Nintendo）等國際巨鱷不談；即使是國內的盛大網路，第九城市，巨人科技，淘米網路等游戲公司，亦都早已組建了專業實力強勁的「用戶體驗」研究團隊。他們會通過眼動跟蹤，心律跟蹤，血壓跟蹤，鍵盤與滑鼠微操作速率等各種微觀行為來研究如何讓玩家在游戲中投入更多的時間，更加願意花真實世界的錢來購買虛擬世界的物品。什麼時候應該安排敵人出現，敵人應當是什麼級別，主人公需要耗費多少精力才能夠將其擊敗，這些變數都得到了嚴格的設計與控制，原因只有一個——大數據告訴游戲創作者，這樣的設計是最能夠吸引玩家持續游戲的。

其次是電影視頻、青春小說等鏈式文化產業。為什麼在網站上看視頻會一個接一個，無法停止，因為它會根據該賬號的歷史瀏覽記錄推算出其喜歡看什麼樣的視頻，喜歡聽什麼類型風格的歌，並投其所好；而暢銷網路小說看似並沒有「營養」，但裡面的遣詞造句、語段字數，故事起伏設定，甚至主人公性格的類型都是有相關研究進行支持——讀者往往並不喜歡結構嚴密、精心設計的劇情——這就是為什麼情節千篇一律的韓劇受人追捧的原因，他們通過收視率的反復研究，挖掘到了觀眾最需要的那些元素，並且屢試不爽。

此外還有許多更強大的研究者，比如電子商務，總能通過數據找到你可能願意購買的商品——他們甚至知道買尿片的父親更願意買啤酒。

這些領域看似與我們教育者並無特別關聯，但是他們與我們最關心的對象——學生卻有著千絲萬縷的聯系。數百年甚至數十年前，學生並不會面對如此多的誘惑，學校在其生活中占據極大比重，對其影響也最為顯著，因此教育者對於學生的控制總是有著充分的自信。但是，當不同的社會機構與產品開始爭奪學生的注意力時，教育者的自信就只能被認為是一種無法認清形勢的傲慢了——因為在這場「學生爭奪戰」中，傳統學校看上去實在缺乏競爭力。

即使教育研究者願意放下身段，通過大數據的幫助來悉心研究學生的需求與個性。但是人才的匱乏也是非常不利的一點因素——相比於商業環境下對研究實效的追逐，教育研究的緩慢與空洞顯得相形見絀。在互聯網企業紛紛拋出「首席數據官」的頭銜，向各種數據科學狂人拋出橄欖枝，並且在風險投資的鼓舞下，動輒以百萬年薪進行延聘時，大數據研究的前沿陣地必然仍是在互聯網行業中最轟轟烈烈地開戰。

分析形勢後的姿態，以及投入的力度與強度，或許是教育領域在進入大數據研究時最先需要充分考慮的兩個先決條件。

三、誰在為大數據歡呼：一場關於「人性」研究的啟蒙

孜孜不倦地觀測、記錄、挖掘海量的數據，有朝一日終會推導出或簡約或繁復的方程，以此得以在自然科學的歷史豐碑上留名——數百年來，這種對數據的崇拜早已成為了物理學家、化學家、生物學家、天文地理學家們的信念。而牛頓，貝葉斯，薛定諤等一代代巨匠的偉業也揭示了數據對於科學發現的無限重要價值。

相形之下，社會科學領域的研究就要慘淡地多——他們同樣看重數據，同樣追求統計與分析的「程序正義」，同樣勤勤懇懇地設計實驗與調研，去尋找成千上萬的被試，同樣像模像樣地去嵌套方程……但是幾乎很少有研究結果能夠得到普遍的承認，不管是社會學、心理學、經濟學、管理學還是教育學。

當然，社會科學領域的研究者們遇到的困難是顯而易見的：「人性」與「物性」是不同的，物質世界比較穩定，容易尋找規律；而由人組成的社會極其善變，難以總結。從數據的角度來說，人的數據不如物的數據那麼可靠：

首先是人不會像物那樣忠實地進行回應：誰知道一個人填寫的問卷有多少是注意力不集中填錯的、語文水平不高理解錯的、還是壓根沒打算講真話？此外，人與人本身的差距也大於物與物的差距：兩個化學組成相同的物質表現出各種性質幾乎是完全一樣的，但即使是兩個基因完全相同的雙胞胎也會因為不同的人生經驗，而表現出大相徑庭的行為特徵。

但這些都還並不關鍵，最最重要的是：人無法被反復研究。人不是牛頓的木塊，不是伽利略的鉛球，不是巴普洛夫的狼狗，人不會配合一次次從斜坡上被滑下來，一次次從比薩塔頂被扔下來，一次次流著口水乾等著送肉來的鈴聲。而我們知道，在「科學」的三個標准中，首當其沖的就是「可重復驗證」。

換句話說，我們可以獲得的關於「人性」的數據不夠大，不夠多，不夠隨時隨地，因此我們無法從數據中窺見人性。2002年諾貝爾經濟學獎授予心理學家丹尼爾?卡尼曼（Daniel Kahneman）時，似乎標示著社會科學領域已經接受了這樣一種事實：人類的行為是無法尋找規律、無法預測、難以進行科學度量的。社會科學開始懷疑用純粹理性的方法是否可以解答關於「人性」的種種現象。與此相映成趣的是2012年的美國大選，奧巴馬的團隊依靠對網路數據的精準篩選捕捉到了大量的「草根」選民，而對於其喜好與需求的分析與把握更是贏得其信任，從而在不被傳統民調與歷史數據規律看好的情況下一舉勝出。這跨越十年的兩個標志性事件讓人們對於「數據揭示人性」可能性的認識經歷了戲劇性的轉變。

如今，迅速普及的互聯網與移動互聯網悄然為記錄人的行為數據提供了最為便利、持久的載體。手機，iPad等貼近人的終端無時不刻不在記錄關於人的點點滴滴思考、決策與行為。最最重要的是，在這些強大的數據收集終端面前，人們沒有掩飾的意圖，人們完整地呈現著自己的各種經歷，人們不厭其煩一遍又一遍重復著他們不願在實驗情境下表現出來的行為，從而創造著海量的數據——傳統數據研究無法做到的事，傳統研究範式苦苦糾結的許多難點，都在大數據到來的那一剎那遁於無形。

大數據的到來，讓所有社會科學領域能夠藉由前沿技術的發展從宏觀群體走向微觀個體，讓跟蹤每一個人的數據成為了可能，從而讓研究「人性」成為了可能。而對於教育研究者來說，我們比任何時候都更接近發現真正的學生。

『叄』大數據時代的數據分析跟過去有什麼不同

現在的大數據分析，跟傳統意義的分析有一個本質區別，就是傳統回的分析是基於結構答化、關系性的數據。
而且往往是取一個很小的數據集，來對整個數據進行預測和判斷。但現在是大數據時代，理念已經完全改變了，現在的大數據分析，是對整個數據全集直接進行存儲和管理分析。

『肆』大數據分析和傳統數據分析之間的關系和區別

大數據分抄析是數據分襲析的一種，是以新技術（相當於當前主流技術來說）處理數據的數據分析。
數據分析一般需要的是excel的能力，外加需要一些spss、R、之類的能力較為常見。大數據分析一般主要用的
是機器學習、數據挖掘等分析能力。當然，正如加米穀大數據所講，個別崗位可能還需要
架構（hadoop等）、存儲等搭建或者優化的能力。

『伍』下列關於大數據分析和傳統數據分析的區別中，說法正確的有（）。

【答案】：A、B、C、D
傳統的數據分析是「鉛鍵向後分析」，分析的是已經發生的情況。而在大數據時代，數據分析是「向前分析」，具有預測性。傳統的數據分析主要針對結構化數據。大數據不僅包括傳統的以文本資料為主的結構化數據，還包括信息化時代所有的文本、圖片、音頻、視頻等半結構數據和非結構化數據，且以半結構化和非結構化數據為主。大數據分析建立在海量原始數據基礎上，不需要預先設定研究目的和方法，而要從大量數據中通過數據挖掘技術找到數據之間的關系並建立模型，尋找導致現實情況的根源因凱激橡素，甚至形成理論和新的認知，在此基礎上對未來進行預測和優化，以實現社會運行中各個領域的持盯旁續改善與創新，選項A、B、C、D均正確。

導航:首頁 > 網路數據 > 解析大數據與傳統數據的區別

解析大數據與傳統數據的區別

與解析大數據與傳統數據的區別相關的資料

友情鏈接