⑴ 《數據之巔大數據革命,歷史、現實與未來》txt下載在線閱讀全文,求百度網盤雲資源
《數據之巔》(塗子沛)電子書網盤下載免費在線閱讀
鏈接:https://pan..com/s/15rX8nQukiy08Nlbr-8N9Fg
書名:數據之巔
作者:塗子沛
豆瓣評分:8.4
出版社:中信出版社
出版年份:2014-5-1
頁數:368
內容簡介:
《數據之巔:大數據革命,歷史、現實與未來》從美國建國之基講起,通過闡述初數時代、內戰時代、鍍金時代、進步時代、抽樣時代、大數據時代的特徵,系統梳理了美國數據文化的形成,闡述了其數據治國之道,論述了中國數據文化的薄弱之處,展望了未來數據世界的遠景。
「尊重事實,用數據說話」,「推崇知識和理性,用數據創新」,作者不僅意在傳承黃仁宇「數目字」管理的薪火,還試圖把數據這個科技符號在中國轉變為文化符號,形成一種文化話語體系。大數據正在撬動中國的制度創新、科技創新。
作者簡介:
塗子沛,江西吉安人,現居美國矽谷。2012年其著作《大數據》在中國社會開大數據之先河,引發了大數據戰略、數據治國和開放數據的討論,歷史學家許倬雲先生盛贊其「為華文世界開創了一個重要話題」。本書為作者第二本著作,全書對大數據追根溯源,提出當前信息技術的發展,已經讓中國獲得了後發優勢,中國要在大數據時代的全球競爭中勝出,必須把大數據從科技符號提升成為文化符號,在全社會倡導數據文化。
作者本科畢業於華中科技大學計算機系,研究生畢業於中山大學和卡內基梅隆大學,獲公共管理碩士和信息科學碩士學位。
⑵ 塗子沛大數據讀後感1800字
進入2012年大數據一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,並命名與之相關的技術發展與創新,人們對於海量數據的挖掘和運用,預示著新一波生產率增長和消費者消費浪潮的到來。「大數據」的運用在各個領域發揮著前所未有的重要作用,滲透到了當今每一個行業和業務職能領域,成為重要的生產因素,並對人類的數據駕馭能力提出了更新的挑戰。
一、傳統的信息格局被打破
不是我不明白,這世界變化快。2000年還是一張軟盤打天下的時代,短短十多年光景,硬碟的存儲容量已從4GB、16GB、32GB迅速攀升到1TB(相當於1024GB的容量)。原來僅有1.44MB的軟盤在當時感覺存儲容量還是蠻大的,到現在硬碟容量躥升至1TB了,反而感覺存儲空間捉襟見肘,到底是哪裡出現了問題呢?1965年英特爾的創始人之一戈登摩爾考察了計算機硬體的發展規律,提出了著名的摩爾定律。該定律認為,同一個面積集成電路上可容納的晶體管數目,一到兩年將增加一倍,換句話說,計算機硬體的處理速度和存儲能力,一到兩年將提升一倍。這一定律,得到驗證。
大數據!一語驚醒夢中人,大數據時代已經悄然來臨。隨著社交網路的逐漸成熟,移動寬頻迅速提升,雲計算、互聯網應用更加豐富。更多的感測設備、移動終端接入到網路,由此產生的數據及增長速度迅速攀升。那麼什麼是大數據呢,正如IBM總結的那樣:「大量化(Volume)、多樣化(Variety)和快速化(Velocity)」就是「大數據」的顯著特徵。
二、管理法則:質量是數據時代的根本
數據能滿足其既定的用途,它才有質量。如果不能滿足既定的目標和用途,就談不上質量。換句話說,數據的質量不僅取決於它本身,還取決於它的用途(引致資料庫專家傑克.奧爾森)。
隨著網路的出現,政府開始在網上發布信息和數據,對政府而言,是一個很大的挑戰,因為數據一經政府發布,往往被視為權威,對社會的各個領域都可能產生重大的影響。任何一份通過網路發布的信息,面對的都不是一定特定群體,而是全體國民,如果政府發布數據的質量不可靠,將受到頻繁的、大范圍的質疑,特別是一些可以會影響到公共政策和行業管制標準的數據,將引起巨大的爭議。
例如:單位奶製品中蛋白質含量、菌落總數應該是多少 ?飲用水裡能混雜多少含量的微量元素?新鮮蔬菜能帶有多少指標的殺蟲劑殘留?工廠排放的廢氣、汽車的尾氣以及車間的通風條件都要符合怎樣的標准等等,這些標准,都是數據。隨著社會的發民、科學的進步,這些標准越來越多越來越細,每一個都和國民生活和經濟發展息息相關。所以政府在網上發布數據,必須慎之又慎,保證質量。
三、大數據在各領域中的價值表現
1、數據競爭:企業贏利之道
企業以「低成本、高效率」的方式來開展公司的業務,而要做到「低成本、高效率」的運營以及決策正確,企業必須廣泛推選以事實為基礎的決策方法、大量使用數據分析來優化企業的各個運營環節,通過基於數據的優化和對接,把業務流程和決策過程當中存在的每一分潛在的價值都「擠」出來,從而節約成本,戰勝對手,在市場上倖存。這種競爭,就是一種基於數據的競爭。
已經有越來越多令人信服的證據表明:只要實施正確的政策和激勵,大數據將成為競爭的關鍵性基礎,並成為下一波生產率提高、創新和為消費者創造價值的支柱。信息時代的競爭,不是勞動生產率的競爭,而是知識生產率的競爭。數據,是信息的載體、是知識的源泉,當然也就可以創造價值和利潤,可以預見,基於知識的競爭,將集中表現為基於數據的競爭,這種數據競爭,將成為經濟發展的必然。
2、通訊、電信、商務智能、互聯網的逐步演變
近年來,隨著大數據的迅猛增加,各個行業、政府部門都在嘗試「用數據來決策」、「用數據來管理」、「用數據來創新」,在這個過程中,涌現了一大批既務實管用,又令人耳目一新的做法和應用。
回顧歷史,我們從廣播的年代到電視的年代再到本世紀初互聯網的年代,從音頻對話到可視電話,數據技術一直在我們的生活中扮演重要的角色,互聯網出現之後,就交流和互動而言,廣播和電視無疑相形見絀。
「大數據」可能帶來的巨大價值正漸漸被人們認可,它通過技術的創新與發展,以及數據的全面感知、收集、分析、共享,為人們提供了一種全新的看待世界的方法。
四、總結
塗先生從數據本身的革命、社會科學的革命、企業管理的革命、社會管理的革命四個方面深刻闡述了大數據的重要意義,以最前沿的視野、直接的解讀和剖析為我們理清了《大數據》一書的脈絡和精髓,為我們如何能更好地閱讀、理解、領會《大數據》一書的精神實質提供了很好的幫助,讓我們意識到:大數據的時代,是不可逃避的。
塗子沛大數據讀後感二:讀塗子沛的《大數據》有感
首先說下《大數據》這本書好的地方就是將大數據變化為一本科普讀物,不是講大數據的關鍵技術和具體實現,而更多的是圍繞美國政府基於數據的管理歷史線條展開,讓大家更加容易理解大數據在政府執政和公共事務管理中發揮的作用,所以我看完後最大的感覺就是關注智慧城市的相關人員完全有必要閱讀該書,會對以後在智慧城市的管理和建設中如何更好的理解大數據,應用大數據,發揮大數據本身的業務價值有更好的理解。
為何近幾年出現大數據,最重要的還是隨著信息技術和互聯網,管理的精細化,全球化和社交圈擴大,數據呈現了指數級的增長。2009年美國的數據,離散製造業966PB,政府848PB,傳媒行業715PB,這是麥肯錫2011年出版的一份報告《大數據:下一代創新,競爭和生產率的前沿》裡面的一個估算。正是由於數據指數級的增長,對數據的開放,信息自由,數據的採集,數據的分析和處理,預測和決策提出了更高的要求。
信息自由,一為信息公開,二為信息發布。公開是政府和某一社會特定主體的關系,是點對點的;而信息發布是政府和社會的關系,是點對面的。信息自由法已經成為美國不可缺少的一個基本法案,只有信息自由才談得上進一步的數據開放和數據共享。
我們信奉上帝,除了上帝任何人都要以數據說話。信息技術發展,數據指數級增長,已經徹底改變了政府,社會,商業群體的決策方法。需要的是形成一種數據驅動的決策方法,數據治國,需要基於實證的事實而非簡單的`意識形態。而真正要讓數據能夠上升到決策層面,首先需要的就是數據大范圍採集,數據抽樣,數據測量和數據質量管理。另外數據驅動和事件驅動是兩種模式,數據驅動強調的是歷史和預測,而事件驅動強調的是實時和響應。大數據有一個維度專門是指速度和快速響應,更需要考慮事件驅動和數據驅動融合。
帝國法則,詳細講述了數據的收集法則,使用法則,發布法則和管理法則。數據能夠滿足既定的用途,它才有質量。如果不能滿足既定的目標和用途,就談不上質量。換句話說,數據的質量不僅取決於它本身,還取決於它的用途。數據質量的問題涉及到數據收集,使用,發布等所有過程的問題。數據質量管理要有標准,有流程,有救助機制。
從軟體的開源到數據的開放,我們過渡到一個新的世界,可以講數據開放式本身的另外一個重點。在這個新的世界裡面,數據遠遠比軟體更加重要。從2004年以來,美國一直在進行數據開放運動,聯邦政府也專門家裡了數據開放站DataGov,其主要目標就是通過數據開放,通過鼓勵新的創意,讓數據走出政府,得到更多的創新型應用。從而進一步鞏固政府透明化,民主化和政府效能。
數據之爭涉及到原始數據採集,數據質量,數據安全,數據粒度,數據價值,數據虛實多個維度。而DataGov不僅僅開放了原始數據,地理數據,還包含了數據分析工具的開放。數據開放為創新提供了無窮的燃料,因為創新型應用,數據的能量將逐層放大。
預測未來最好的方法,就是創造未來。而數據最大的價值仍然在預測上面,在解決了數據開放,數據採集,數據質量管理,數據處理後,最重要的作用就是基於數據進行科學的預測和決策。數據競爭將是企業贏之道,一些企業已經將他們商業活動的每個環節放在了數據收集,分析和行動的能力上。
塗子沛大數據讀後感三:讀塗子沛《大數據》有感
7月的一天,我有幸拿到了塗子沛的《大數據》一書,幾個月來認真翻閱了好幾遍,並查閱了許多相關的文章,也讓我產生了寫下這篇讀後感的沖動。
。
我們處於大數據時代
當今的時代是一個信息的時代,是一個數據爆炸的時代。信息是數據的內容,數據是信息的載體。隨著電腦、網路的普及,搜索引擎技術的進步以及雲時代的來臨,上至國家下至個人,無不為數據所包圍,信息無處不在、數據無處不在。難以想像離開數據、離開數據管理,我們這個社會將會是什麼樣子。
那麼大數據時代到底有多大呢?我們知道計算機用二進制存儲和處理數據,一位是指一個二進制數位——0或1,這是存儲信息的邏輯單元。一個位元組有8位,再往上是KB(1KB是210位元組)、MB(1MB是220位元組)、GB(1GB是230位元組)、TB(1TB是240位元組)、PB(1PB是250位元組)、EB(1EB是260位元組)、ZB(1ZB是270位元組)、YB(1YB是280位元組)。但這究竟是多大的數據呢,我們還是難以想像。有人統計過將1TB的數據全部列印出來,需要用5000萬個四開門的書櫃去儲藏。這是多麼龐大的一個數啊,而這只是1TB——240個位元組。而僅全世界消費者一年產生的數據就有6000PB,全世界企業一年產生的數據有7000PB。截至2010年,人類產生的數據為1。2ZB,且數據每年以指數級增長,每兩年我們擁有的數據將翻一番。
在大數據時代,數字電視、手機、移動互聯網統治了我們。截至2012年,中國手機網民數突破4。2億;2013年中國超過美國成為最大的智能手機市場;2013年2月微信用戶數突破4億,到9月,微信用戶達到5億,微信用戶正在以每6個月增長1億用戶的速度增長;95%的智能手機用戶睡前玩手機。
「棱鏡門」事件主角愛德華斯諾登一時間成為全球關注的目標,網路時代何處安放我們的隱私?美國間諜衛星精度達到了5至10厘米,當今社會我們每個人近乎「透明」!
大數據時代給我們帶來什麼。
1965年,英特爾創始人之一戈登摩爾考察了計算機硬體的發展規律,提出了著名的摩爾定律。該定律認為,同一個面積集成電路上可容納的晶體管數目,一到兩年將增加1倍,也就是說,其性能將提升1倍。換句話說,計算機硬體的處理速度和存儲能力,一到兩年將提升1倍。這一定律揭示了信息技術進步的速度。
數據的爆炸是「三維」的,是立體的,這三個維度,主要表現在:同一類型的數據量在快速增長;數據增長速度在加快;數據的多樣性,即新的數據來源和新的數據種類在不斷增長。
任何一件事物,都有一個從量變到質變的過程。在當前這個數據爆炸的時代,數據帶給我們什麼呢?我想最重要的是帶來了思維模式的轉變。轉變了我們一直以來以因果邏輯思維的模式,變成了相互關系的邏輯思維。舉一個例子,在不久的將來我們完全可以通過數據分析,預判出一次地震的時間、地點、強度,但我們不是通過分析地殼運動而來的,而是通過相互關系的龐大的數據分析而來的。
2008年的冰災,當時的廣州火車站滯留了25萬人,這個數據是通過當時在這個區域的手機使用數統計出來的,與後期的最終統計基本吻合。大數據使我們開始了一次全新的探索,而探索的意義不在於發現新大陸,而在於發現新視角。
大數據時代給企業帶來了什麼。
數據挖掘是一種知識產生的過程,從中產生創新、產生管理、產生推動社會變革的理論與實踐。
沃爾瑪公司是美國的一家世界性連鎖企業,以營業額計算,為全球最大的公司。沃爾瑪一年產生的數據有2500TB。沃爾瑪公司通過對大量歷史數據的分析發現,年輕爸爸去超市購買嬰兒尿布會順便買點啤酒犒勞自己。因此,沃爾瑪推出了尿布與啤酒搭售的營銷策略,使銷售量增長。
紐約,美國最大的城市及第一大港,擁有810多萬人口,其36%為外國移民,人口使用約170種語言。1990年,紐約市共發生了兇殺案2245宗,1995年下降到1171宗,2009年下降到466宗,創下50年最低。紐約是如何實現這個成績的呢?原來紐約通過把20年的犯罪數據和交通數據整合,開發出了「數據驅動的警務管理」,發現交通事故高發地帶,也是犯罪活動的高發地帶,而且兩者的高發時間段也同樣吻合。這就將警察以往「亡羊補牢」的工作模式轉變為「守株待兔」的工作模式,取得了巨大的成績。
大數據及其分析,將會在未來10年改變幾乎每一個行業的業務功能。任何一個組織,如果早一點著手大數據工作,都可以獲得明顯的競爭優勢。用另一本類似著作《大數據時代》的作者維克托的一句話:「大數據是未來,是新的油田、金礦。」
當前我們的企業每天獲得大量的生產、營銷、辦公數據,如何將數據分析應用其中是時代賦予我們的挑戰。如何實現粗放型向精細化轉變,大數據為我們的企業提升管理效率、提高服務水平提供了有利平台。
世界每天都在變,唯一不變的是變化。大數據將是傳統行業的掘墓者,盛極一時的柯達倒閉了,微軟收購了諾基亞……我們的企業處在這樣一個變革的社會,應該何去何從,值得我們每一個人深思。
⑶ 數據之巔的書評
★塗子沛先生開啟了一道大門,我相信,後面會有更多的發展,讓大家進入這一個重要的現代文化園地。
——許倬雲 著名歷史學家、美國匹茲堡大學歷史系榮譽講座教授
★在《數據之巔》這本書中,塗先生跳到了哲學思考的層面,以統計學的社會應用為切入點,解構數據文化在美國政治、經濟乃至軍事發展上起到的關鍵作用,一環扣一環,構思精巧,故事生動,邏輯清晰,讀起來實在「解渴」。感謝塗先生的智慧,為時代貢獻了一部傑作!
——郭為 神州數碼控股有限公司董事局主席
★塗子沛先生的《數據之巔》通過追溯梳理美國的數據歷史、展望人類的數據未來,給中國社會提出了一個數據時代的新命題——如何構建數據文化?本書引人入勝、發人深思,是不可不讀的好書。——馬蔚華 招商銀行前行長
★數據本無大小,但運用數據的立場卻分出大小,是謂大數據。數據表示的是過去,但表達的是未來,所以觀察數據需要有歷史觀。塗子沛先生的這本新作《數據之巔》以大歷史、大數據、大社會、大進步的格局,通過數據將遙遠拉近,將悠久縮短,將巨大歸聚,將過程簡直。無論你從事何業或研究何題,都值得認真閱讀這部巔峰之作。
——朱小黃 中信銀行行長、中信集團監事長
★大數據是互聯網金融的基礎支柱。互聯網金融是雲計算、大數據、社交網路這個移動互聯大時代里的小時代。時代潮流,浩浩盪盪!塗子沛先生的大數據系列著作,帶您觀時代大潮!——肖風 通聯數據董事長、萬向信託董事長
★塗子沛先生《數據之巔》一書的歷史高度和現實意義,超出了他的《大數據》。如果說他上部書開啟了中國人對大數據的認識,此書則從歷史的角度來說明,對數據的理解和掌握是人類文明進步的標志。中國人在「初數時代」是被動的、落後的,黃仁宇在他的名著《萬曆十五年》中也將中國明朝未能走向資本主義歸結為中國人不能在「數目字上管理國家」。在新世紀的大數據時代,我們能否成為參與者甚至領導者?子沛這本書中有諸多可貴的思考和啟示,我向讀者推薦。
——田溯寧 中國寬頻資本董事長
★塗先生深思熟慮,用語殷殷,穿行在中美兩國的歷史中,努力發掘各個大數據改變觀念,改造社會,改革制度的故事,無論人與事件,都是栩栩如生,發人深省。這本書讓我們有目標有信心,也給我們創新的無限空間。
——王巍 中國金融博物館理事長
★大數據的江湖有兩派,國家治理派和產業升級派。塗子沛先生無疑是國家治理派的宗師,這本書在美國200多年的政界商海、刀光劍影中勾勒出雄渾的數據思維、文化、價值觀和方法論。臨到尾處,我的期待愈來愈強。他的第一本書《大數據》在通篇的歷史視角、西方視角後,煞費苦心附上一篇「挑戰中國」的尾聲,把人拉回當下、令人掩卷憂思;這次果不其然,子沛以整整一章的濃墨重彩,挑戰了「智慧城市」這一兼具進行時和未來時的話題,而當涉及中國元素時,子沛的行文中出現了暖色調,那種欣賞和希冀讓人寬慰之極、意猶未盡!期待《數據之巔》之後,山不窮,峰更高。——吳甘沙 英特爾中國研究院院長
★塗子沛先生已經成為中國大數據和數據分析領域最前沿的思想者和專家,如果您想了解大數據的歷史、現實和未來,這本書將是您的必讀書目。
——托馬斯·H·達文波特 巴布森學院教授,麻省理工學院數字商務中心研究員
⑷ 大數據的現實意義
問題一:大數據的現實意義 舉個例子 你在某寶買了件內衣 馬雲就能知道你的胸圍 你的嗜好(蕾絲還是)你的住址 電話 姓名等等一系列問題
問題二:大數據有哪些重要的作用 主要由以下三點作用:
第一,對大數據的處理分析正成為新一代信息技術融合應用的結點。移動互聯網、物聯網、社交網路、數字家庭、電子商務等是新一代信息技術的應用形態,這些應用不斷產生大數據。雲計算為這些海量、多樣化的大數據提供存儲和運算平台。通過對不同來源數據的管理、處理、分析與優化,將結果反饋到上述應用中,將創造出巨大的經濟和社會價值。
第二,大數據是信息產業持續高速增長的新引擎。面向大數據市場的新技術、新產品、新服務、新業態會不斷涌現。在硬體與集成設備領域,大數據將對晶元、存儲產業產生重要影響,還將催生一體化數據存儲處理伺服器、內存計算等市場。在軟體與服務領域,大數據將引發數據快速處理分析、數據挖掘技術和軟體產品的發展。
第三,大數據利用將成為提高核心競爭力的關鍵因素。各行各業的決策正在從「業務驅動」 轉變「數據驅動」。
問題三:大數據真的有意義么 研究表明,大數據是繼傳統IT之後下一個提高生產率的技術前沿和信息服務業發展的重要推動力。大數據的使用將成為未來提高競爭力、生產力、創新能力以及創造消費者盈餘的關鍵要素。
大數據應用能夠發揮重要的經濟作用,不但有利於私人商業活動,更有利於國民經濟和公民。數據可以為世界經濟創造重要價值,提高企業和公共部門的生產率與競爭力,並為消費者創造大量的經濟剩餘。
大數據及其開發利用能夠催生新的產業形態,拓展成為戰略性新興產業的重要組成部分。大數據的生產、整合、開發利用具有廣泛的高附加值,可以形成和應用於各行業的關鍵發現,大數據的有效利用可以創造巨大的潛在價值,許多行業和承擔業務職能的組織可以利用大數據提高人力、物力資源的分配和協調能力,減少浪費,增加透明度,並促進新想法和新見解的產生。
在當下這個信息爆炸的時代,大數據是未來的趨勢。ITjob官網有關於大數據應用實例的文章和介紹,很多論壇和貼吧也有關於大數據的討論,你可以去具體了解下大數據在生活中的應用。以及未來的發展前景,再來思考有沒有意義。
問題四:什麼是大數據,大數據為什麼重要,如何應用大數據 空談數據沒有太大意義,要看數據的主要方向是什麼。1、從技術應用方向來說,我們的數據主要做傳播指導;2、數據研究過程中我們的數據主要來自互聯網的公共數據(媒體數據、自媒體數據、企業自營的媒體數據),通過數據解決用戶洞察問題、傳播效果問題、競爭情報獲取的問題,3、我們主要是在大數據的維度上的研究上,我們的維度更多更寬廣,維度的多少決定了效果。
問題五:何謂大數據?大數據的特點,意義和缺陷. 大數據技術(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。
特點:
1.數據量大;
2.數據類型多;
3.數據處理實時性強;
4.數據真實性。
意義:大數據的意義在於通過對大量數據進行分析從而對核心價值進行預測。
缺陷:對處理能力要求高,存在隱私安全問題。
問題六:什麼是大數據,大數據為什麼重要,如何應用大數據 讀讀這本書吧。。
駕馭大數據 駕馭未來
文/林海龍 虎嗅網友
大數據的流行,也引發了圖書業大數據出版題材的升溫。去年出版的《大數據》(塗子沛著)是從數據治國的角度,深入淺出的敘述了美國 *** 的管理之道,細密入微的闡釋了黃仁宇先生」資本主義數目式管理「的精髓。最近人民郵電出版社又組織翻譯出版了美國Bill Franks的《駕馭大數據》一書。
該書的整體思路,簡單來說,就是敘述了一個」數據收集-知識形成-智慧行動「的過程,不僅回答了」what「,也指明了」how「,提供了具體的技術、流程、方法,甚至團隊建設,文化創新。作者首先在第一章分析了大數據的興起,介紹了大數據的概念、內容,價值,並分析了大數據的來源,也探討了在汽車保險、電力、零售行業的應用場景;在第二章介紹了駕馭大數據的技術、流程、方法,第三部分則介紹了駕馭大數據的能力框架,包括了如何進行優質分析,如何成為優秀的分析師,如何打造高績效團隊,最後則提出了企業創新文化的重要意義。整本書高屋建瓴、內容恣意汪洋、酣暢淋漓,結構上百川歸海,一氣呵成,總的來說,體系完備、內容繁豐、見識獨具、實用性強,非常值得推薦,是不可多得的好書!
大數據重要以及不重要的一面
與大多數人的想當然的看法不同,作者認為「大數據」中的」大」和「數據」都不重要,重要的是數據能帶來的價值以及如何駕馭這些大數據,甚至與傳統的結構化數據和教科書上的認知不同,「大數據可能是凌亂而醜陋的」並且大數據也會帶來「被大數據壓得不看重負,從而停止不前」和大數據處理「成本增長速度會讓企業措手不及」的風險,所以,作者才認為駕馭大數據,做到游刃有餘、從容自若、實現「被管理的創新」最為重要。在處理數據時,作者指出「很多大數據其實並不重要」,企業要做好大數據工作,關鍵是能做到如何沙裡淘金,並與各種數據進行結合或混搭,進而發現其中的價值。這也是作者一再強調的「新數據每一次都會勝過新的工具和方法」的原因所在。
網路數據與電子商務
對顧客行為的挖掘早已不是什麼熱門概念,然而作者認為從更深層次的角度看,下一步客戶意圖和決策過程的分析才是具有價值的金礦,即「關於購買商品的想法以及影響他們購買決策的關鍵因素是什麼」。針對電子商務這一顧客行為的數據挖掘,作者不是泛泛而談,而是獨具慧眼的從購買路徑、偏好、行為、反饋、流失模型、響應模型、顧客分類、評估廣告效果等方面提供了非常有吸引力的建議。我認為,《駕馭大數據》的作者提出的網路數據作為大數據的「原始數據」其實也蘊含著另外一重意蘊,即只有電子商務才具備與顧客進行深入的互動,也才具有了收集這些數據的條件,從這點看,直接面向終端的企業如果不電子商務化,談論大數據不是一件很可笑的事?當然這種用戶購買路徑的行為分析,也不是新鮮的事,在昂德希爾《顧客為什麼購買:新時代的零售業聖經》一書中披露了商場僱傭大量顧問,暗中尾隨顧客,用攝影機或充滿密語的卡片,完整真實的記錄顧客從進入到離開商場的每一個動作,並進行深入的總結和分析,進而改進貨物的陳列位置、廣告的用詞和放置場所等,都與電子商務時代的客戶行為挖掘具有異曲同工之妙,當然電子商務時代,數據分析的成本更加低廉,也更加容易獲取那些非直接觀察可以收集的數據(如信用記錄)。
一些有價值的應用場景
大數據的價值需要藉助於一些具體的應用模式和場景才能得到集中體現,電子商務是一個案例,同時,作者也提到了車載信息「最初作為一種工具出現的,它可以幫助車主和公司獲得更好的、更有效的車輛保險」,然而它所能夠提供的時速、路段、開始和結束時間等信息,對改善城市交通擁堵具有意料之外的價值。基於GPS技術和手......>>
問題七:互聯網大數據有哪些好處多 大數據是什麼?為什麼要使用大數據?大數據有哪些流行的工具?本文將為您解答。
現在,大數據是一個被濫用的流行詞,但是它真正的價值甚至是一個小企業都可以實現。
通過整合不同來源的數據,比如:網站分析、社交數據、用戶、本地數據,大數據可以幫助你了解的全面的情況。大數據分析正在變的越來越容易,成本越來越低,而且相比以前能更容易的加速對業務的理解。
大數據通常與企業商業智能(BI)和數據倉庫有共同的特點:高成本、高難度、高風險。
以前的商業智能和數據倉庫的舉措是失敗的,因為他們需要花費數月甚至是數年的時間才能讓股東得到可以量化的收益。然而事實並非如此,實際上你可以在當天就獲得真實的意圖,至少是在數周內。
為什麼使用大數據?
數據在呈爆炸式的速度增長。其中一個顯著的例子來自於我們的客戶,他們大多使用谷歌分析。當他們分析一個長時間段數據或者使用高級細分時,谷歌分析的數據開始進行抽樣,這會使得數據的真正價值被隱藏。
現在我們的工具Clickstreamr可以收集點擊級的巨量的數據,因此你可以追蹤用戶在他們訪問路徑(或者訪問流)中的每一個點擊行為。另外,如果你加入一些其他的數據源,他就真正的變成了大數據。
更完整的解析
大數據大數據並不僅僅是大量的數據。他的真正意義在於根據相關的數據背景,來完成一個更加完整的報告。舉個例子,如果你把你的CRM數據加入到你網站的數據分析當中,你可能就會找到你早就知道的高價值用戶群。她們是女性,住在西海岸,年齡30至45,花費了大量的時間在Pinterest和Facebook。
現在你已經被這些知識武裝起來了,那就是如何有效的設定和獲取更多高價值的用戶。
類似Tableau和谷歌這樣的公司給用戶帶來了更加強大的數據分析工具(比如:大數據分析)。Tableau提供了一個可視化分析軟體的解決方案,每年的價格是2000美金。谷歌提供了BigQuery工具,他可以允許你在數分鍾內分析你的數據,並且可以滿足任何的預算要求。
大數據是什麼?
由於大數據往往是一個混合結構、半結構化和非結構化的數據,因此大數據變得難以關聯、處理和管理,特別是和傳統的關系型資料庫。當談到大數據的時候,高德納公司(Gartner Group,成立於1979年,它是第一家信息技術研究和分析的公司)的分析師把它分成個3個V加以區分:
量級(Volume):大量的數據
速率(Velocity):高速的數據產出
多樣性(Variety):多種類型和來源的數據。
正如我們所說,大部分的企業每一天在不同的領域都在產出大量的數據。這里給出一組樣本數據的來源及類型,他們都是企業在做大數據分析時潛在的收集和聚合數據的方式:
網站分析
移動分析
設備/感測器數據
用戶數據(CRM)
統一的企業數據(ERP)
社交數據
會計系統
銷售點系統
銷售體系
消費者數據(例如益佰利的數據、鄧氏商聯的數據或者普查數據)
公司內部電子表格
公司內部資料庫
位置數據(空間位置、GPS定位的位置)
天氣數據
但是針對無限的數據來源,不要去做太多事情。把焦點放在相關的數據上,並且從小的數據開始。通常以2-3種數據源開始是一個好的建議,比如網站數據、消費者數據和CRM,這些會讓你得到一些有價值的見解。在你最初進入大數據分析之後,你可以開始添加數據源來促進你的分析,並且公布更多的分析結果。
想要獲得更多關於大數據細節的知識,可以去查閱 *** 的大數據詞條。
大數據的好處
大數據提供了一種識別和利用高價值機會的前瞻性方法。如果你想,那麼大數據可以提供如......>>
問題八:大數據時代,大數據概念,大數據分析是什麼意思? 世界包含的多得難以想像的數字化信息變得更多更快……從商業到科學,從 *** 到藝術,這種影響無處不在。科學家和計算機工程師們給這種現象創造了一個新名詞:「大數據」。大數據時代什麼意思?大數據概念什麼意思?大數據分析什麼意思?所謂大數據,那到底什麼是大數據,他的來源在哪裡,定義究竟是什麼呢?
一:大數據的定義。
1、大數據,又稱巨量資料,指的是所涉及的數據資料量規模巨大到無法通過人腦甚至主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。 2、大數據技術,是指從各種各樣類型的大數據中,快速獲得有價值信息的技術的能力,包括數據採集、存儲、管理、分析挖掘、可視化等技術及其集成。適用於大數據的技術,包括大規模並行處理(MPP)資料庫,數據挖掘電網,分布式文件系統,分布式資料庫,雲計算平台,互聯網,和可擴展的存儲系統。
互聯網是個神奇的大網,大數據開發也是一種模式,你如果真想了解大數據,可以來這里,這個手機的開始數字是一八七中間的是三兒零最後的是一四二五零,按照順序組合起來就可以找到,我想說的是,除非你想做或者了解這方面的內容,如果只是湊熱鬧的話,就不要來了。
3、大數據應用,是 指對特定的大數據 *** ,集成應用大數據技術,獲得有價值信息的行為。對於不同領域、不同企業的不同業務,甚至同一領域不同企業的相同業務來說,由於其業務需求、數據 *** 和分析挖掘目標存在差異,所運用的大數據技術和大數據信息系統也可能有著相當大的不同。惟有堅持「對象、技術、應用」三位一體同步發展,才 能充分實現大數據的價值。 當你的技術達到極限時,也就是數據的極限」。大數據不是關於如何定義,最重要的是如何使用。最大的挑戰在於哪些技術能更好的使用數據以及大數據的應用情況如何。這與傳統的資料庫相比,開源的大數據分析工具的如Hadoop的崛起,這些非結構化的數據服務的價值在哪裡。
二:大數據的類型和價值挖掘方法1、大數據的類型大致可分為三類:1)傳統企業數據(Traditionalenterprisedata):包括 CRM systems的消費者數據,傳統的ERP數據,庫存數據以及賬目數據等。2)機器和感測器數據(Machine-generated/sensor data):包括呼叫記錄(CallDetail Records),智能儀表,工業設備感測器,設備日誌(通常是Digital exhaust),交易數據等。3)社交數據(Socialdata):包括用戶行為記錄,反饋數據等。如Twitter,Facebook這樣的社交媒體平台。2、大數據挖掘商業價值的方法主要分為四種:1)客戶群體細分,然後為每個群體量定製特別的服務。2)模擬現實環境,發掘新的需求同時提高投資的回報率。3)加強部門聯系,提高整條管理鏈條和產業鏈條的效率。4)降低服務成本,發現隱藏線索進行產品和服務的創新。
三:大數據的特點業界通常用4個V(即Volume、Variety、Value、Velocity)來概括大數據的特徵。具體來說,大數據具有4個基本特徵:1、是數據體量巨大數據體量(volumes)大,指代大型數據集,一般在10TB規模左右,但在實際應用中,很多企業用戶把多個數據集放在一起,已經形成了PB級的數據量;網路資料表明,其新首頁導航每天需要提供的數據超過1.5PB(1PB=1024TB),這些數據如果列印出來將超過5千億張A4紙。有資料證實,到目前為止,人類生產的所有印刷材料的數據量僅為200PB。2、是數據類別大和類......>>
問題九:舉例說明大數據在哪些方面發揮著重要作用 大數據是信息技術與專業技術、信息技術產業與各行業領域緊密融合的典型領域,有著旺盛的應用需求、廣闊的應用前景。為把握這一新興領域帶來的新機遇,需要不斷跟蹤研究大數據,不斷提升對大數據的認知和理解,堅持技術創新與應用創新的協同共進,加快經濟社會各領域的大數據開發與利用,推動國家、行業、企業對於數據的應用需求和應用水平進入新的階段。
問題十:為什麼大數據如此重要 大數據(big data),是指無法在可承受的時間范圍內用常規軟體工具進行捕捉、管理和處理的數據 *** 。
在維克托・邁爾-舍恩伯格及肯尼斯・庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有數據進行分析處理。大數據的4V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。
對於「大數據」(Big data)研究機構Gartner給出了這樣的定義。「大數據」是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
根據 *** 的定義,大數據是指無法在可承受的時間范圍內用常規軟體工具進行捕捉、管理和處理的數據 *** 。
大數據技術的戰略意義不在於掌握龐大的數據信息,而在於對這些含有意義的數據進行專業化處理。換言之,如果把大數據比作一種產業,那麼這種產業實現盈利的關鍵,在於提高對數據的「加工能力」,通過「加工」實現數據的「增值」。
從技術上看,大數據與雲計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單台的計算機進行處理,必須採用分布式架構。它的特色在於對海量數據進行分布式數據挖掘,但它必須依託雲計算的分布式處理、分布式資料庫和雲存儲、虛擬化技術。[1]
隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。《著雲台》的分析師團隊認為,大數據(Big data)通常用來形容一個公司創造的大量非結構化數據和半結構化數據,這些數據在下載到關系型資料庫用於分析時會花費過多時間和金錢。大數據分析常和雲計算聯繫到一起,因為實時的大型數據集分析需要像MapRece一樣的框架來向數十、數百或甚至數千的電腦分配工作。
大數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據。適用於大數據的技術,包括大規模並行處理(MPP)資料庫、數據挖掘電網、分布式文件系統、分布式資料庫、雲計算平台、互聯網和可擴展的存儲系統。
最小的基本單位是bit,按順序給出所有單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
意義:
有人把數據比喻為蘊[4] 藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數據並不在「大」,而在於「有用」。價值含量、挖掘成本比數量更為重要。對於很多行業而言,如何利用這些大規模數據是成為贏得競爭的關鍵。
大數據的價值體現在以下幾個方面:
1)對大量消費者提 *** 品或服務的企業可以利用大數據進行精準營銷;
2) 做小而美模式的中長尾企業可以利用大數據做服務轉型;
3) 面臨互聯網壓力之下必須轉型的傳統企業需要與時俱進充分利用大數據的價值。
⑸ 《大數據》這本書的美國作家是誰
塗子沛先生。《大數據:正在到來的數據革命》通過講述美國半個多世紀信息開放專、技術創新的歷史,以屬別開生面的經典案例——奧巴馬建設「前所未有的開放政府」的雄心、公共財政透明的曲折、《數據質量法》背後的隱情、全民醫改法案的波瀾、統一身份證的百年糾結、街頭警察的創新傳奇、美國礦難的悲情歷史、商務智能的前世今生、數據開放運動的全球興起,以及雲計算、Facebook和推特等社交媒體、Web3.0與下一代互聯網的未來圖景等等,為您一一細解,數據創新給公民、政府、社會帶來的種種挑戰和變革。
⑹ 數據之巔讀後感
細細品味一本名著後,大家心中一定是萌生了不少心得,此時需要認真思考讀後感如何寫了哦。你想好怎麼寫讀後感了嗎?以下是我幫大家整理的數據之巔讀後感範文,僅供參考,大家一起來看看吧。
大數據,一個近年來的流行詞彙,隨著互聯網信息技術的普及開始深入人心,又隨著互聯網對各類行業各種關系的顛覆和變革開始廣泛普及。當越來越多的人開始對大數據無比推崇的時候,其實只是跟著趨勢而已。這時候,如果能跳出來,看看這種趨勢的源頭和足跡,或許更容易找出一些能夠指導未來的價值。在如今這個數據浪潮之中,《數據之巔》就提供了這么一個別樣的視角。
要了解大數據,先得認清數據;要認清數據,先得看清數據的作用和價值。這方面,建國不過二百餘年但已然是超級大國的美國無疑是最好的標本。都說美國的文明是建立在印刷術的基礎上,這其實就是數據文化的基礎——信息可以通過便捷的紙張與文字組合,實現一種虛擬化和抽象化,而這種抽象化很快就得到了廣泛的信任。這是最早為數據創造價值准備的基礎。在此之上,美國建國的先賢們考慮到了權力的分配、社會的發展等各項因素,建立了民主、共和相互制約的執政體系。事實上,所有的美好都是限制之後的產物,自由、民主和平等這人類的三大追求之間就是相互制約的關系。那麼,該怎麼進行有效的制約?如何讓大家都能接納?這時候,最能代表客觀現實的數據就出現了。
《數據之巔》的第一部分就是這樣展開的,從各種歷史事件中數據的作用以及人們對數據的態度、反應、應用方式,勾勒出了數據文化的成長和成熟。解決權力分配的問題、決定改變歷史的戰爭、制定從戰略到戰術的安排、考慮政治的計算以及商業層面上的利用;從搜集、統計、篩選、量化、抽樣的方式方法演變到了解、安排、預測、准備、發掘、規范的效果體現,經歷的歷史似乎並不長,但造就的變革尤其精彩。數據其實一直都在,只在於人們是否需要它、重視它、願意聆聽它的意見……而人們往往也都在遇到了問題難以決斷的時候才會想到數據這個夥伴,這也是為什麼在第一部分的結尾中日本崛起的思考——二戰後空前繁榮的美國工業因為遇上了供不應求的狀態,自然走上了粗放型路徑,冷落了相應的數據應用,而戰敗的日本正因為深陷困境,在快速汲取先進知識的同時也迅速接納了數據文化,通過數據抽樣的方式快速提升了質量……日本的崛起可以看作窮則思變的例子,但變革中數據的作用尤其明顯。數據的優化作用由此可見一斑,書中更有很多案例,但要參透這一點,先得認識到數據的重要性才行,這可以算作是數據文化的入門吧!
可以說現實中的一切都是越用越少的,但看似虛擬的數據卻越用越多。所謂大數據時代,背景正是高度發展科技能讓更多的數據得以留存,這種留存和挖掘完全由機器實施,由此得到的結果也是嘆為觀止的。如果說科技的發展趨勢已經越來越超乎我們的想像,那總有一些規律或者原則可以抓住——比如數據。書中第二部分的大數據崛起便將重點放到了當下,由此展望未來的可能性。誠然,大數據是被技術發展所推動的,但更是被重視數據的人們所推動的。
技術降低了數據獲取、積累的成本,增加了計算的可能和利用的空間,但這只是一個表象。深層次需要在意的則是數據的開放,只有數據開放才有多元的整合,這需要由人來推動,而推動者必須有多元認知的思維方式、開放的心態——這是數據文化中尤為重要的一部分。如果之前我們認為智慧是屬於人的,那麼未來這個詞將更多的形容一些別的體系,比如「智慧城市」。其實人的'智慧依靠的是學習、理解和經驗,那麼機器的學習靠的就是數據,還有那些我們為其規劃的應用方式和我們的需要。如何確定我們的規劃和需求?靠數據,更得靠能夠深入人心的數據文化!
正如作者提到中國社會要將「大數據」這個科技符號轉變為文化符號,因為只有文化才能真正驅動人們的成長和發展,科技只是手段而已。只有建立了數據文化,願意尊重數據、善於整合數據、敢於發掘數據中的異動……才能正真利用好大數據。數據文化是尊重事實、強調精確、推崇理性和邏輯的文化,這種文化將是發展最重要的動力,更是最好的參考。從《數據之巔》中,隱約可以看到一條隱約的軌跡,通向未知的遠方卻一直步步為營,這便是數據,來自於人而勝於人。
歌德把歷史稱為「上帝的神秘作坊」。在徐子沛先生新作《數據之巔》的精彩演繹下,關於數據文化如何形成、數據治國理念如何深入人心的歷史畫卷徐徐展開,令我們再次飽覽古今中外因數據成就的神奇瞬間,領略統計文史的山風水韻和數據文化的悠遠迴音。康德說,數字是重要的透視方式。此言不虛。
子沛先生一如既往把中國作為本書的重心和出發點。從中國歷史上的吉光片羽到第一次現代意義上的人口普查,從中國數據可視化先驅人物陳正祥的執著努力到民族復興能否量化的中國話題,這些元素無疑令中國讀者感到親切和溫暖。遺憾的是,在悠久的中華文明史上,這樣的「統計事件」不僅鳳毛麟角,亦未能帶動整個民族和社會形成用數據說話、以數據治事的風尚。即使今天,我們依然面對這樣一個不容迴避的事實:統計數據雖然證明了中國已經成為世界第二大經濟體,在數據使用上,特別是大數據的收集、分析、應用的手段、意識、水平和能力方面,我們與美國、歐洲,甚至同處亞洲的日本,仍有不小差距。作為統計人,在享受本書呈現的統計和數據文化盛宴時,無疑更平添了一份獨有的清醒與憂思。
中國需要進一步營造數據文化氛圍。美國的歷史,就是一部「善用數據」的歷史。說數據成就了共和政治、數據終結了南方的奴隸制度,尚屬見仁見智。「布蘭代斯訴訟方法」及後來的漢德公式,公共預算制度的普及,統計學理論方法用於公共政策的制定,以及成本效益分析方法在美國政府的推行等,實實在在證明了數據在保障公平正義、促進進步發展、增進自由和理性方面的決定性支撐作用,體現了數據治國的基本理念。黨的十八大把實現國家治理體系和治理能力的現代化作為新的奮斗目標,更加迫切需要大力弘揚建立在數據基礎上的科學與理性,需要建樹「尊重事實、強調精確、推崇理性和邏輯的數據文化」,需要進一步營造善用數據的社會氛圍,使注重數據、使用數據真正成為一種習慣和風尚。
中國統計人要做大數據的先行者和引領者。在統計的「純真年代」,政府統計是權威一般的存在,是統計生產的當然主導者。大數據時代,海量的網路化電子化信息使每一個人、每一個單位都可能成為信息的生產發布主體,政府統計包打天下的格局正在被打破。我們當然可以通過法律手段來「宣示主權」,但我相信大多數統計人憑著專業精神、職業尊嚴,將不屑於採取這么「簡單而直率」的方法,而更願意像一名「騎士」一樣為榮譽而戰。作為統計數據的生產者、發布者和使用者,沒有人比我們更了解大數據的意義、價值和力量。「用大數據打造統計基礎數據『第二軌』」,深刻闡明了國家統計局應用大數據的戰略思想和戰略思維。目前,國家統計局已經與17家企業簽訂利用大數據戰略合作框架協議,在貿易統計、價格統計、交通運輸統計、農業統計等多個領域取得重要進展。我們不僅要直接應用大數據,還要在推動數據開放和共享、建立和統一相關應用標准,實施國家大數據創新驅動戰略等方面,發揮應有作用。
中國統計人還要成為數據文化的倡導者和傳播者。在宣傳統計工作、弘揚數據文化方面,統計人有著天然的優勢和便利。家喻戶曉的GDP、CPI、PPI、PMI等統計拳頭產品,大型的經濟普查、人口普查、一套表聯網直報等重要統計事件,為宣傳統計、傳播數據文化發揮了重要而積極的作用。我們還可以做得更好,也有理由做得更好。中國統計也要創建類似美國普查局的LEHD—工作單位和家庭住址的縱向動態系統,當超級颶風「桑迪」來襲,該系統大顯神通,成功幫助紐約市政府組織救災,並迅速對災害影響作出准確評估。這樣的統計「明星」產品,能夠使人們更加信賴數據、依靠數據,推動數據融入政府管理、商業運營和社會治理以及人們的日常生活。
近年來,國家統計局在統計文化宣傳方面做了大量工作,精心打造了統計網站、中國統計開放日、統計微訊微信等一系列新的統計宣傳平台,政府統計的形象和公信力不斷提升。今後更要以啟沃公眾數據意識為己任,以記錄中華民族復興的偉大進程為使命,從更大的視野,以更宏大的敘事,講述中國的統計故事,書寫中國的統計歷史,把數據文化理念播撒得更廣、更深、更遠。
尼採在《查拉圖斯特拉如是說》中有這樣一句話:在有力量的地方,數字這位女主人就會生成,她更有力量。數據不僅代表「真正的事實」,還蘊藏著事物的發展規律。隨著大數據時代的到來,數據資源及其開發利用正逐漸成為決定和影響各國核心競爭力的關鍵因素。中國不僅要做數據大國,更要成為數據強國。
我們這代統計人註定無法甘於淡泊和平凡,唯有順應時代要求,以更先進的理念、更開放的姿態、更高超的技術積極擁抱大數據,廣泛應用大數據,生產出更多更具競爭力的統計產品,才能在智能時代、智慧城市建設以及實現國家治理現代化的進程中,續寫政府統計新的輝煌。
最近我讀了塗子沛先生的《數據之巔》這本書,我深深的被作者的思考的深度和數據的力量所震撼。全書從數據角度出發,以美國政府歷史以來「依數治國」的成功經驗來闡釋數據帶給社會帶來的挑戰與變革。
進入21世紀第二個十年以來,隨著互聯網信息技術的普及與廣泛應用,大數據時代正式到來。時代的變革意味著新的發展機遇與挑戰,要想在數據浪潮當中立於不敗之地,這就需要我們在精確的掌握數據之後,通過數據的創新來創造未來。
精確的掌握數據,需要從認識數據開始。簡而言之,數據就是體現客觀事實的表象,是客觀性與抽象性有機結合的產物,容不得半點虛假。我們不能否認的是,所有的美好都是在限制之後的,而能夠有效地進行限制,且又能夠得到大家的一致認可客觀現實,唯有那一張便捷的紙片上數據與文字的組合體,其實這就是數據文化的基礎。數據創造價值准備的基礎從側面印證了中國的四大發明印刷術是西方國家文明的基礎。
所謂的大數據時代就是在當下高度發展科技能讓更多的數據得以保存。保存下來的數據是一種依據,更是一種工具。世間萬物的發展都呈現各種各樣的規律性,數量龐大且規律復雜,很難讓我們掌握,但是一旦轉換成數據保存之後,從數據的角度去分析規律變化的軌跡,能夠很容易掌握並加以運用。而我作為基層執法工作者,運用數據進行執法,以控制數據達到預期管理預期,是這本書給予我最大的啟發。
古代中國傳統的執法者,是通過簡單甚至帶有粗暴的手段對執法對象進行強制管理,執法效果雖然容易操作,且直觀,但是這是一種凌駕於規律之上,片面的追求短期效果的低級執法模式。進入新中國以來,尤其是改革開放以來,我國堅持依法治國,黨的十八屆四中全會更提出了全面推進依法治國的新常態,這是數據文化的有力體現,是我黨在大數據時代下,一項重大舉措。
我認為,大數據時代下運用數據進行執法,是執法能力現代化的利器。我從事交通執法這個職業已經數載,經歷過從無到有,又逐漸的從有變成無。這個前後並不矛盾,從前的「無」是法律不健全,無章可循,有章難循狀態。只能夠自身黨性約束和對事物客觀理解進行執法,甚至有的時候片面的依靠上級,人類對事物的理解具有局限性,這難免會造成決策錯誤。
從無到有,是法律慢慢健全,法律的約束更加全面,但有的時候簡單的照本宣科,眉毛鬍子一把抓,也就成了教條主義。而從有到無,是一種利用客觀的數據,以法律為准則,通過科學執法,將數據調整趨於合理。類似國家利用經濟規律宏觀調控國民經濟,用一隻看不見的「大手」將全國的經濟發展形勢引導至合理增長的區間。數據合理了,管理預期也就達到了。相對於我們有肉眼去觀察,顯得更為精確,且具很高的可信度。這樣一來,對我們基層執法工作者帶來的巨大的福利,我們從此以後再也不用擔心對工作進展情況不了解而心急火燎了。
在大數據時代變革的今天,客觀、精確、理性和邏輯的「數據文化」理念是推進國家治理體系和治理能力的現代化利器。大數據時代下的執法行為更是離不開數據,只有充分的利用數據化管理、數據化創新,才能在當前數據浪潮當中主動適應新常態,科學地實現新突破和新作為。
《數據之巔》讀後感這是塗子沛先生關於大數據的第二本書,讀了以後可以說是振聾發聵,醍醐灌頂。
第一本書本身就寫得很棒了,其主要是從美國現代社會應用大數據成功解決的許多問題入手,說出了大數據的實際用處。而這本書抽絲剝繭從歷史上美國對於數據的發展帶給我們啟迪。
1、數據分權
何為民主,何為共和,如何防範多數人的暴政?基於這個問題美國給出了參議院代表的共和與眾議院代表的民主,權利與義務統一,即投票與納稅都按所代表的的人口來。
這里就誕生了對精確人口掌控的需求。基於這一點,逐漸養成了按數據說話的傳統。並逐漸將單一的人口數量統計擴展到宗教,種族,性別,年齡。
2、數據引領改革
之前是北美大陸種植煙草亟需黑奴,美國解放後煙草行業敗落。後來棉花興起,死灰復燃。北方工業化也需要勞動力。黑人自由就發瘋的言論源於統計上的失誤,錯誤稀釋原因因基數不同。一項戰役向大海進軍完全依靠准確數據搶掠補給。謝爾曼格蘭特。背後的原因:維護美國的統一,(解放黑奴後其的生計太難),動員黑奴使其轉敗為勝。
3、數據推動技術
用數據研究社會,普通人的歷史。統計學將研究粒度縮小到一個個人。加菲爾德將普查上升到了專業部門。迅速上升的統計內容,不斷增加的人口給數據處理提出了挑戰。於是技術創新製表機誕生了(數據處理),依靠這個IBM發展壯大,商業模式:只租不賣設備及服務。
4、數據爭取權益
量化提高質量。經濟發展帶來勞資沖突,政治,道德失范。這時候為了改善工人生活又依靠數據興起了數據分析法,成本收益分析法又在美國水利方面大顯身手,繼而福特車的風波也加速了成本收益分析法傳播同時依靠數據公開使得企業不斷提升產品質量,並將人的價值考慮進來。
5、抽樣
運用抽樣的方法降低數據處理的工作量,省時省力。蓋洛普引領的總統預測,亂世佳人的精準預測,准確定位。把數據引入電影工業。質量管理大師戴明將統計方法引入質量管理領域,成就日本經濟奇跡。
⑺ 理解大數據時代的數字鴻溝
理解大數據時代的數字鴻溝
大數據是近幾年來炙手可熱的話題,大數據的優勢以及大數據所帶來的新思潮形成研究熱潮。從隨機抽樣到全體樣本,從要求精確到應對混雜,從追求因果到發現關聯,大數據時代改變著我們的信息環境與信息處理思維模式。但是,並非所有的人都能同時走入大數據時代,如同媒介技術的每一次創新與擴散一樣,敏感的企業和組織是大數據的先行者和實踐者,也是最早的大數據受益者;而普通的個體則在面對大數據時呈現差異,有的在時間上跟進遲緩,有的在數據分析能力上存在欠缺,有的不知道如何尋找開放數據,有的在數據噪音前不知所措。傳統互聯網時代的數字鴻溝尚未完全填平,而在大數據時代新的數字鴻溝又在形成並不斷影響與改變著人們的政治經濟地位。
討論大數據時代的數字鴻溝,需要明確區分「數字差異」與「數字鴻溝」.從詞源上看,兩者意義接近,都是由「Digital Divide」翻譯而來。但從傳播效果或情感色彩上看,數字鴻溝比數字差異更能引起人們的警示。在大數據時代,人們創造數據並被數據所包圍,囿於人的視野及精力,人們在面向數據並做出選擇時必然會出現差異。比如,互聯網提供的個性化的搜索引擎,個性化藏夾等都會導致信息瀏覽的個人化,大數據時代的數字差異不可避免。數字鴻溝比數字差異更能引起人們的警惕,數字鴻溝更強調在認識和機會上的差異。數字差異是知道有機會而不為,數字鴻溝則是想為而沒有能力或機會。同在大數據背景之下,數字鴻溝可能會在擁有數據、分析數據和數據思維三個層面存在數字鴻溝。
三個不同的分析維度
(一)擁有數據的數字鴻溝
大數據時代,「全新」「、革命」「、顛覆性」等術語頻繁出現,但「大數據」這一標簽下所指涉的問題卻由來已久。伴隨著互聯網的勃興,數據的指數增長、信息超載和數據處理問題等一直是人們不得不面對的問題。在大數據時代,數據的掘取、存儲、處理與應用方面的技術有了快速的發展,但是在誰擁有數據這個造成數字鴻溝最基本的問題上,當下關於大數據的討論並未給出讓人滿意的答案。
1.數據開放
對於企業和政府來講,大數據是一筆寶貴的財富,「對大數據的掌握可以轉化為經濟價值的來源」也可以從更為准確的角度了解社會,並進行管理。因此,企業和政府需要從普通公眾那裡搜集數據,數據的傳播是一種自下而上的過程,最先擁有和掌控大數據的也是來自企業和政府的「數字先鋒」.但是,消弭數字鴻溝恰恰需要另一種形式的數據流動,即開放數據---讓數據從企業和政府所有而變成被公眾所共享,這是一個自上而下的過程。在現實生活中,這種自上而下的信息流動處處面臨著阻力:一方面企業把數據當做核心競爭力或者核心機密,並且花費了大量的人力、物力、財力去做數據分析,因此很難實現數據的共享;另一方面政府的數據公開步伐還比較緩慢,公眾獲得有價值的信息依然有難度。
數據開放所形成的數字差異需要開放數據來解決。哪些數據能夠開放,以何種形式向公眾開放,具體的實施者是誰,誰又能為數據開放過程中的「搭便車」行為買單都是需要思考的問題。大數據既可以產生商業價值,同時又兼具公共性的特質,在此過程中,和公眾利益密切相關的數據需要開放,我國早在 2007 年 1 月 17 日就通過了《中華人民共和國信息公開條例》,明確規定原則、范圍、方式、程序和監督保障制度。在大數據時代,政府開放數據的力度應該進一步加大,同時對公眾進行獲取數據的素養教育,實現數據的民有和民享。作為一種公共資源,數據分配的公平性和財富分配的公平性一樣,都會對社會結構產生非常大的影響,政府和企業可以依靠數據存儲與分析技術的發展做「數據銀行」業務,讓每個公民都有機會在「數據銀行」存儲和提取自己想要的數據。國內學者塗子沛在《大數據》一書中,把開放數據放在數據民主的角度去思考,指出開放數據運動會推動「開放政治、開放政府、開放媒體、開放城市等等一系列的運動和口號」.這對消除數據所有權所形成的數字鴻溝,建設一個數據公平的美麗新世界提供了一條可行之路。
2.數據搜集
大數據時代的基礎在於海量數據,究竟多大才是大數據呢?「麥肯錫全球研究所」的最新報告對大數據下了一個定義:「大數據是指大小超出了傳統資料庫軟體工具的抓取、存儲、管理和分析能力的數據群」而且,大數據的標准隨著數據的指數增長也在不斷發生變化。今天,我們在談論大數據時往往以 pb 為單位,海量數據提供了更為詳細的信息,但是也存在一些隱憂,即數據的價值密度太小,因而搜集數據以及在海量數據中尋找有價值信息的成本太高。舍恩伯格在接受《中國經濟周刊》記者謝瑋專訪時說:「在許多方面,我們仍然生活在一個『小數據』時代,在這個時代收集數據非常耗時、昂貴和困難。」大數據時代的數據搜集是一項龐大的工程,而且,大數據還遠遠未達到普通人能夠支付得起的階段。
搜集數據的數字鴻溝在大數據時代似乎沒有減少,反而隨著大數據處理技術的發展而在逐步擴大。對於媒體和企業來講,搜集數據和處理數據都並非易事,著名的《哈佛商業評論》雜志對全球財富1000強的企業應用大數據的情況做了一項科學調研,發現「大多數企業還處於大數據的入門階段,還小具備真正挖掘大數據的能力」,而且,「只有巧%的受訪者認為所在企業的數據可訪問性夠好或者達到世界級水平,只有21%的受訪者認為所在企業的分析能力夠好或者達到世界水平」.顯然,對於普通公眾來說,搜集數據、挖掘數據的難度更大,差異也更大。在搜索引擎主宰信息流向的時代,公眾就因為使用不同的搜索引擎而產生數字鴻溝,使用普通的搜索引擎與使用較為專業的搜索引擎和資料庫之間存在著差異。在大數據時代,公眾不僅要知道如何利用專業的搜索引擎,還需要在海量的信息中迅速尋找最有價值的信息,囿於公眾能力的差異,在搜集階段產生的數字鴻溝將難以避免。而且,互聯網下的數據處於不斷更新的狀態,時效性是非常重要和關鍵的。在對「知識鴻溝」的研究中,西方學者 J.S.艾蒂瑪和 F.G.克萊因曾經提到「上限效果」,指的是隨著時間的推移,知識鴻溝會逐漸減少。但是在互聯網時代,信息的價值和及時性有密切的關系,即使隨著時間的推移公眾在搜集數據上的「鴻溝」逐漸縮小,但是後來者所擁有的數據價值也會大打折扣。媒介環境學派的代表性人物萊文森對信息超載的論述可能會對緩解大數據時代數據搜集所產生的差異提供幫助,他認為建立信息分類法則可以解決信息超載的困擾,比如在圖書上建立圖書分類法則並依據這一法則運作,就能夠解決圖書館的信息超載問題,這一思想對解決長期困擾人類的信息超載具有普遍的啟示意義。
(二)分析數據的數字鴻溝
誰擁有數據會產生差異,而在同等擁有數據的情況下,公眾利用數據的能力不同,也會產生差異。大數據既包含以數量關系為基礎的結構化數據,也包含以定性描述為主的非結構化數據,而且,非結構化數據往往佔有很大的比例。因此,在大數據時代,同樣擁有數據並不代表著同樣能夠利用數據,分析數據和掘取價值上的數字鴻溝依然需要引起我們的警惕。
1.數據刪除
大數據時代是一個信息高度碎片化的時代,信息中的重復、噪音、冗餘和信息中的人為因素(網路水軍)等,都影響到人們對數據的分析與利用,此時,刪除數據與收集數據同樣重要。除《大數據時代:生活工作與思維的大變革》之外,舍恩伯格還有一部影響深刻的著作-《刪除:大數據取捨之道》。在這部著作中,舍恩伯格提醒人們在大數據時代「記憶成為常態,而遺忘成為例外」,因此要注意信息取捨之道;在這個「沒有遺忘的世界裡」,遺忘恰恰成為一種寶貴的信息處理方式與權利數據刪除是一個人性化的問題,隨著「電腦原生代」的成
長,每個人都有著青澀的、尷尬的、甚至小堪回首的過去,互聯網之前人們會嘗試遺忘這些小愉快的過去,但是互聯網的記憶讓每個人小得小而對這樣一個現實:人們可能會為若十年前犯過的錯誤買單。
刪除同樣是一個技術性的問題,在互聯網時代,歷史悠久的數據會逐漸成為「數據垃圾」,不但佔用大量的存儲資源,而且也會影響對當下數據的分析,評估數據與刪除數據成為大數據時代必不可少的數據處理方式。但是具體到個人就會產生一個問題,人不可能像機器一樣去評估和處理,只能按照過往的經驗來處理信息。另一位國外學者蒂奇諾在分析「知識鴻溝」所形成的原因時提到,個人的信息儲備也會產生「知識鴻溝」,即「正規教育和從大眾媒體中獲得的信息會幫助受教育程度較高的人提供理解知識的背景」.大數據時代並未改變人們接受信息的習慣,因此,在大數據時代依然是受教育程度較高的人先學會接受和刪除信息。刪除還有一個頗具哲學意味的意義,在大數據時代,選擇即刪除。人對數據的接受具有零和效果「,朝向一組數據的同時意味著放棄另外的數據,這也是另外一種意義上的刪除,處理掉低質量的過時數據是發現大數據意義的前提。知名學者馬修·E·梅所著的《精簡:大數據時代的商業致勝法則》,同樣也提到大數據時代的信息刪除與精簡問題。在大數據時代,能夠快速在第一時間獲得最有價值數據的企業會逐漸發展起來,而不懂大數據或沉迷於大數據的企業會逐漸落伍。
2.數據可用
大數據時代提供了一個多元、詳細且復雜的數據環境,在大數據時代,一切現實都可以量化為數據。但是如果用大數據來創造價值就需要從海量數據中找出有價值的數據,並把數據還原為現實。因為」,擁有一個數據集,無論它們多大或者多小,其自身都不會帶來任何價值。「大數據的最終價值還是體現在數據的」可用「之上。與此同時,關於數字鴻溝的問題也出現在數據的」可用「上,大數據如同提供了一個美味的堅果,不藉助工具很難打開它,而大數據所使用的」雲存儲、雲計算「又不是任何公眾都能輕易掌握的。少部分人掌握了分析數據與應用數據的能力,還有相當多的大眾面對浩如煙海的大數據不知所措,最終陷入信息超載的焦慮之中。
彌補數據可用的」數字鴻溝「需要讓數據變得直觀而可視,這仍然是一個涉及公共性的話題。把數據還原為現實既需要數據分析的人工智慧技術,也需要人的敏銳的分析與判斷能力,更為關鍵的是,需要把對數據所提示的環境真實地傳達給公眾。政府和媒體要做的依然很多,首先需要數據處理技術的普及,把解讀關於公共事務的大數據當做一個公共事業,如在 20世紀 60 年代,被稱為」人工智慧之父「的約翰·麥卡錫曾預言」有朝一日,計算可能變成公共設施「.其次,媒體要做好數據與現實之間」擺渡人「的角色,不僅要用大數據來分析受眾獲得收益,更要體現媒體的公共性,讓受眾能夠讀懂大數據並受用於大數據。比如,美國記者在報道龍卷風時」將龍卷風破壞房屋的損毀數據,與地圖相重疊,製成大數據地圖。「這樣,受眾既能夠比較精確地了解龍卷風帶來災害的大體區域,又能夠精確理解某個區域龍卷風造成損失的具體情況。
(三)數據思維的數字鴻溝
大數據熱所帶來的重要變化是關於數據思維的變化,關於大數據的討論有很多,但並非有了」大數據「這樣一個概念我們的信息環境就自然而然發生了質的變化,而是在互聯網逐漸走向海量數據的今天,從」數字化生存「轉向」數據化生存「的大數據思維讓人們多了一個認識世界的視角。在大數據技術之外的數字鴻溝來自於人們的思維層面,即人們對待數據的思維存在差異。
1.超越大數據
大數據時代的思維之一是要超越」數據迷思「,把數據當成一種工具而不是一種數據霸權。舍恩伯格在《大數據時代》一書中指出大數據帶來的三種變化:不是隨機樣本,而是全體數據;不是精確性,而是混雜性;不是因果關系,而是相關關系。這些變化對於傳統的定量研究方法有極大的影響,可是定量方法的改進並不能取代定性的研究,必須超越數據才能發現數據背後的意義與價值。於是,大數據思維包含了三個層次。第一個層次是發現海量數據,了解海量數據的潛在價值,但並不能很好的利用數據;第二個層次是能夠較好的利用數據,但是往往陷入數據崇拜,解決不了關於意義的問題;第三個層次是能夠利用數據,但是也能夠同時超越數據,發現價值。這三個層次在大數據的發展過程中既是一個歷時的過程,也是一個共識的過程。大數據概念的興起與擴散還需時日,因此在數據思維上三個層次的」數字鴻溝「仍將長期存在。
2.大數據素養
數字鴻溝的減小也需要在硬體與軟體兩個方向上作出努力,在大數據時代仍然如此。從最近幾年的中國互聯網路統計報告來看,硬體的數字鴻溝在逐漸縮小,而軟體的數字鴻溝仍在擴大。消弭數字鴻溝需要政府、企業等開放公共數據並提供利用公共數據的方法,還需要提升全體公民的大數據素養,實現大數據的民有與民享。數據素養也被稱為數據信息素養,主要指人們在科學數據的採集、組織和管理、處理和分析、共享與協同創新利用等方面的能力,以及在數據的生產、管理和發布過程中的道德與行為規范。全面提高全民的數據素養,我們才能自信地迎接大數據時代的到來,並利用大數據為人類創造新的福祉。
⑻ 塗子沛大數據第十章講了什麼
塗子沛大數據第十章講了胡適批評差不多先生,黃仁宇求索數目字管理,作者從太平洋對面看到中美兩國的差距,深知中國缺少什麼。
大數據2012年7月出版的《大數據》是中國大數據領域第一本著作,引領了中國社會對大數據戰略、數據治國和開放數據的討論,該書先後獲得國家圖書館文津圖書獎、第四屆中國軟科學前沿探索獎、2012年度十大好書等獎項。
塗子沛,知名信息管理專家,曾居美國矽谷,現任阿里巴巴副總裁。畢業於華中科技大學、中山大學和卡內基梅隆大學。赴美留學之前,曾在省、市、縣幾級政府的不同部門磨礪10年,做過職業程序員,擔任過公安邊防巡邏艇的指揮官,也從事過政府統計工作。在美期間,先後擔任軟體公司的數據倉庫程序員、數據部門經理、數據中心主任、亞太事務總監、首席研究員等職務。除了工作、寫作,還熱心公益,曾任中國旅美科技協會匹茲堡分會主席,現任中國旅美科技協會副主席,上海真愛夢想公益基金會理事。
⑼ 讀《大數據時代》心得體會
讀《大數據時代》心得體會(一)
讀了《大數據時代》後,感覺到一個大變革的時代將要來臨。雖然還不怎麼明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰栗起來。
“在小數據時代,我們會假象世界是怎樣運作的,然後通過收集和分析數據來驗證這種假想。”“隨著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了。”書中幾乎肯定要顛覆統計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限於傳統的思維模式和特定領域里隱含的固有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。
當我們人類的數據收集和處理能力達到拍位元組甚至更大之後,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性後,似乎真的可以拋棄以抽樣調查為基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基於一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!
《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先後變化關系規則。兩者似乎是做同一件事。可大數據要的“不是因果關系,而是相關關系”,“知道是什麼就夠了,沒必要知道為什麼”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基於因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最後把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那麼大數據會不會通過正視混雜性,放棄因果關系最後反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區別在於人有邏輯思維而機器沒有。《大數據時代》也擔心“最後做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。
還好我知道自己對什麼統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
所以想向《大數據時代》的作者提一個合理化建議:把這本書繼續寫下去,至少加一個第四部分——大數據時代的邏輯思維。
讀《大數據時代》心得體會(二)
信息時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變„„我們這樣評論著的信息時代已經變為曾經。如今,大數據時代成為炙手可熱的話題。筆者在這說明信息和數據,只是試圖首先說明信息、數據的關系和不同,也試圖說明,為什麼信息時代轉變為了大數據時代?大數據時代帶給了我們什麼?
信息和數據的定義。維基網路解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態范疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關於事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字元和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴於數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。這是否是《大數據時代》一書所未曾闡述的背景材料?
在《大數據時代》一書中,大數據時代與小數據時代的區別:1、思維慣例。大數據時代區別與轉變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道“是什麼”,而不需要知道“為什麼”。作者語言絕對,卻反思其本質區別。數據的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認為數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關系更有利於預測未來。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭並進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。4、分析基礎。大數據是在互聯網背景下數據從量變到質變的過程。筆者認為,小數據時代也即是信息時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而並非相離互斥。
數據未來的故事。數據的發展,給我們帶來什麼預期和啟示?銀行業天然有大數據的潛質。客戶數據、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力„„可以這些都基於數據的收集、整理、駕馭、分析能力,基於脫穎而出的創新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創造“數據融合”,實現“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風雲變換,穩健贏取未來。
讀《大數據時代》心得體會(三)
這本書里主要介紹的是大數據在現代商業運作上的應用,以及它對現代商業運作的影響。
《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然後在通過解釋在對未來進行預測,並對未來可能出現的問題提出自己看法與對策。
下面來重點介紹《大數據時代》這本書的主要內容。
《大數據時代》開篇就講了Google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了20XX年美國的H1N1的爆發地與傳播方向以及可能的潛在患者的事情。Google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發一兩個周之後才可以弄到相關的數據。同時Google的預測與政府數據的相關性高達97%,這也就意味著Google預測數據的置信區間為3%,這個數字遠遠小於傳統統計學上的常規置信區間5%!而這個數字就是大數據時代預測結果的相對准確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近於總體的時候,通過計算得到的描述性數據將無限的趨近於事件本身的性質。而之前採取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們採取抽樣的方式來測量事物。而互聯網終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對准確性更高的“樣本=總體”的測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。
接下來,維克多又通過了IBM追求高精確性的電腦翻譯計劃的失敗與Google只是將所有出現過的相應的文字語句掃描並儲存在詞庫中,所以無論需要翻譯什麼,只要有聯系Google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以Google的電腦翻譯的計劃的成功,表明大數據時代對准確性的追求並不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其准確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。
之後,維克托又預測了一個在大數據時代催生的重要職業——數據科學家,這是一群數學家、統計學與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群傢伙的面前展現得淋漓盡致。所以為了避免個人隱私在大數據時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個人隱私。
無論如何,大數據時代將會到來,不管我們接受還是不接受!
我覺得《大數據時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發,比如你在相關的社交網站發表的言論或者照片都很有可能被“數據科學家”們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網上留下的痕跡。
我喜歡這本書是因為它給我展現了一個新的世界。
讀《大數據時代》心得體會(四)
利用周末,一口氣讀完了塗子沛的大作《大數據》。這本書很好看,行文如流水,引人入勝。書中,你讀到的不是大數據技術,更多是與大數據相關的美國政治、經濟、社會和文化的演進。作為一名信息化從業者,讀完全書,我深刻感受到了在信息化方面中國與美國的各自特色,也看到了我們與美國的差距。有幾個方面的體會,但窺一斑基本能見全貌。
一是政府業務資料庫公開的廣度和深度。近年來,隨著我國信息公開工作的推進,各級政府都在通過政府門戶網站建設積極推進網上政務信息公開,但我們的信息公開,現階段還主要是政府的政策、法律法規、標准、公文通告、工作職責、辦事指南、工作動態、人事任免等行政事務性信息的公開。當然,實時的政府業務資料庫公開也已經取得很大進步。在中國政府門戶網,可以查詢一些公益資料庫,如國家統計局的經濟統計數據、環保部數據中心提供的全國空氣、水文等數據,氣象總局提供的全國氣象數據,民航總局提供的全國航班信息等;訪問各個部委的網站,也能查到很多業務數據,如發改委的項目立項庫、工商局的企業信用庫、國土資源部的土地證庫、國家安監總局的煤礦安全預警信息庫、各類工程招標信息庫等等。這是一個非常大的進步,也是這么多年電子政務建設所取得的成效和價值!但是,政務業務資料庫中的很多數據目前還沒有實現公開,很多數據因為部門利益和“保密”等因素,還僅限於部門內部人員使用,沒有公開給公眾;已經公開的數據也僅限於一部分基本信息和統計信息,更多數據還沒有被公開。從《大數據》一書中記錄的美國數據公開的實踐來看,美國在數據公開的廣度和深度都比較大。美國人認為“用納稅人的錢收集的數據應該免費提供給納稅人使用”,盡管美國政府事實上對數據的公開也有抵觸,但民願不可違,美國政府的業務數據越來越公開,尤其是在奧巴馬政府簽署《透明和開放的政府》文件後,開放力度更加大。DATA.GOV是美國聯盟政府新建設的統一的數據開放門戶網站,網站按照原始數據、地理數據和數據應用工具來組織開放的各類數據,累積開放378529個原始和地理數據集。在中國尚沒有這樣的數據開放的網站。另外,由於制度的不同,美國業務信息公開的深度也很大,例如,網上公布的美國總統“白宮訪客記錄”公布的甚至是造訪白宮的各類人員的相關信息;美國的FedSpending網站,能夠逐條跟蹤、記錄、分析聯邦政府每一筆財政支出。這在中國,目前應該還沒有實現。
二是對政府對業務數據的分析。目前,中國各級政府網站所提供的業務數據基本上還是數據表,部分網站能提供一些統計圖,但很少能實現數據的跨部門聯機分析、數據關聯分析。這主要是由於以往中國政務信息化的建設還處於部門建設階段。美國在這方面的步伐要快一些,美國的DATA.GOV網站,不僅提供原始數據和地理數據,還提供很多數據工具,這些工具很多都是公眾、公益組織和一些商業機構提供的,這些應用為數據處理、聯機分析、基於社交網路的關聯分析等方面提供手段。如DATA.GOV上提供的白宮訪客搜索工具,可以搜尋到訪客信息,並將白宮訪客與其他微博、社交網站等進行關聯,提高訪客的透明度。
三是關於個人數據的隱私。在美國,公民的隱私和自有不可侵犯,美國沒有個人身份證,也不能建立基於個人身份證號碼的個人信息的關聯,建立“中央數據銀行”的提案也一再被否決。這一點,在中國不是問題,每個公民有唯一的身份信息,通過身份證信息,可以獲取公民的基本信息。今後,隨著國家人口基礎資料庫等基礎資源庫的建設,公民的社保、醫療等其他相關信息也能方便獲取,當然信息還是限於政府部門使用,但很難完全保證整合起來的這些個人信息不被泄露或者利用。
數據是信息化建設的基礎,兩個大國在大數據領域的互相學習和借鑒,取長補短,將推進世界進入信息時代。我欣喜地看到,美國政府20XX年啟動了“大數據研發計劃”,投資2億美元,推動大數據提取、存儲、分析、共享、可視化等領域的研究,並將其與超級計算和互聯網投資相提並論。同年,中國政府20XX年也批復了“十二五國家政務信息化建設工程規劃”,總投資額估計在幾百億,專門有人口、法人、空間、宏觀經濟和文化等五大資源庫的五大建設工程。開放、共享和智能的大數據的時代已經來臨!
我精心推薦
⑽ 「大數據是邁向智能社會的土壤」
「大數據是邁向智能社會的土壤」
「有人說數據是石油,是黃金。在我看來,那都是1.0版本的說法。如今,數據是土壤,是我們邁向智能社會的土壤。」9月13日上午,著名信息管理專家、阿里巴巴集團副總裁塗子沛做客廣東職工大講堂時表示。
他認為,在這個大數據時代,沉澱、採集和分析數據使人們能夠掌握很多以前無法獲得的信息,實現預判趨勢和定製化生產,從而幫助企業轉型升級,實現社會精細化發展;同時,通過合理開放和融通數據,能夠實現智慧的集成和社會治理水平的提高。
互聯網是沉澱數據的戰略基礎設施
「今天的互聯網,不僅僅是互聯,而是沉澱數據的基礎設施。」塗子沛認為,「互聯網+」里的「+」是指超越互聯,而具體表現就是數據化。
那麼,互聯網時代的大數據又是什麼?他表示,數據是對客觀世界的測量和記錄,而大數據是「傳統的小數據」+「現代的大記錄」。「我們在收集數據時,可能是出於某個特定目的,只限於在特定維度上來收集。但這些數據往往可能在新的維度,在新的領域發生作用。」
比如,現在社會上都在講傳統企業轉型,怎麼轉型?塗子沛表示,傳統企業很難清楚地知道自己的產品賣到哪裡、賣給了誰,但藉助互聯網,企業能夠通過數據了解並分析購買者的消費行為。
他認為,一切業務數據化,便是互聯網企業與傳統企業的不同所在:互聯網能把每一筆交易用數據沉澱下來,作為基礎設施將數據採集,決定著企業今後的命運。
「企業可以和每一個終端用戶之間建立數據聯系,通過實時的、源源不斷的數據沉澱,更加了解市場和用戶。在數據時代,比的不是勞動生產力,而是知識生產力。就以電商來說,哪一家電商平台最早、最有效最精確把這些分析出來,銷售量可能提得更高。不僅如此,互聯網和大數據還能幫助企業拓展新的業務和商機。」
塗子沛以阿里巴巴為例,「每做一筆交易就沉澱一筆記錄,數據沉澱越來越多,有了這些數據,便可以去開拓新的領域,比如說金融業務。」他解釋,目前阿里巴巴平台上如果有商家提出貸款需求,在幾分鍾內,平台便可以決定是否發放貸款。「依據是什麼?便是藉助交易等各類數據的積累,全面了解商家的運營狀況等信息,決策能不能放貸。」
大數據「表示的是過去,表達的是未來」
在「互聯網+」時代,數據到底有多重要?「數據是土壤」,孕育智能社會。塗子沛稱,數據不再僅是黃金和石油,因為它們用一次就消耗了,而數據永遠在那裡,越用越多,並最終經過沉澱、採集、分析實現1+1>2的效果。
「如今數據存儲分享成本極其低廉,微信、微博等社交媒體的普及,使得每個人都貢獻數據,引起數據爆炸。」在塗子沛看來,這些數據是預測世界最好的工具,數據表示的是過去,表達的是未來,數據就是規律的載體。「目前我們的數據正在實現把機器連接起來,成為物聯網,而未來一旦機器跟人體連接上網,7×24小時源源不斷收集數據、產生數據,一切都將數據化。
進入大數據時代,未來生產和社會將變成什麼樣?塗子沛認為,依託大數據分析,企業還可以預測消費行為和市場趨勢,從而提供個性化產品滿足不同需求。
「比如每個人打開手機淘寶,看到的頁面、產品、商品都不一樣,做了個性化之後,手機淘寶點擊和下單的人要比不做個性化高一倍左右。為什麼?因為數據分析使得我們把他最關心的事情推送給他了。」
值得注意的是,數據也將對傳媒業產生巨大影響。他提到,媒體每天處理的信息其實就是數據的富礦,也應當通過數據分析和用戶習慣給每個人推送新聞,使每一位客戶通過客戶端只看到自己想看到的新聞,為每一位客戶量身定做,提供個性化服務。
塗子沛補充說,這就需要有大量的數據,才能基於客戶興趣和趨向的掌握,提供個性化服務。當前我們處在一個注意力匱乏的時代,大數據信息爆炸,注意力是最寶貴的,個性化服務就是在爭取注意力,從而實現價值。
大數據幫助提高社會治理水平
「數據雖然是最重要的資源,不流動,就不能產生價值」,塗子沛認為,「互聯網+」時代,開放數據,讓數據流動,整合數據,才能夠實現「1+1>2」的增值。開放數據才能推動知識經濟、網路經濟、新經濟的發展。
他強調,數據要融通才能產生價值。要通融數據,必須首先開放數據。「中國已成立專門部門管理數據開放問題,廣東則是第一個成立大數據管理局的省份。塗子沛認為,開放數據是一個系統工程,要把數據以一定的程度跟其他的數據、其他平台進行整合,更好的服務經濟社會的發展。
「比如,通過掌握每一部車的位置,就知道車在紅綠燈面前等了多久,現在智能紅綠燈是全世界交通領域的前沿,通過將幾千萬條計程車數據開放出來,舉辦一場數據大賽,號召大家設計這樣一套系統,讓所有車在所有路口和地區等待的時間加總之和要最小。」
他說,這意味著,用外部力量調動內部創新,用互聯網來調動資源,尋找最優解決方案,提高社會治理水平。數據開放、共享和融通不僅使得社會效率更加有效,還增加新的藍海、新的資源,我們已經享受到了開放數據的好處。
以上是小編為大家分享的關於「大數據是邁向智能社會的土壤」的相關內容,更多信息可以關注環球青藤分享更多干貨