⑴ 大數據和徵信是什麼意思
大數據是互聯網金融形成的,主要數據來源於網貸,網貸很多上不了銀行徵信便形成了大數據信用,比如現在國家成立的百行徵信,如果需要查看大數據報告可以上一些微信公眾平台查詢,比如「百信查查」公眾號。徵信主要指銀行徵信,也就是央行徵信中心的報告,記錄的主要數據來源於信用卡,房貸,信貸記錄等。查詢可以去四大行,我一般去的是建設銀行,離我家比較近
⑵ 大數據時代讀後感5篇600字
去年的"雲計算"炒得熱火朝天的,今年的"大數據"又突襲而來。彷彿一夜間,各廠商都紛紛改旗換幟,推起"大數據"來了。於是乎,各企業的CIO也將熱度紛紛轉向關注"大數據"來了。有一張來自《程序員》微博的漫畫很形象。我覺得這張圖,很真實地反映了現實中小企業雲計算,大數據的現狀,下面是我為大家帶來的大數據時代 讀後感 ,希望你喜歡。
大數據時代讀後感1
舍恩伯格的《大數據時代》被人推崇為2012最佳書籍,今年安泰讀書會的重頭戲。雖然主講人最後放了個香港大黃鴨般的鴿子,但現場討論氛圍依舊非常熱烈——而且還是在沒幾個人讀完的情況下,也就意味著——大數據對我們的影響,已經深入到生活的方方面面。
無處不在的大數據:各種雲計算,谷歌的神通,亞馬遜的推送,天涯人肉,微博萬能等等等等,我們掌握了新的工具,也獲取了以前從未有過的各種信息。大數據拉近了我們與現實的距離,「地球村」變成了「地球屋」,彷彿所有人所有事物都觸手可及,而這些牛逼哄哄的互聯網巨頭就在客廳展示著世界的每一寸光景。
然而,事實真的是這樣嗎?首先,從應用角度出發,低廉的運算能力和存儲空間,讓以前的樣本分析顯得非常簡陋——一些從全體數據挖掘出來,忽略精確而從大量數據的簡單演算法得出來的結論顛覆了常識。但個人覺得,這只是統計學的終極目標——並沒有非常大的跨越,可能終結了回歸分析,有效性驗證等手段,但依舊還是統計。而革命性在於關注相關關系而非因果關系。現場討論從神學角度挑戰了因果關系的不可能——或者說人類用簡單思考的邏輯來定義因果,以及用之前小數據演繹出大概率事件來推導因果,都是不正確的。真正的因果關系應該屬於上帝的范疇,人類如果真的完全掌握之後,會統治整個宇宙。但我覺得,無需從神學觀點來討論,而可以借鑒量子力學對經典力學的顛覆——在原子層面上,經典力學會失效——那麼在大數據層面上,普通的抽樣調查直觀反映會失效。而且從量子力學角度是很難推導經典力學的公式,那麼從現在的慣有思維,也難以推導出大數據的因果關系。
大數據時代讀後感2
書中雖只是闡述了大數據帶來的信息風暴正在變革我們的生活、工作和思維,大數據開啟了一次重大的時代轉型,並未提及會對我們 教育 教學產生什麼影響,但在這樣的大環境之中,我們同樣可以獲得啟示,尋求大數據在教育工作中可實現的價值。
1.教師角度:從基於 經驗 到基於數據的教學轉型
「經驗主義」是指形而上學的思想 方法 和工作作風,其特點是在觀察和處理問題的時候,從狹隘的個人經驗出發,不是採用聯系、發展、全面的觀點,而是採取鼓勵、精緻、片面的觀點。在教學中,我們有時會憑藉以往經驗認定本節課學生的起點,從而制定教學目標、重難點以及教學過程。這往往忽略了上屆學生和這屆學生是有差異的,這班學生和另一班學生也是存在差異的,那如何准確把握學生的起點呢?我想可以藉助前測數據,它可以為有效教學指明了方向。
如教學「復式統計表」時,前期查找資料的時候就發現早在一年級上冊P96的時候學生就見過復式統計表,意讓學生初步認識統計表,滲透統計思想。而二三年級的書中練習也多有涉及,就是這種復式統計表沒有「表頭」,生活中的復式統計表也很多。既然在以前練習時碰到這么多次復式統計表,學生對復式統計表到底認識多少呢?我們對157名學生進行這樣的調查(如下圖),第1題:像上表這樣的統計表以前見過嗎?見過約佔65%,沒見過約佔35%,學生在練習中碰到過、生活中也經常看見,但還是約35%的學生回答自己沒見過,說明學生平時在看這個復式統計表的時候就浮於表面,所以這節課我們重點應該讓學生經歷復式統計表的產生過程,加深學生對復式統計表的印象。第2題:上表中的16表示什麼意思?能完整表達出二班身高在130~139厘米的學生有16人,約佔41%;表達一半,如二班16人,或130~139厘米16人,約佔22%,其他約佔37%,真正能正確讀懂復式統計表的學生一半不到,需要在課中進行讀圖方法的指導。而知道這個表叫做復式統計表的學生不到20%。
大數據時代讀後感3
這一章節,利用馬修莫里導航圖的例子引出了大數據的實踐方式,奇人莫里通過整理航海相關的邊角數據,把整個大西洋按照經緯度劃分了出來,並標注出了溫度、風速和風向,從而發現了洋流,也為船員提供了有效的航海路線,這就是數據的價值體現了。書中也提到了,量化我們周圍的一切,是數據化的核心,將文字變成數據、將方位變成數據,將溝通、情感變成數據,通過大數據,我們會意識到,世界在本質上是由信息構成的。
在工作中,這點也可以作為啟發點,通過對數據的整理,或者說以某種方式採集到相關數據,將數據整理出有價值的信息後,不斷的改善到工作流程、效率、服務方面,也是工作上的創新點。
筆者在書中提到了,數據的潛在價值,並提出了數據創新應用的方法,第一是數據的再利用,數據信息被採集用作特定分析後,在另一個領域或者角色立場下,或許會開發出新的有價值的信息;第二是數據的重組,將不同類別、類型的數據進行重組,產生一個新的數據集合出來,尋找其中的關聯性;第三是數據的擴展,這就需要在記錄數據的同時設計好他的可擴展性;第四是數據的折舊值,數據將會貶值,但是仍會有其潛在價值;第五是數據廢氣,即數據採集時的離散量、離散交互信號,舉例是谷歌與微軟的拼寫檢查;第六是開放數據,數據的開放將會有利於各行各業的使用,並促進全行業數據時代的發展。這其中又提到了數據估值的概念,在數據使用時價值才會體現出來,而不是在佔有本身。
根據所提供價值的不同來源,分別出現三種大數據公司,基於數據本身(採集大量數據的公司)、基於技能(提取用戶的需求,給出數據分析結果的公司)、基於思維(挖掘數據新的價值的公司)。
大數據時代讀後感4
如今說起新媒體和互聯網,必提大數據,似乎不這樣說就OUT了。而且人雲亦雲的居多,不少談論者甚至還沒有認真讀過這方面的經典著作--舍恩佰格的《大數據時代》。維克托.邁爾--舍恩伯格何許人也?他現任牛津大學網路學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。他的咨詢客戶包括微軟、惠普和IBM等全球頂級企業,他是歐盟互聯網官方政策背後真正的制定者和參與者,他還先後擔任多國政府高層的智囊。這位被譽為:大數據時代的預言家"的牛津教授真牛!那麼,這位大師說的都是金科玉律嗎?並不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應的理論功底,就能與之進行一場思想上的對話。
舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分"大數據時代的思維變革"中,舍恩伯格旗幟鮮明的亮出他的三個觀點:一、更多:不是隨機樣本,而是全體數據;二、更雜:不是精確性,而是混雜性;三、更好:不是因果關系,而是相關關系。對於第一個觀點,我不敢苟同。一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對於簡單事實進行判斷的數據分析難道也要採集全體數據嗎?我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,並不一定需要全部數據。聯繫到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限於目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
大數據時代讀後感5
世間萬物的復雜性多樣化並非非此即彼那麼簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什麼語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出"不是因果關系,而是相關關系。"這一論斷時,他在書中還說道:"在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足於僅僅知道「是什麼」時,我們就會繼續向更深層次研究的因果關系,找出背後的「為什麼」。"[i]由此可見,他說的全體數據和相關關系都在特定語境下的,是在數據挖掘中的選項。
大數據研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數據時代的商業變革。舍恩伯格認為數據化就是一切皆可"量化",大數據的定量分析有力地回答"是什麼"這一問題,但仍然無法完全回答"為什麼"。因此,我認為並不能排除定性分析和質化研究。數據創新可以創造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置於數據應用的商業系統中,而沒有把它置於整個社會系統里,但他在第二部分大數據時代的管理變革中討論了這個問題。在風險社會中信息安全問題日趨凸顯,數據獨裁與隱私保護成為一對矛盾。如何擺脫大數據的困境?舍恩伯格在最後一節"掌控"中試圖回答,但基本上屬於老生常談。我想,或許凱文.凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:"大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。"謝謝舍恩伯格!讓大數據討論從自然科學回到人文社科。由此推斷,《大數據時代》不是最終答案,也不是標准答案,只是參考答案。
大數據時代讀後感5篇600字相關 文章 :
★ 走進網路時代作文600字:互聯網時代不應是「忽老」時代
⑶ 如何運用大數據為徵信服務
二十多年間,伴隨著經濟體系的變革,我國企業信貸體系發生了重大的變化,由以大型企業為主要貸款群轉變為中、小、微企業成為貸款主力軍。面對新的貸款群體,銀行等資金機構無法充分地給予資金,造成了日益嚴重的「中小微企業融資困境」。小微企業貸款的瓶頸是「缺乏高效率、低成本、高精度基礎徵信服務」。在此背景下,小宇宙給大家講解幾種大數據徵信的探索之路。
一、 大數據徵信誕生的背景
二十多年間,伴隨著經濟體系的變革,我國企業信貸體系發生了重大的變化,由以大型企業為主要貸款群轉變為中、小、微企業成為貸款主力軍。面對新的貸款群體,銀行等資金機構無法充分地給予資金,造成了日益嚴重的「中小微企業融資困境」。林毅夫早在2001年《經濟研究》發表的文章《中小金融機構發展與中小企業融資》,認為小型金融機構更適合服務於小企業,奠定了我國之後大力推動中小型金融機構發展的理論基礎。城市商業銀行、農村信用社、小額貸款公司紛紛成立,帶動全社會的小微企業貸款產品激增,資金供給量大大提高,數年間小微企業融資環境得到了很大的改變。
然而,小型資金機構的出現並沒有從根本上解決小微融資的困境,相對於大企業,小微企業對資金的佔用比例極低(約30%),與小微企業對GDP的貢獻(約70%)極不相稱。近年來,小微企業的生存壓力不斷增大,傳統行業競爭激烈,利潤空間被不斷擠壓,賒銷使小微企業面臨殘酷的資金周轉壓力,因資金鏈斷裂倒閉的小微企業比比皆是。這種情況更加劇了資金機構「惜貸」行為,對小微企業貸款的負面預期導致小微企業貸款收縮,小微企業、小型金融機構兩方陷入惡性循環。小微企業和小型資金機構處於整個信貸體系的最底層。
小微企業信貸的困局看似很復雜,牽扯宏觀、微觀各方的行為,但實際我們看所有小微信貸的難點,全部集中於一點:資金方認為無法看清小微企業的風險,自然不能放款,這稱之為「信息不對稱風險」;既然無法識別風險,資金方制定了迴避小微借款的貸款政策,形成了「逆向選擇」,小微信貸就此止步,陷入無錢可貸的困境。無論是大型銀行,還是小型資金機構,都面臨同樣的問題,所以都對小微信貸無計可施。這個問題可以籠統地稱為社會誠信體系欠缺導致信用風險高。
信用體系欠缺導致資金方難以看清小企業實際情況,這有著現實的原因。我國的小微企業內部管理是很隨意的,很多交易不會以規范的方式記錄下來。正規的資金方需要經過嚴密的盡職調查第一還款來源(依靠經營償還借款),輔之以第二還款來源(抵押品),才能做出決策。這個過程可以稱之為「徵信」或者「信用審核」。前面我們已經分析過,由於資金方缺乏有效的可利用於小微企業的信用調查、審核手段,對於小微貸款項目,這個過程不但冗長成本很高,而且通常難以找到准確、真實、有價值的信息,阻礙了小企業信貸的成功率性。同樣,對於那些私募資金機構、民間資金機構,本來沒有能力進行相關調查,放貸只能靠感覺和其他手段,風險更大。
由此,我們可以得出結論:小微企業貸款的瓶頸是「缺乏高效率、低成本、高精度基礎徵信服務」。可以想像,如果資金方有能力以一種低成本的方式准確識別小企業是否可信,再加以輔助風控措施(擔保、抵押等),小微業務將變得有利可圖,資金通道可以就此而打開,小微信貸就會變得順暢而有序。大數據徵信正是在這種社會背景下應運而生的。
二、 大數據徵信技術的幾條探索之路
隨著大數據技術在各行業的深入應用,運用大數據為徵信打開一條通路,逐漸成為了社會主流的意識。信用服務從業者、政府信用辦公室、互聯網金融公司對此進行了不懈的探索,期待找到一種可以針對於小微企業的量化深度評判方法。下面我們分析一下當前主要幾種方法的特點。
(一) 量化信用評價(評級)模型(由內而外型)
多年以來,信貸機構、徵信機構和評級機構一直期待著能夠形成一個量化信用模型,將各方面的數據導入模型之後,能夠自動生成評級結果,提示是否可以放貸。經過長期的探索、研究、試驗之後,這個理想的模型一直沒有出爐。我國部分有實力的資金方引進日本、美國知名咨詢公司的信用分析模型,但這些模型對我國的實際情況的適用性很差,沒有達到期待的效果——導入相關數據後即可對企業償還能力和償還意願作出可靠的判斷。
國外的先進模型以及國內機構的多年模型探索,都沒有形成一個普遍性有效的評判小企業的量化模型,主要原因是我國小企業的數據質量低下。由於無論國內外使用的企業數據主要是財務報表數據,而財務數據是會計師事務所出具的。我國誠信體系存在巨大缺失,會計師事務所出具的審計報告幾乎是製造出來的,其可信度很低。對於誠信企業,這份報告具有較大的參考性,而對於蓄意騙貸企業,也未必能夠從審計報告中看出破綻。各種量化模型的探索之所以沒有得到令人滿意的結果,正是由於其所依據的數據質量是低下的,所以無論如何也不可能得出真正有價值的信息。這種方法基本上宣告了是無效的。
(二) 外部資料庫接入(由外向內)模式
在企業內部數據質量不佳的條件下,各類機構開始向外尋找廣度更大、更加可靠的數據來源,例如政府各部門的數據,稅務系統數據、工商信息、行業主管單位業務數據、海關數據等,各行業協會的經營性數據等,也有在電商平台上積累的交易數據(如淘寶上的交易數據)。基於這些數據查找與某企業相關的數據並進行綜合分析。我們稱之為「由外向內型」的數據體系,也就是企業徵信服務不再是從被評價的企業提取數據,而是運用外部數據體系實現。
這種模式的優勢在於:資料庫系統形成之後,單個企業的徵信信息採集將非常容易,徵信服務的邊際成本極低,且速度極快,直接帶來的好處是徵信服務的收費將非常低廉,並且服務量很大。但這種模式也存在自身的劣勢:對接多部門數據入口是一項巨大的系統工程,建設、磨合的成本很高,當前除了工商信息可以達到全國聯網外,其他部門信息均在分布在市級部門,整合工作相當巨大。另外,也是最嚴重的問題還是數據質量。我國的小企業對外報送的經營信息具有很大的隨意性,都是根據具體需要編出來的,例如為了避稅、貸款或者其他目的。有些地區政府為了鼓勵當地企業發展,給予很高的納稅優惠,比如核定一個固定納稅額度,這樣的話就不會要求企業如實報送。因此,從各部門搜集到的數據恐怕與實際情況相差較遠,如果用做徵信服務,可信性也會遭到質疑。同時,一個企業產生的數據並非全部對外報送,事實上,對外報送的數據僅佔一小部分,如基礎財務報表、應納稅額等,而大部分的能夠說明企業情況的數據沉澱在企業內部,如供銷信息、產品品類、資金流轉等,這些數據無法通過外部資料庫找到。外部資料庫的數據量雖大,但針對於某單一企業,卻顯得容量不足了。如果是電商內部生態圈數據也相對片面,因為一個企業不會僅僅通過一個電商渠道銷售,單一電商交易數據顯然是不夠全面的。
如果用外部數據編織數據網的話,這張網將是巨大的,幾乎可以覆蓋全國的企業。但由於關於某一企業的數據量不足,這張網的數據線條比較稀疏,也就是數據網眼很大,多數關於企業的有價值信息都被漏掉了,有效信息過小,不足得出可信的結論。這就是由外向內建立徵信數據體系的探索。
自國務院交辦發改委建立全國信用體系以來,各級政府信用辦公室主導將轄區內各個掌握數據的政府部門連接起來,形成一個統一的信用信息平台,由專業的第三方公司或者設立下屬公司運營,出具滿足社會需求的徵信報告。除政府外,也有社會徵信機構做類似的事情,接入一些政府端數據並運營。從目前的發展來看,這類徵信服務當前能夠提供的最主要的信息是工商注冊類的信息,以及少量的各部門備案信息。這類徵信服務提供的信息簡單,收費低廉,但對於信貸業務而言,基本上沒有發揮太大的作用。
(三) 單體企業數據徵信服務(由內向外)
另外一種數據徵信服務,是從企業內部挖掘有用信息,從這個角度來說,這種方法和傳統的徵信方法是一致的,不同的是採集的信息和分析模式。現在有些專業徵信公司也在研發由內而外的數據徵信方法。這種方法利用的數據量不像社會徵信的數據量那麼大(因此稱「小數據」),但與貸款相關度很高,再保證真實度的基礎上,可以得到很多有價值的信息(「大信息」),並且均為信貸業務中資金方最關注的信息。該項服務可以幫助資金方在最短的時間內評判該企業是否能達到可以貸款的條件,為資金方節約大量的調研時間和成本,適應小微企業融資的效率要求和風控要求。
數據徵信雖然應用的基礎數據量不像政府部門數據那樣多,那樣大,但採集到的都是相關度最高的信息,可以捕捉企業真實經營情況和償還能力。如果從數據網的角度看,這種方法形成的數據網較小(只適用於某單個企業),但數據「網眼」恰好適合保留住關於該企業的大量有價值信息,而篩查掉無關信息、干擾信息,形成深度、高質量的徵信報告,為信貸決策提供可靠依據。
這種數據徵信服務的優勢是,啟動快,無需長期建設成本,很好地適應我國現有的信息基礎和社會現實。其難點在於如何取得借款企業的充分信任因此願意提供深度數據。
企業數據徵信技術已非一個技術上的構想,而是已經開始了大量的實踐。數據徵信已經在擔保業務、小貸業務中發揮了重要作用,幫助擔保公司和小貸公司排查風險、清晰評估項目、提高業務效率。相信隨著市場環境的變化,將有越來越多的人意識到這種技術的價值。
⑷ 《大數據》讀後感字
《大數據》讀後感2000字
如今,我們正處於一個大數據時代,有時候數據給了我們有力的證明。以下是、《大數據》讀後感2000字,歡迎閱覽!
這兩年,大數據,雲計算的思想就像小蘋果的音樂一樣,傳的到處都是,每一個公司不管是互聯網公司還是傳統企業,都標榜自己的大數據。
1、實體物聯網與虛擬物聯網
曾幾何時,物聯網的概念鬧得風生水起,龐大的物聯網能夠讓世間大量的物體,都能夠被檢測 並聯網,包括了人、車、房等一切能夠被聯網的物體,這些物體都能夠以種方式被感知他的存在,並對其信息記錄在案,以供使用。在若干年前,這還是一種看似遙不可及的事物,要對每個物體都貼上一個所謂的RFID的標簽,顯得不切實際。如今,隨著手機的大量使用,人類本身也被加入了物聯網中。為什麼要物聯網?是為了獲取什麼?要知道物聯網獲取了什麼,只需要看看在一個物體在沒有加入物聯網與加入物聯網之後,我們多出了哪些東西便能夠知曉。那麼,很明顯,我們需要通過某種方式來獲取該物體的信息,這種存儲下來的信息,就叫做——數據。
物聯網產生的數據是實體的物品之間的信息,而現在的互聯網上,占最大數據量的,是虛擬物品,或者叫做網路虛擬物品。由於網路物體是直接寄生於網路,具有能夠方便的接入網路的特徵,因此,在獲取實體物體信息還有一定難度的時期,佔有很大優勢。但今後實體的物聯網產生的數據量一定會不斷增加,或許,能夠超越網路上的物物相連數據量。
網路的廣泛使用,使得信息的產生於傳遍變得容易,每個接入網路的人都以一定的角色存在,都是網路的信息的創造者。對於所產生的信息而言,每個接入網路的人又身兼多角,對於網路服務商,他是網路使用者的角色;對於門戶網站而言,他是使用的用戶;對於社交網站而言,我們則扮演一個虛擬或者真實的網路角色;對於瀏覽器而言,他是一系列的瀏覽網頁、一些列滑鼠動作的角色… 不同的角色取決於對方需要從我們的行為中獲取哪些信息。將網路上各種角色看成是虛擬的物體,那麼,這種虛擬物體構成的虛擬物聯網便產生了巨大的數據量。經歷過一直以來缺乏信息獲取渠道的日子,現在,既然信息獲取變得如此容易,那麼,必然迎來信息量暴增的時代——大數據時代。
2、思維的轉變
技術的改變,使得我們思維方式也要隨之發生變化。在過去的小數據時代,由於獲取信息、存儲信息、整理信息都是費時費力的活,我們只能精打細算,捉摸著如何以最小的代價、最快的方式來收集盡可能准確的信息。之所以會有抽樣統計的方式,是受技術所限,無法獲得全體的樣本,或者就算獲取了也無法在合理的時間內進行處理。由於信息獲取代價大,使得我們不得不在獲取信息前,就把一切都想清楚,才能夠著手處理。這就像在計算機出現的初期,使用紙袋來編碼的時期,一次出錯的代價太大,所以人們不得不在輸入前將代碼驗證過無數遍之後才敢輸入到機器中。而現代計算機讓編碼的效率大大提升,這才使得人們能夠創造出更加強大的軟體。人們不需要在著手編碼前就對代碼過分深思熟慮,因為機器會幫助你解決一些問題。因此,那些擔心由於獲取數據太方便,進行數據處理、分析代價太小而使人們變得懶惰或者做事欠考慮的傢伙,真是杞人憂天。歷史上,技術的進步都會提升人類的生產力,但卻沒有讓人們變得懶惰,因為與此同時,慾望也隨之增長。人類只會變得更偉大。
因此,大數據時代,這個數據更加全面的時代,我們可以涉足一些之前由於缺乏數據而無法涉及的領域,例如——預測。這是一個令人興奮的領域,但其實這個領域早有苗頭,而且大家都是受益者。我們平時使用的輸入法中的智能聯想功能,能夠根據我們之前輸入的文字,來預測我們接下來有可能輸入的文字,以節省我們的輸入時間。這種演算法里,沒有人工智慧,而只有人們大量的輸入習慣的統計,通過大量數據的統計來預測,是一個統計學的方式而非加入了特有的規則或者邏輯。這便引出了在大數據時代,對於信息處理的一種重要方式,基於統計,得出不同個體的相關關系,卻無需了解其因果關系,而我們則受益於相關關系。這種方式,看似有些投機取巧,卻能夠在關鍵時刻令我們處於優勢地位。我們已經習慣了先知道某些事物的因果邏輯,繼而推斷出相應的結果。但世間總會有一些令人無法用合理的邏輯進行解釋的現象,若通過大數據分析,我們能夠跳過邏輯階段直接享用某些一些結果(沃爾瑪的啤酒加尿布案例),豈不樂哉。當然,嚴密的邏輯永遠是值得尊敬的。
3、互聯網的黏性
在經歷過了從廣度上通過新花樣來吸引用戶的時代,由於技術的提高,一個創業者在一個新的領域開辟的東西很容易被其他人所復制。在這個時候,深度很重要。特別是購物網站、微薄、門戶網站這類信息量大的網站,越是了解一個用戶,優勢就越大。所以,在技術已經不是最重要的因素的時代,如何增加用戶的黏性、忠誠度便是首要的。通過用戶之前的信息,來推測用戶的喜好,給用戶推薦相應的信息或物品。當你越了解一個用戶,而別人卻不了解時,這個用戶就越離不開你。微薄中有他的`智能排序功能、新聞門戶中有「今日頭條」應用,各類購物網站有他的推薦演算法(但這個純粹為了增加消費而非增加用戶黏性),都能夠根據用戶之前的瀏覽、偏好來給出相應的推薦。這些的基礎,都是擁有用戶的行為記錄,否則,都無從談起。
各行各業,都在瘋狂的抓緊時機,獲取數據,擁有足量的數據,那一切就變得皆有可能。
凡是過去,皆為序曲是大數據業者最喜歡引用的語句。大數據是現在的潮流,大數據時代被認為是了解大數據的初級讀物。近期連續讀了兩遍,第二遍是為了寫這篇讀後感,總體而言,值得一看,但細節方面卻需要討論了。
維基網路對大數據的解釋:Big data,或稱巨量數據、海量數據、大資料,指的是所涉及的數據量規模巨大到無法通過人工,在合理時間內達到截取、管理、處理、並整理成為人類所能解讀的信息。
有人說現在是讀圖時代,除去小說、心靈雞湯以外,現在的暢銷書基本都有圖片,這本書是一個特例
首先嘗試解析一下作者的三大觀點,這三大觀點是大數據業者很喜歡引用的三句話:
1 不是隨機樣本,而是全體數據
我想所有人都能意識到對全體數據的分析優於對隨機樣本的分析,但在現實中我們經常拿不到全體數據:一是數據的收集方法,每一種方法都有適用的范圍,不太可能包羅萬象;二是數據分析的角度,戰斗機只能統計到飛回來的飛機上的彈孔,而墜毀的則無法統計,沃德通過分析飛回來的戰斗機得出來最易導致墜毀的薄弱點;三是處理能力跟不上,就像以前的天氣預報太離譜是因為來不及算那些數據。「采樣分析是信息缺乏時代和信息流通受限制的模擬數據時代的產物」,作者顯然只關注了一部分原因。
從語言的理解上看,什麼是全體數據,究竟是「我們需要的所有數據」,還是「我們能收集到的所有數據」,書中的很多商業案例中,處理的只是「我們能收集到的所有數據」,或者說是「我們認為的全體數據」。人對自然的認識總是有限的,存在主義認為世界沒有終極的目標。書中舉例「Farecast使用了每一條航線整整一年的價格數據來進行預測」,而「整整一年」就是一個采樣,或者是「我們需要的所有數據」。
從歷史的角度看,國外的托勒密建亞歷山大圖書館唯一的目的是「收集全世界的書」,實現「世界知識總匯」的夢想,國內的乾隆匯編四庫全書,每個收集的過程都有主觀因素在裡面,而他們當時都認為可以收集全部的書籍,到最後,我們也沒有得到那個夢中的全體。
2 不是精確性,而是混雜性
既然我們過去總是在抽樣,那本身就是在一個置信水平下,有明確的容錯度或者是偏差值。人類永遠知道我們是在精確性受限的條件下工作。同時,作者本身也承認 「錯誤並不是大數據固有的特性,而是一個亟需我們去處理的現實問題,並且有可能長期存在」。那大數據的特徵究竟是精確性還是混雜性?
由此衍生出一個問題,大數據的品質如何控制:一、本身就不要求精確,但是不精確到何種程度是需要定義的,否則就亂套了,換個角度,如果定義了容錯度,那符合條件的都是精確的(或者說我這句話還是停留在小數據時代?這里的邏輯我沒有理順)。就像品質管理大師克勞斯比提出過零缺陷理論,我一直覺得是一個偽命題,缺陷是一定存在的,就看如何界定了;二、大量非結構化數據的處理,譬如說對新聞的量化、情感的分析,目前對非SQL的應用還有巨大的進步空間。
「一個東西要出故障,不會是瞬間的,而是慢慢地出問題的」。「通過找出一個關聯物並監控它,我們就能預測未來」。這句話當然是很認同,但不意味著我們可以放棄精確性,只是說我們需要重新定義精確度。之於項目管理行業,如果一個項目出了嚴重的問題,我們相信,肯定是很多因素和過程環節中出了問題,我們也失去了很多次挽救的機會。而我們一味的容忍混雜性的話,結果顯然是不能接受的。
3 不是因果關系,而是相關關系
這是本書對大數據理論的最大的貢獻,也是最受爭議的地方。連譯者都有點看不下去了。
相關關系我實在是太熟了,打小就學的算命就是典型的「不是因果關系,而是相關關系」。算命其實是對趨向性的總結,在給定條件下,告訴你需要遠離什麼,接近什麼,但不會告訴你為什麼那樣做。
我們很多時候都在說科學,然而,什麼是科學,沒有人能講清楚。我對科學的認識是:一、有一個明確的范圍;二、在這個范圍內樹立一個強制正確的公理;三、有明確的推演過程;四 可以復制。科學的霸道體現在把一切不符合這四個條件的事物都斥為偽科學、封建迷信,而把自己的錯誤都用不符合前兩條來否決。從這個定義來看,大數據不符合科學。
混沌學理論中的蝴蝶效應主要關注相關關系。它是指對初始條件敏感性的一種依賴現象,輸入端微小的差別會迅速放大到輸出端,但能輸出什麼,誰也不知道。
人類一旦放棄了對因果關系的追求,也就放棄了自身最優秀的品質:意志力。很多人不願意相信算命是擔心一旦知道了命運,就無法再去奮斗。即使我相信算命,也在探求相關關系中的因果要素。我放棄第一份工作的原因之一是厭倦了如此確定的明天:一個任務發出去,大概能預測到哪些環節會出問題,只要不去 follow,這些環節十有八九會出問題。
解析完這三大觀點,下面是我對大數據理論的一些疑惑。大數據是目前風行的反饋經濟中的重要一環,在金融、互聯網行業的應用最為廣泛,而這些行業都是大家所認為的高薪領域。很多時候我就在想,所謂無形的手所產生的趨勢究竟是不是無形的。比如幾家公司強推一個概念,說這是趨勢,不久就真的變成趨勢了。我們身邊活生生的例子就是天貓的雙十一和京東的618,一個巨頭開路,無數人跟風,自然就生造出購物節,至於合理不合理,追究的意義也不大,因為很多事情是沒有可比性的。這和沒有強制控制中心的蜂群思維又不一樣。
看完這本書,總是覺得作者說的過於絕對,也許是我的認識太淺了吧,所以最後用法演四戒做總結:
勢不可以使盡,使盡則禍必至
福不可以受盡,受盡則緣必孤
話不可以說盡,說盡則人必易
規矩不可行盡,行盡則事必繁
⑸ 《大數據時代》讀後感
導語:讀完《大數據》,我才意識到這並不是一本枯燥無味的書籍。作者運用案例和講故事的方式,把美國數據開放、收集、使用背後的立法故事、公民故事、技術故事、商業故事娓娓道來,引人入勝,令我大開眼界。以下是我為大家精心整理的《大數據時代》讀後感,歡迎大家參考!
對於暢銷書刊、熱點話題、時尚科技,始終不太感興趣。書刊,喜歡有一定年份的;話題,鍾情於務虛的觀點;新奇的產品於我無緣,習慣使用成熟的科技產品。既不清高,也非冷漠,就是要與現實保持一定的距離,給自己留一點思考的空間。這一習慣最近破了例。由於工作的原因,耳濡目染,「大數據」這個新興概念開始頻繁步入我的視野。按捺不住內心的好奇,網購《大數據時代》,手不釋卷,三天讀完,頗有收獲。此書有如下特點。
首先,作者站在理論的制高點上,條理清楚地闡述了大數據對人類的工作、生活、思維帶來的革新,大數據時代的三種典型的商業模式,以及大數據時代對於個人隱私保護、公共安全提出的挑戰。其次,文中的事例貼近現實生活,貼近時代,令讀者既印象深刻,又感同身受。此外,作者沒有使用大量的專業術語,沒有假裝一副專業的面孔。縱觀全書,遣詞造句,均通俗易懂。
作者認為大數據時代具有三個顯著特點。一、人們研究與分析某個現象時,將使用全部數據而非抽樣數據;二、在大數據時代,不能一味地追求數據的精確性,而要適應數據的多樣性、豐富性、甚至要接受錯誤的數據。三、了解數據之間的相關性,勝於對因果關系的探索。「是什麼」比「為什麼」重要。
作者指出,隨著技術的發展,數據的存儲與處理成本顯著降低,人們現在有能力從支離破碎的、看似毫不相乾的數據礦渣中抽煉出真知爍見。在大數據時代,三類公司將成為時代的寵兒。一是擁有大數據的公司與組織。如政府、銀行、電信公司、全球性互聯網公司(阿里巴巴、淘寶網)。二是擁有數據分析與處理技術的專業公司,如亞馬遜、谷歌。三是擁有創新思維的公司,他們可能既不掌握大數據,也沒有專業技術,但卻擅長使用大數據,從大數據中找到自己的理想天地。
面對即將來臨的大數據時代,個人將如何應對自如?這是個嚴肅的問題。
「除了上帝,任何人都必須用數據來說話。」——這是《大數據》中出現的讓人印象深刻的一句話,也是全書力圖傳遞的信息。在數字信息時代,數據和空氣一樣遍布生活,對於有些人來說,數據無意義,而對於有些人來說,數據,即真相。
美國是《大數據》的主角,全書通過講述美國半個多世紀信息開放、技術創新的歷史,以別開生面的經典案例——奧巴ma建設「前所未有的開放政府」的雄心、公共財政透明的曲折、《數據質量法》背後的隱情、全民醫改法案的波瀾、統一身份證的百年糾結、街頭警察的創新傳奇、美國礦難的悲情歷史、商務智能的前世今生、數據開放運動的全球興起,以及雲計算、Facebook和推特等社交媒體、Web3·0與下一代互聯網的未來圖景等等,為讀者一一細解數據創新給公民、政府、社會帶來的種種挑戰和變革。
透過全書,一個立體的美國及美國人民的思想呈現在我們面前——美國人民執著於個人隱私的保護,卻又不遺餘力地推動著政府信息的透明與公開。
讀完此書,對生活中的數據及數據處理突然有了很大的興趣。如果有一天,處處以數據說話,那麼,政治、制度、生活將更加清明,事故將降到最低點。
作為信息技術教師,是有必要閱讀此書的!有慧根的教師將能從書中挖掘出信息技術特有的文化以及能用於教學的鮮活案例。
每天能用來閱讀的時間很少,總是要等到夜深疲倦時才有空打開書本,總是在眼睛極不舒服的情況下堅持閱讀,《大數據》就這樣在堅持中溶入我的思想……
讀完《大數據》,我才意識到這並不是一本枯燥無味的書籍。作者運用案例和講故事的方式,把美國數據開放、收集、使用背後的立法故事、公民故事、技術故事、商業故事娓娓道來,引人入勝,令我大開眼界。
我在想,大數據概念對於教育來說會產生什麼樣的實用價值呢?一直以來,中國教育在研究教育的數字化,比如數字化校園,這個思路就是把我們教育的內容進行數字化,其結果指向的就是電子教材的研發或者是教學過程的數字化。美其名曰,這是教育技術的重要內涵。在教學過程中,學生的行為表現都可以被數據化,而這項研究不是任何一個專業可以深入下去的,它的專業性太強,所以我才會想到,所謂教育技術與其研究教育的數字化,不如研究教育的數據化來得實在,來的有意義。長期以來,我們並不了解教育對一個人的影響具體會如何表現,我們有的只是一個輪廓,我們也並不確定一個教師的行為對學生具體產生了哪些影響。所以,人們對教育一直有一個深深的質疑,它是不是科學的?大數據概念至少提出了關注「是什麼」比「為什麼」要有實際意義得多。而我們的教育恰好需要把注意力從「為什麼」轉移到「是什麼」上面來,只有如此,才能把教育從為什麼發展成「可能成為什麼」上來,這會是一次思想上的革命。而對於現在地位岌岌可危的教育技術來說,把研究的重點從數字化轉移到數據化上面,這才是它的出路。
如何將數據融入教學,教育者首先通過標准化全科教學處方,實現了教師授課模板和教學內容的標准化,保證每個教學過程和內容是可控的,然後結合每天的教學內容,處理好面對的數據,處理好數據,自然也就處理好了課堂的反饋,最終形成了既注重教學體驗又以教學結果為導向的教學體系。
與此同時,不僅要注重課上的學生資源,在課後還要對這些資源進行跟蹤處理。這與過去的教育教學顯然是不同的,面對大數據時代的`到來,教學有所改變是必然的。所以,無論環境怎麼變換,數據如何復雜,我們都不能不去改變自己的教學去迎合將來的這個大數據時代。
3月11日下午兩節課後,我校全體教師和受邀而來的金南學區各友好學校的領導及教師匯聚於多媒體教室,共同分享、交流《大數據》讀後感。
老師們從:何謂大數據;立足國情對大數據進行探討;大數據在教育教學中的主要應用等幾個方面暢談了自己的感悟。
張萌老師說:大數據體量龐大、結構復雜、是產生巨大價值的數據集合。大數據這種方法在中國的國情下需要以更加科學、合適的方式進行實踐,不可生搬硬套。
董譯雯老師說:在你我感嘆《大數據》里深植於美國民眾血液中的自由、民主、嚴謹的價值觀的同時,可否想過中國教育體制下的孩子們身上還殘留多少獨立與自我意識?作為典型的八零後,我們這一代人身上最缺失的便是獨立思考能力。但願,我的學生哪怕是因為我所做的一點點努力而開始思考「我」這個字的含義,足矣!
張紅傑老師說:很感謝校長給我們推薦了《大數據》這本書。在教學工作中,應該有大數據意識,創新意識。學習一些專業的教學統計法、數據分析法,從中發現一些教育現象,並採取相應的策略。讓我們的教育教學工作少一些隨意和盲目,多一份嚴謹與科學。
白媛媛老師通過文中的三個事例,結合教學實際,談了自己教學中對數據使用的價值;結合自己的工作,談了如何實現工作的最高境界。
交流活動尾聲,身為閱讀《大數據》的倡議者、發起者、以及忠實的讀者韓校長幽默風趣的同大家分享了他讀後的感悟:我們心中要裝著學校,因為我們個人的命運依賴群體的命運;工作要追求精細化,不能做胡適書中的「差不多」先生;尊重數據,擁有數據意識,建立數據團隊!
此次活動從寒假期間倡導讀《大數據》一書,到開學伊始的分組沙龍,再到今日的閱讀共享,現已圓滿告一段落。相信此次活動定會增強我校全體教師的數據意識,掌握大數據,運用大智慧助推我校的教育教學上一個新的台階!
⑹ 《大數據》讀書筆記
《大數據》(徐子沛)
核心觀點: 一個真正的信息社會,首先是一個公民社會。
徐子沛和吳軍是國內科技界文筆最好的兩位大拿,能把復雜的技術發展講得像故事一樣引人入勝。書中講述了美國信息開放、數據技術創新、數據逐步開放的歷史,例舉了美國政府如何通過大數據來治國:降低犯罪率、糾正福利濫用、增加財務透明度,並展望了大數據發展的未來,他覺得中國和美國最大的區別就在中國習慣於說「差不多」,不善於用數字管理國家。書中也介紹了大數據中數據倉庫、數據挖掘、數據分析、數據可視化等技術的發展,他認為: 數據就是企業的財富和金礦,數據分析和挖掘的能力就是企業的核心競爭力。 阿里網羅了徐子沛和王堅兩個大數據和雲計算專家,估計在大數據和雲計算領域鮮有敵手了。
核心觀點: 推崇知識和理性,用數據創新
本書講述互聯網對傳統工業 生活的推進,大量數據沒有數字化,數據基本都困在一家醫院內,電子病歷推進也很緩慢,通過數據的流通讓患者享受更便捷、更安全的服務基本只限制在思考層,這裡面有方方面面的各種利益、法規的原因,這就像書中說的「也許是由於其本身的根深蒂固。作者認為 iPhone、雲計算、3D列印、基因測序、無線感測器、超級計算機,這些改變了我們生活的事物,將再一次地融合在一起,對醫學進行一次「創造性破壞」 ,我覺得新技術的應用比新規則的創立在國內還是相對簡單,而也能解決醫療資源不足的痛點,把像IBM沃森這樣的智能作為醫療的輔助判斷,提升醫療的效率和准確率還是前景明朗的。但要說像書中說的「舊的體系完全不復存在,新的體系隨之取代...在這超級融合之下,權力再次交回到我們自己手中,而只有我們自己,。我想這還有很遠的路要走,與生命有關的事物,一定是慎之又慎的;與體系有關的事情,改變一定是難上加難的。
所以 崇正說他們阿里都是看數據做事情,不是臆想做事情。因為在這個高速發展的時代,數據都是流動。他們都是落實到行動,分析數據,應用數據,依靠數據。
⑺ 《徵信大數據理論與實踐》epub下載在線閱讀,求百度網盤雲資源
《徵信大數據》(姚前)電子書網盤下載免費在線閱讀
資源鏈接:
鏈接:https://pan..com/s/1W1uD4xJsQdInfBAAxCtZvQ
書名:徵信大數據
作者:姚前
出版社:中國金融出版社
出版年份:2018-3-30
頁數:190
內容簡介:
徵信(Credit reporting或者是Credit reference)是指依法收集、整理、保存、加工自然人、法人及其他組織的信用信息,並對外提供信用報告、信用評估、信用信息咨詢等服務,幫助客戶判斷、控制信用風險,進行信用管理的活動。徵信的主要目的是解決交易雙方信息不對稱的問題,進行信用風險管理。本書共分為十七篇,包含:大數據簡介,徵信大數據的應用,基於徵信數據觀中國近十年產業間信貸資源的調整路徑,基於大數據的中國房企信貸分析,基於大數據的個人房貸分析, 基於徵信大數據的住宿餐飲業信貸結構分析, 基於徵信大數據的水利、環境和公共設施管理業分析等等。
⑻ 《大數據時代》的讀後感
認真品味一部名著後,你有什麼領悟呢?現在就讓我們寫一篇走心的讀後感吧。那麼如何寫讀後感才能更有感染力呢?以下是我幫大家整理的《大數據時代》優秀讀後感範文,希望能夠幫助到大家。
這書讀起來不費勁,沒有太多晦澀的理論,所以也比較快速的用了幾天的中午休息時間讀完了。
網上到處都是推薦此書的文章,贊為大數據的經典之作。可是,我讀了一遍下來,卻沒有這種經典之感,只是必須嘆服作者思維嚴密、涉獵廣泛,書中有關大數據的例子真是不少,會給我們的閱讀帶來一定的舒適感和現實感。
已經看過太多網上的關於大數據的文章、案例分析,但是我認為大數據僅僅是一種手段,是我們分析認識世界的諸多手段中的一種。我們既不要拒絕排斥大數據的應用,但也沒必要神話大數據。
在讀此書過程中,稍帶也看了幾部關乎大數據分析的影片,有本書中提到的《少數派報告》,還有《永無止境》、《源代碼》。少數派報告中,人類藉助先知的超能力獲取對犯罪的預測和提前打擊,但是書中和影片中都提到的有一個悖論的問題:如果你預測某犯罪要發生,所以去提前抓捕,阻止了案件的發生,但案件沒有發生,又以什麼為依據來抓捕嫌疑人呢?!所以,我認為大數據的應用在預測方面的作用,不應該涉及任何行政司法等嚴肅方向。因為,人是善變的,也許在預測之後的時間里,由於其它因素影響,t她的決定就突然改變,預測就徹底無效了。大數據,更應該在提供思路、途徑方向,在我們還沒有發現其原理之前,先依照大數據的分析去做些突破常規、有創造性的事情。
從古至今,對數據的統計應用一直沒有中斷過,我們人類在發揮聰明才智的過程中,創造了文字記錄歷史,通過積累和總結為人類的文明發展做出了極大的貢獻。只不過,現在我們利用計算機系統對日益暴漲的數據信息能夠處理的數據量更大、想法更多了。在這個角度上,大數據其實不過是人類信息化發展歷史中的一個必然過程。
大數據爆發的背景,是計算機普及應用、工作和生活信息化、網路尤其是互聯網的發達等因素,為之提供了能夠使用的超大規模數據化信息。就如計算機與人下棋的程序一樣,掌握了足夠的棋局數據、能夠推算每一步之後的可能,快速的運算能力是實現這些的基礎。
大數據本身是無意識的,或者叫無目的,是因為使用的人的發現或主觀意識,才從中抓取到符合所想或支持所想的一些數據和比例。人才是核心。別以為有個所謂的大數據中心就能夠揮斥方遒、指點江山了。這也是我說要對大數據去神化的一點。書中所舉例子,成功的案例其實都基本是一個打破常規、奇思異想的人或一個具備創新思維的團隊,而這個人或團隊一旦陷入對現有模式的僵化應用或崇拜,失敗的結果也是必然。我想說的是,無論是大數據還是快數據什麼的玩意,都僅僅是我們了解世界了解社會的一個角度一種手段,都始終無法擺脫依賴於人的思考這個根本。別一葉障目不見泰山的意味有了大數據就擁有了整個世界,你的心有多大,舞台才有多大。只有當你的思考抵達,那些個曾經沒有價值的數據垃圾,才會煥發出價值!不要荒廢了你的思考這個核心!
作者說大數據只講結果不講原因。這個狀態我認為僅僅是一個過渡時期的表現,如果要實現對大數據分析應用的更加精準、甚至可以作為某種依據,必然要獲得對大數據分析的果的可靠解釋,也從而能對我們現有的行為、制度等獲得新的認識,來進行可行的改變、升級或者重造,大數據的指導意義才發揮更深。
人們都說,中外著述的差距有時是很大的,中國的作家習慣鋪墊和描繪,將簡單的事情復雜化;國外的就相反,喜歡直搗要害,將復雜的事情抽象簡單化。不知道是不是我不很適應國外這類書籍的緣故,對大數據時代一書,我沒有感受到很多的震撼和腦洞大開感,也許和現在各類大數據的文章太多有關,已經把此書的觀點各自領用發揮了一番,也許是我還沒有領會到精華所在。既然人們都奉為經典,那我想或許我應該隔一段時間、換個姿勢,再重讀此書,看看是不是會有新的感受吧。
對於暢銷書刊、熱點話題、時尚科技,始終不太感興趣。書刊,喜歡有一定年份的。話題,鍾情於務虛的觀點。新奇的產品於我無緣,習慣使用成熟的科技產品。既不清高,也非冷漠,就是要與現實保持一定的距離,給自己留一點思考的空間。這一習慣最近破了例。由於工作的原因,耳濡目染,「大數據」這個新興概念開始頻繁步入我的視野。按捺不住內心的好奇,網購《大數據時代》,手不釋卷,三天讀完,頗有收獲。此書有如下特點。
首先,作者站在理論的制高點上,條理清楚地闡述了大數據對人類的工作、生活、思維帶來的革新,大數據時代的三種典型的商業模式,以及大數據時代對於個人隱私保護、公共安全提出的挑戰。其次,文中的事例貼近現實生活,貼近時代,令讀者既印象深刻,又感同身受。此外,作者沒有使用大量的專業術語,沒有假裝一副專業的面孔。縱觀全書,遣詞造句,均通俗易懂。
作者認為大數據時代具有三個顯著特點。
一、人們研究與分析某個現象時,將使用全部數據而非抽樣數據。
二、在大數據時代,不能一味地追求數據的精確性,而要適應數據的多樣性、豐富性、甚至要接受錯誤的數據。
三、了解數據之間的相關性,勝於對因果關系的探索。「是什麼」比「為什麼」重要。
作者指出,隨著技術的發展,數據的存儲與處理成本顯著降低,人們現在有能力從支離破碎的、看似毫不相乾的數據礦渣中抽煉出真知爍見。在大數據時代,三類公司將成為時代的寵兒。一是擁有大數據的公司與組織。如政府、銀行、電信公司、全球性互聯網公司(阿里巴巴、淘寶網)。二是擁有數據分析與處理技術的專業公司,如亞馬遜、谷歌。
三是擁有創新思維的公司,他們可能既不掌握大數據,也沒有專業技術,但卻擅長使用大數據,從大數據中找到自己的理想天地。面對即將來臨的大數據時代,個人將如何應對自如?這是個嚴肅的問題。
如今說起新媒體和互聯網,必提大數據,似乎不這樣說就OUT了。而且人雲亦雲的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾舍恩伯格何許人也?他現任牛津大學網路學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。他的咨詢客戶包括微軟、惠普和IBM等全球企業,他是歐盟互聯網官方政策背後真正的制定者和參與者,他還先後擔任多國政府高層的智囊。這位被譽為:大數據時代的預言家「的牛津教授真牛!那麼,這位大師說的都是金科玉律嗎?並不一定,讀大師的作品一定要做些功課才好讀懂,才能能與之進行一場思想上的對話。
舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分」大數據時代的思維變革「中,舍恩伯格旗幟鮮明的亮出他的三個觀點:
一、更多:不是隨機樣本,而是全體數據。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。對於第一個觀點,我不敢苟同。一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對於簡單事實進行判斷的數據分析難道也要採集全體數據嗎?
我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,並不一定需要全部數據。聯繫到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限於目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。」大數據的簡單演算法比小數據的復雜演算法更有效。「更具有宏觀視野和東方哲學思維。對於舍恩伯格的第三個觀點,我也不能完全贊同。」不是因果關系,而是相關關系。「不需要知道」為什麼「,只需要知道」是什麼「。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因後果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
世間萬物的復雜性多樣化並非非此即彼那麼簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什麼語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出」不是因果關系,而是相關關系。「這一論斷時,他在書中還說道:」在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足於僅僅知道『是什麼』時,我們就會繼續向更深層次研究的因果關系,找出背後的『為什麼』。「[i]由此可見,他說的全體數據和相關關系都在特定語境下的,是在數據挖掘中的選項。
大數據研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數據時代的商業變革。舍恩伯格認為數據化就是一切皆可」量化「,大數據的定量分析有力地回答」是什麼「這一問題,但仍然無法完全回答」為什麼「。因此,我認為並不能排除定性分析和質化研究。數據創新可以創造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置於數據應用的商業系統中,而沒有把它置於整個社會系統里,但他在第二部分大數據時代的管理變革中討論了這個問題。
在風險社會中信息安全問題日趨凸顯。如何擺脫大數據的困境?舍恩伯格在最後一節」掌控「中試圖回答,但基本上屬於老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:」大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考的答案,幫助是暫時的,而更好的方法和答案還在不久的未來。「謝謝舍恩伯格!讓大數據討論從自然科學回到人文社科。由此推斷,《大數據時代》不是最終答案,也不是標准答案,只是參考的答案。此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什麼叫數據?什麼叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什麼不同?讀前做些功課讀起來就比較好懂了。
讀完《大數據時代》這本書後,我意識到:我們即將或正在迎接由書面到電子的跳躍之後的又一重大變革。
這本書介紹了大數據時代來臨後,接踵而至的三項變革——商業變革、管理變革和思維變革。
其實,這場變革已經打響。商業領域由於大數據時代的到來而推陳出新。前幾年,一家名為Farecast的公司,讓預訂到更優惠的機票價格不再是夢想。公司利用航班售票的數據來預測未來機票價格的走勢。現在,使用這種工具的乘客,平均每張機票可以省大約50美元,這就是大數據給人們帶來的便利。
大家應該都知道2009年出現的H1N1型流感,就拿美國為例,疾控中心每周只進行一次數據統計,而病人一般都是難以忍受病痛的折磨才會去醫院就診,因此也導致了信息的滯後。然而,對於飛速傳播的疾病,Google公司卻能及時地作出判斷,確定流感爆發的地點,這便是基於龐大的.數據資源,可見大數據時代對公共衛生也產生了重大的影響!在我看來,如果想在在大數據時代里暢游,不僅要學會分析,而且還要能夠大膽地決斷。
在美國,每到七、八月份時,正是台風肆虐之時,防澇用品也擺上了商品貨架。沃爾瑪公司注意到,每到這時,一種蛋撻的銷售量較其他月份明顯增加。於是,商家作了大膽的推測,出現這樣的結果源於兩種物品的相關性,便將這種蛋撻擺在了防澇用品的旁邊。這樣的舉措大大增加了利潤,這就是屬於世界頭號零售商的大數據頭腦!大數據時代的到來,可以讓我們的生活更加便利。但是,如果讓大數據主宰一切,也存在一定的風險。
大家應該都知道電子地圖,它可以為人們指引方向。但大家應該還不知道,它會默默地積累人們的行程數據,通過智能分析可以推斷出哪裡是自己的家,哪裡是工作單位。我們的隱私就這樣被不為人知地收集著。大數據時代的到來,讓我們的生活更安全,更方便,但與此同時,我們的隱私不再是隱私,數據的收集變得無所不包、無孔不入。世界已經向大數據時代邁進了一小步,一個嶄新的時代正向我們走來。讓我們用知識武裝大腦,做好准備,迎接新時代的到來!
現在已經進入到了二十一世紀了,當今社會已經擺脫了上個世紀的那種消息滯後的時代了,我們最應該感謝的就是科學的進步為我們帶來了這么多便利。與此同時,科學的進步還為我們帶來了「大數據」這個讓人類減少了很多工作量的東西。
在這個學期的名著導讀課上我們就被要求讀:《大數據時代》這本書。《大數據時代》是國外大數據系統研究的先河之作,本書作者維克托·邁爾·舍恩伯格被譽為「大數據時代的預言家」,他是一個特別厲害的人,他作為一個教師,他曾經在哈佛大學、牛津大學、耶魯大學和新加坡國立大學等多所世界前列名校任教的經歷。他作為一個科學家,早在2010年就在《經濟學人》上發布了長達14頁對大數據應用的前瞻性研究。他是十餘年潛心研究數據科學的技術權威。他是最早洞見大數據時代發展趨勢的數據科學家之一,也是最受人尊敬的權威發言人之一。現任牛津大學網路學院互聯網治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人,哈佛國家電子商務研究中網路監管項目負責人;曾任新加坡國立大學李光耀學院信息與創新策略研究中心主任。並擔任耶魯大學、芝加哥大學、弗吉尼亞大學、聖地亞哥大學、維也納大學的客座教授。
他作為一個研究學者,他的學術成果斐然,有一百多篇論文公開發表在《科學》《自然》等著名學術期刊上,他同時也是哈佛大學出版社、麻省理工出版社、通信政策期刊、美國社會學期刊等多家出版機構的特約評論員。他是備受眾多世界知名企業信賴的信息權威與顧問。他的咨詢客戶包括微軟、惠普和IBM等全球頂級企業;"大數據"在網路上搜索到的解釋是:稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。特點:數量、速度、品種、真實性。而舍恩伯格認為,大數據並不能定義一個確切的概念。他提到"大數據是人們獲得新的認知,創造新的價值的源泉;大數據還是改變市場、組織機構,以及政府和公民關系的方法。"這是一種更具有人文色彩和社會意義的詮釋。
大數據不僅改變了公共衛生領域,整個商業領域都因為大數據而重新洗牌。購買飛機票就是一個很好的例子。就像書中寫到2003年,奧倫·埃齊奧尼准備乘坐從西雅圖到洛杉磯的飛機去參加弟弟的婚禮。他知道飛機票越早預訂越便宜,於是他在這個大喜日子來臨之前的幾個月,就在網上預訂了一張去洛杉磯的機票。在飛機上,埃齊奧尼好奇地問鄰座的乘客花了多少錢購買機票。當得知雖然那個人的機票比他買得更晚,但是票價卻比他便宜得多時,他感到非常氣憤。於是,他又詢問了另外幾個乘客,結果發現大家買的票居然都比他的便宜。
飛機著陸之後,埃齊奧尼下定決心要幫助人們開發一個系統,用來推測當前網頁上的機票價格是否合理。作為一種商品,同一架飛機上每個座位的價格本來不應該有差別。但實際上,價格卻千差萬別,其中緣由只有航空公司自己清楚。
埃齊奧尼表示,他不需要去解開機票價格差異的奧秘。他要做的僅僅是預測當前的機票價格在未來一段時間內會上漲還是下降。這個想法是可行的,但操作起來並不是那麼簡單。這個系統需要分析所有特定航線機票的銷售價格並確定票價與提前購買天數的關系。
在信息時代,信息安全問題的日趨凸顯,數據獨裁與隱私保護之間的矛盾更是立於風口浪尖,成為眾矢之的,舍恩伯格在本書的最後章節曾試圖尋找一種解決方式來擺脫這一種困境,但最終沒能做到,但是他提出"大數據並不是一個充斥著演算法的和機器的冰冷世界,人類的作用仍無法被完全代替。"這里表明人在數據時代同樣的重要,數據是為人類服務的,也就該人類驅使下完成相應的目的。在這樣的大環境下,常引起我更多的思考和擔憂。
大數據時代對於我們同是機遇與挑戰,一些國家已開始步入大數據時代的行列,並在各個領域開始研究和使用。而對於我國龐大的人口,以及較大的領土面積,都可以在大數據時代為我們提供數據的保障,而能否面臨挑戰,在大國之間的新一輪角色角逐間嶄露頭角,我們更需要解決技術等方面的問題,更應在政策上逐步開放各領域的數據,保證數據來源、許可權等問題得到解決,不斷學習先進的計算機技術,縮小與其他國家的差距。
⑼ 大數據時代讀後感1000字
大數據時代讀後感1000字(精選7篇)
當品味完一本著作後,大家心中一定有很多感想,現在就讓我們寫一篇走心的讀後感吧。怎樣寫讀後感才能避免寫成「流水賬」呢?下面是我精心整理的大數據時代讀後感1000字,僅供參考,大家一起來看看吧。
如今說起新媒體和互聯網,必提大數據,似乎不這樣說就OUT了。而且人雲亦雲的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾——舍恩伯格何許人也?他現任牛津大學網路學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。他的咨詢客戶包括微軟、惠普和IBM等全球頂級企業,他是歐盟互聯網官方政策背後真正的制定者和參與者,他還先後擔任多國政府高層的智囊。這位被譽為:大數據時代的預言家「的牛津教授真牛!那麼,這位大師說的都是金科玉律嗎?並不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應的理論功底,就能與之進行一場思想上的對話。
舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分」大數據時代的思維變革「中,舍恩伯格旗幟鮮明的亮出他的三個觀點:一、更多:不是隨機樣本,而是全體數據;二、更雜:不是精確性,而是混雜性;三、更好:不是因果關系,而是相關關系。對於第一個觀點,我不敢苟同。一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對於簡單事實進行判斷的數據分析難道也要採集全體數據嗎?我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,並不一定需要全部數據。聯繫到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限於目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。」大數據的簡單演算法比小數據的復雜演算法更有效。「更具有宏觀視野和東方哲學思維。對於舍恩伯格的第三個觀點,我也不能完全贊同。」不是因果關系,而是相關關系。「不需要知道」為什麼「,只需要知道」是什麼「。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因後果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
世間萬物的復雜性多樣化並非非此即彼那麼簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什麼語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出」不是因果關系,而是相關關系。「這一論斷時,他在書中還說道:」在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足於僅僅知道『是什麼』時,我們就會繼續向更深層次研究的因果關系,找出背後的『為什麼』。「[i]由此可見,他說的全體數據和相關關系都在特定語境下的,是在數據挖掘中的選項。
大數據研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數據時代的商業變革。舍恩伯格認為數據化就是一切皆可」量化「,大數據的定量分析有力地回答」是什麼「這一問題,但仍然無法完全回答」為什麼「。因此,我認為並不能排除定性分析和質化研究。數據創新可以創造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置於數據應用的商業系統中,而沒有把它置於整個社會系統里,但他在第二部分大數據時代的管理變革中討論了這個問題。在風險社會中信息安全問題日趨凸顯,數據獨裁與隱私保護成為一對矛盾。如何擺脫大數據的困境?舍恩伯格在最後一節」掌控「中試圖回答,但基本上屬於老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:」大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。「謝謝舍恩伯格!讓大數據討論從自然科學回到人文社科。由此推斷,《大數據時代》不是最終答案,也不是標准答案,只是參考答案。
此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什麼叫數據?什麼叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什麼不同?讀前做些功課讀起來就比較好懂了。
我們不再熱衷於尋找因果關系,而應該尋找事物之間的相關關系。這個命題是我讀這本書最大的感觸。個人認為也是這本書最核心的思想。從頭說起吧,首先,書提出一個顛覆我以前認知的命題--」並非原子而是信息才是一切的本源「,將世界看做信息,看做可以理解的數據的海洋,為我們提供了一個從未有過的審視下是的視角。它是一種可以滲透到所有生活領域的世界觀。這個命題是在書的最後一部分中的某一段中描寫的。我之所以把它放在最前面來講,因為我覺得,這是談數據化世界的前提,自然也是談論大數據的前提啦。書的中間部分有一節講到數據化和數字化的區別。經過我自己腦子的整理,把數據化世界這個命題列為大數據思維的第二步。寫到這里,我不由得反省下,我是不是有領悟到書的精髓所在(我認為的精髓),就是第一句話。因為回顧我整個思路,還是按照舊模式的因果關系思考模式思考問題。書中另一個吸引我的地方就是,有很多觀點的論述,會從哲學的高度論述。雖然,自己肚子沒多少墨水,但是讀這些描述的時候,就會發現自己會更好的理解作者提出的命題。比如書中有一段文字
當我們說人類是通過因果關系了解世界時,我們指的是我們再理解和解釋世界各種現象時使用的兩種基本方法:一種是通過快速、虛幻的因果關系,還有一種就是通過緩慢、有條不紊的因果關系。大數據會改變這兩種基本方法在我們認識世界時所扮演的角色。
在附上一些事例的時候,用作者提供的」本質「去看待時,很容易理解,確實是這么回事。好了,那麼大數據到底改變了我們什麼呢,作者給出3點,
大數據的精髓在於我們分析信息時的三個轉變,這些轉變講改變我們理解和組建社會的方法。
第一個轉變就是,在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機采樣(樣本=總體)
第二個轉變就是,研究數據如此之多,以至於我們不再熱衷於追求精確度
第三個轉變因前兩個轉變而促成,即我們不再熱衷於尋找因果關系,而應該尋找事物之間的相關關系。大數據告訴我們」是什麼「而不是」為什麼「。在大數據時代,我們不必知道現象背後的原因,我們只要讓數據自己發聲。,出處:短美文,否則追究其責任,謝謝你的支持,我們會給做得更好!
正如大家所知道的那樣,人類的大腦具備這樣的功能,它會把新輸入的刺激或信息與」過去的經驗或積累的部分知識「相對照,然後進行調整並接受下來。如果眼前新的現實與大腦中儲存的固有信息無法協調,便會在無意識中拒絕接受新的現實(當作沒有看見);或者通過自己一知半解的知識任意推測,使自己認識到的情況偏離實際(產生錯覺)。這是人的一種本能,目的在於使自己保持冷靜。
所以作者稱之為revolution。
講了這么多,那麼大數據到底給我們帶來什麼。在這里,我只想談我感觸最深的,其他的有興趣的可以自己去了解。當然,書中提了很多,最多的就是,XXX公司或者個人利用大數據創造了多大的財富了,拋開這些表面的不說,最讓我動心亦或者是害怕的是,預測。這是大數據帶來最核心的東西,動心的理由無須贅述,計算機會告訴你什麼時候買什麼雙色球可以中頭獎,想想心裡是不是有一點小激動咧。當然這只是我打的一個比較誇張的比喻。至於害怕呢,書中有段話我很喜歡
公平正義的基礎是人只有做了某事才需要對它負責,畢竟,想做而未做不是犯罪,社會關系於個人責任的基本信條是,人為其選擇的行為承擔責任。如果大數據分析完全准確,那麼我們的未來會被精準的預測,因此在未來,我們不僅會失去選擇的權利,而且會按照預測去行動。如果精準的預測成為現實的話,我們也就失去了自由意志,失去了自由選擇的權利。既然我們別無選擇,那麼我們也就不需要承擔責任。這不是很諷刺嗎。
扯到這里,順便扯一下,書中另一段關於自由意志的描述
在哲學界,關於因果關系是否存在的爭論已經持續了幾個世紀。畢竟,如果凡事皆有因果的話,那麼我們就沒有決定任何事的自由了。如果說我們做的每一個決定或者每一個想法都是其他事情的結果。而這個結果又是由其他原因導致的。以此循環往復,那麼就不存在人的自由意志這一說了。——所有的生命軌跡都只是受因果關系的控制了。因此,對於因果關系在世間所扮演的角色,哲學家們爭論不休,有時他們認為,這是與自由意志相對立。
書中舉了個例子,舉了部電影《少數派報告》,當我看到這里的時候,」哎喲,我居然看過這部電影,想想心裡還是有點小激動「,有興趣的可以去看下,大概就是講警察通過預測來提前抓捕犯人,不過不是通過大數據,是通過超人類的方式。當你什麼舉動都可以被預測,相當於你完全暴露在太陽光下,換成你,你害怕不。
最後,附上兩段結語,一段是書中的一段話,另一段是我自己瞎編的。
大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。
大數據終將會影響到我們,也像其他技術一樣會是一把雙刃劍,用得好,動心,濫用,害怕。如同核技術一樣,用的話,造福地球,濫用,給個金剛石地球你,照樣爆。我相信,未來的大數據的發展會如作者所說的,是一場生活、工作與思維的革命。
「大數據」一詞不知何時在我們的生活悄然出現,為了一探究竟,我便選擇了《大數據時代》一書。
作者先從全局簡單地描述大數據對我們的生活、工作與思維的影響,再從三方面具體地用上百個學術和商業的實例展開寫作。樣本=總體、追求精確性和相關關系等大數據時代具體特點一一現出。在同時,作者也從個人、企業等多角度分析大數據中的隱憂。
書中內容繁多,在此不能各方面概括。此書中雖有許多專有名詞,但作者以其通俗的語言以及許多實例讓我嗅到大數據時代中一抹清新之氣。
為什麼是清新的呢?因為書中的內容彷彿向我打開了一個既有點熟悉又有點陌生的世界。我們現在已處於網路時代 ,在我們日常簡單的操作中大量數據產生,然而起初我們僅用眾多技術在解決手頭上的問題,那些大數據像沙子中的金子,價值不被發現。到目前,每當我們網上購書時總會看到「猜你喜歡」的欄目、出現谷歌搜索與流感預測、Farecast與飛機票價預測系統等,這些事情的達成全來自於那些曾被忽略的大數據同時也在證明「預測,大數據的核心」這句話,為我們的生活創造了前所未有的可量化的維度。看到書中這部分內容時,我不禁感受到自己的生活已在享大數據帶來的福利,就像「猜你喜歡」欄目讓我觸到更多合我口味的書,讓我看到了以前無法發現的細節。擁有大量數據的公司巨頭如谷歌、亞馬遜大力開發有關大數據的新型產業和研究相關項目。借網路時代的便利大數據成為了如今最有商業價值的事物,使一切可量化的趨勢也開始出現。「本質上世界是由信息構成的」,面對這句話時,大數據時代彷彿就在眼前。
在感受驚嘆著大數據能為我們做到以往無法想像的事和它巨大的價值時,我認同大數據能極大優化我們的生活,但又不禁為這時代感到擔憂。一旦大數據時代來臨,不僅我們的隱私可能不再是隱私,就如書中所言「我們時刻暴露在『第三隻眼』下:亞馬遜監視著我們的購物習慣,谷歌監視著我們的購物習慣,而微博似乎什麼都知道」,而且利用大數據我們可以預測許多事情並且十分高效,一旦人們依賴大數據極少運用人類自身的創新等能力被數據束縛住,世界只會淪落為一個極少活力的機械環境。而我認為最大的憂患,是大數據時代對人類自身思維、思想、信仰等精神領域的沖擊。如今我們都生活在數據中,大數據時代說不定在幾年後就會逐步來臨,這使我不禁發問:我們一直堅信著信仰著的究竟是什麼?我覺得世界說變就變實在令我想不通這個問題。事情都有好壞,我也不知道自己是否杞人憂天。
於是我繼續去探索作者對這問題的思考。「更大的數據在於人本身」,作者還說「我們是在創造更好的未來」,也說「在一個預測的時代里,人類的.自由意志不可侵犯,這一點不可輕視。我們在使用大數據時,應當懷有謙恭之心,銘記人性之本」。人類學家克利福德吉爾茲曾說:「努力在可以應用、可以拓展的地方,應用它、拓展它;在不能應用、不能拓展的地方,就停下來。」這些話語彷彿是陽光,驅散我心中對大數據時代的擔憂以及內心對其的恐懼。我認為,在堅守我們內心和自由意志下,大數據才會造福我們人類世界,發揮出它背後對人溫暖的光芒。
面對時代的變革,我會為堅守內心深處的自由意志而努力並「擁抱大數據」。
世界的本質就是數據,當你掌握了數據,你便掌控了世界—你可以輕而易舉地通過數據中的相關關系預測事物的發展,將一切不利因素扼殺於搖籃之中—這遠勝於"防患於未然"。
《大數據時代》一書,讓我們在觀念上有了三大轉變:要全體不要抽樣,要效率不要絕對精確,要相關不要因果。全書介紹了 "大數據"時代三種大的變革:思維變革,商業變革和管理變革。在這些巨大變革如洪水一般的"沖擊"之下,現代社會的運作方式必將有重大的改變,若不順應這種變革的潮流,就像古中國固步自封,最終被堅船利炮打開國門而自己還用著長鉤鐵戟抗爭一樣,不可避免被掠奪,被落於世界進程之後,所以我們必須轉變我們的思想。
"我們不再熱衷於尋找因果關系,而應該尋找事物間的相關關系",我想這句話是本書的核心思想。大數據時代,信息與數據已成為了一切的本源,我們生活在各種數據構成的海洋之中,如果從另一種視角看,就好像無數條"看不見的線"將我們與這些數據聯繫到一起,這是我們以前從未有過、從未想過的。大數據改變了我們以前的通過因果關系了解世界的方法,而提供了幾種新的途徑,因為,在大數據時代,我們可以分析更多數據,有時甚至可以處理和某個特別現象相關的所有數據,也就是:樣本=總體;而且,當研究數據如此之多時,我們已不熱衷於"精確",而是"混亂",若不接受"混亂",那麼有95%的非結構化數據無法利用,這將無法使我們構建完整的數據世界,在分析更多、更全面的數據之後,我們就可以從這些數據之中發掘它們的相關關系,即以"是什麼"而不是"為什麼"的角度看待數據,不用管其從何而來,只要分析其如何影響其他事物既可,即"讓數據自己發聲",這些,徹底推翻了人類以前探索數據的方法,展現了一個全新的世界。
這種觀念以驚人的力量給現知識狀況帶來了巨大的沖擊,通過對海量數據的分析,獲得巨大價值的產品和服務,或深刻的洞見。比如谷歌公司,2009年h1n1流行之時,通過檢測檢索詞條,處理34。5億個不同的數據模型,通過預測並與2007、2008年的美國疾控中心記錄的實際流感病例進行對比後,確定了45條檢索詞條組合,並將其用於一個特定的數學模型後,預測結果與官方數據相關系數高達97%,這種大數據技術,以前所未有的方式,通過海量數據分析得出流感所傳播的范圍,為預測流感提供了一種更快速、高效的工具。
同時,雖然大數據可為人類造福、對抗病症,但這僅限於掌握這門技術而言,若不重視這種技術,當我們的對手早於我們一步構建這種數據網路之時,便是我們的災難,想想,大數據雖核心的在於預測,當敵人通過這種手段預測我方下一步的行動,將是可怕的—比如你的導彈將從何處發射,將飛往哪,你的軍隊動向、目標,總之所有一切"未來"將掌控於敵手,敵方甚至可以藉此發現那些將來有"大作為"的人,從而進行滲透或扼殺,這對我們的發展無疑是致命的,所以,盡快加速大數據系統的構建進程是必須的。
對於我們國防生,也必須順應這種發展趨勢,未來的時代必將是數據極易獲取,數據網路共享化的時代,通過這些數據,建立數據模型,可以准確分析並給出適合每一個人的計劃,如運動量、訓練強度,可以"先知、先覺",及時發現一個人的負面情緒前及時疏導,這些必將成為現實,我們必須跟進時代,做好准備,去應對大數據時代的一切!
「除了上帝,任何人都必須用數據來說話。」——這是《大數據》中出現的讓人印象深刻的一句話,也是全書力圖傳遞的信息。在數字信息時代,數據和空氣一樣遍布生活,對於有些人來說,數據無意義,而對於有些人來說,數據,即真相。
美國是《大數據》的主角,全書通過講述美國半個多世紀信息開放、技術創新的歷史,公共財政透明的曲折、《數據質量法》背後的隱情、全民醫改法案的波瀾、統一身份證的百年糾結、街頭警察的創新傳奇、美國礦難的悲情歷史、商務智能的前世今生、數據開放運動的全球興起,Web3·0與下一代互聯網的未來圖景等等,為讀者一一細解數據創新給公民、政府、社會帶來的種種挑戰和變革。
透過全書,一個立體的美國及美國人民的思想呈現在我們面前——美國人民執著於個人隱私的保護,卻又不遺餘力地推動著政府信息的透明與公開。
讀完此書,對生活中的數據及數據處理突然有了很大的興趣。如果有一天,處處以數據說話,那麼,政治、制度、生活將更加清明,事故、將降到最低點。
作為信息技術教師,是有必要閱讀此書的!有慧根的教師將能從書中挖掘出信息技術特有的文化以及能用於教學的鮮活案例。
每天能用來閱讀的時間很少,總是要等到夜深疲倦時才有空打開書本,總是在眼睛極不舒服的情況下堅持閱讀,《大數據》就這樣在堅持中溶入我的思想……
讀完《大數據》,我才意識到這並不是一本枯燥無味的書籍。作者運用案例和講故事的方式,把美國數據開放、收集、使用背後的立法故事、公民故事、技術故事、商業故事娓娓道來,引人入勝,令我大開眼界。
我在想,大數據概念對於教育來說會產生什麼樣的實用價值呢?一直以來,中國教育在研究教育的數字化,比如數字化校園,這個思路就是把我們教育的內容進行數字化,其結果指向的就是電子教材的研發或者是教學過程的數字化。美其名曰,這是教育技術的重要內涵。在教學過程中,學生的行為表現都可以被數據化,而這項研究不是任何一個專業可以深入下去的,它的專業性太強,所以我才會想到,所謂教育技術與其研究教育的數字化,不如研究教育的數據化來得實在,來的有意義。長期以來,我們並不了解教育對一個人的影響具體會如何表現,我們有的只是一個輪廓,我們也並不確定一個教師的行為對學生具體產生了哪些影響。所以,人們對教育一直有一個深深的質疑,它是不是科學的?大數據概念至少提出了關注「是什麼」比「為什麼」要有實際意義得多。而我們的教育恰好需要把注意力從「為什麼」轉移到「是什麼」上面來,只有如此,才能把教育從為什麼發展成「可能成為什麼」上來,這會是一次思想上的革命。而對於現在地位岌岌可危的教育技術來說,把研究的重點從數字化轉移到數據化上面,這才是它的出路。
如何將數據融入教學,教育者首先通過標准化全科教學處方,實現了教師授課模板和教學內容的標准化,保證每個教學過程和內容是可控的,然後結合每天的教學內容,處理好面對的數據,處理好數據,自然也就處理好了課堂的反饋,最終形成了既注重教學體驗又以教學結果為導向的教學體系。
與此同時,不僅要注重課上的學生資源,在課後還要對這些資源進行跟蹤處理。這與過去的教育教學顯然是不同的,面對大數據時代的到來,教學有所改變是必然的。所以,無論環境怎麼變換,數據如何復雜,我們都不能不去改變自己的教學去迎合將來的這個大數據時代。
舍恩伯格的《大數據時代》,讓我重新審視了"大數據"這個在信息時代異軍突起的熱點詞彙,作為信息安全專業的我,對大數據這個詞本身有著更多的熱忱。
在網路上搜索到的解釋是:"大數據",或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。特點:數量、速度、品種、真實性。
而舍恩伯格認為,大數據並不能定義一個確切的概念。他提到"大數據是人們獲得新的認知,創造新的價值的源泉;大數據還是改變市場、組織機構,以及政府和公民關系的方法。"這是一種更具有人文色彩和社會意義的詮釋。
本書中,主要從三個方面論述,即思維變革、商業變革和管理變革。而舍恩伯格更是著重闡明三大觀點:
一、更多:不是隨機樣本,而是全體數據。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。
對於觀點一,我不敢苟同,畢竟大數據的實現需要一定的技術支持,而顯然,現在這種技術還不夠成熟,同時一些簡單的事情運用大數據反倒是問題更加復雜化,因此這種大叔據的繁雜處理方式更適用於一些特定的情況,比如商業預測,人類dna的研究等。
而對第二種觀點,我是十分贊同舍恩伯格所說的"大數據的簡單演算法比小數據的簡單演算法有效"。在計算機行業迅速發展中,一種新的簡單可行的演算法的出現,遠沒有計算機在運算速度和存儲容量的發展快,而大數據演算法似乎更能迎合這種大趨勢。
觀點三中提到的相關關系在大數據中可是重量級的,它能較快找到事物規律和對應的解決措施,當然,也不能完全忽視因果關系,畢竟人們在思維上更能夠接受因果關系分析出的結果,而大數據預測的需要人們慢慢的適應才能接受。當我們完成相關關系的分析而又不滿足於只知道"是什麼"的時候,我們就可以轉而研究"為什麼"了,畢竟問題的根本在於因果。而舍恩伯格的全體數據和相關關系是大數據時代下的一種捷徑。
但是在信息時代,信息安全問題的日趨凸顯,數據獨裁與隱私保護之間的矛盾更是立於風口浪尖,成為眾矢之的,舍恩伯格在本書的最後章節曾試圖尋找一種解決方式來擺脫這一種困境,但最終沒能做到,但是他提出"大數據並不是一個充斥著演算法的和機器的冰冷世界,人類的作用仍無法被完全代替。"這里表明人在數據時代同樣的重要,數據是為人類服務的,也就該人類驅使下完成相應的目的。
在這樣的大環境下,常引起我更多的思考和擔憂。
大數據時代對於我們同是機遇與挑戰,一些國家已開始步入大數據時代的行列,並在各個領域開始研究和使用。而對於我國龐大的人口,以及較大的領土面積,都可以在大數據時代為我們提供數據的保障,而能否面臨挑戰,在大國之間的新一輪角色角逐間嶄露頭角,我們更需要解決技術等方面的問題,更應在政策上逐步開放各領域的數據,保證數據來源、許可權等問題得到解決,不斷學習先進的計算機技術,縮小與其他國家的差距。
工業化、信息化,我們都向世界交出了一份讓世界不能小覷的答案;
大數據時代的數據化我們又將怎樣在新的風暴中所向披靡,如果大數據時代是一種必然趨勢,那這就是我們這一代人的責任,是我們新的戰場!
;