Ⅰ 為什麼棒球第四棒是強棒
我的理解是,在現代職業棒球中,特別是在美國職業棒球大聯盟中,四名棒球擊球手無疑都很強,但有一種「弱化」的趨勢,而隊里最好的擊球手也不會是第四名棒球。根據過去的經驗,我們稱3-6棒球為中心線。他們的遠距離打球能力和打幾圈的能力無疑是球隊九個壘球中最好的先發球員。。當他處於危險中時,這降低了他的力量,而且沒有秘密武器可用。第二,三板斧本身存在一定的缺陷,球場形勢變化迅速,第二板斧可能面臨兩次出局/得分的局面,第四板斧可能面臨空位,這就要求教練要考慮到自己球隊的特點。里金線和其他投手全面展開,但不能。遵循一個簡單的原則。例如,如果今天對手的先發球員是左撇子,你可以適當考慮右撇子在前面的位置;我們隊的一個球員不能打滑桿(裁判是指你!)你可以考慮在遇到一個棘手的開始時回擊他。盡管前段球拍的機會更多,但對於許多擊球力量不均等的球隊來說,把最強的球員放在一場、兩場、三場或四場比賽中並不是一個好的選擇。這將導致許多比賽中,對手可以很容易地選擇交付故意,這是不容易形成打擊字元串。團結一致。在後一部分中,盲槍被蝙蝠伏擊,兩個基地之間危險的快速腿可能對對手造成意想不到的打擊。甚至還有一些例子表明,為了增強第二條腿的力量,最好的球員會回來。在投手非常強大的比賽中,打破僵局或製造混亂的能力非常重要。這就要求在中央打擊線不能打開的情況下,前後的打擊者仍能獨立作戰。
Ⅱ 關於大數據的作文
在第86屆奧斯卡頒獎典禮上,萊昂納多·迪卡普里奧又一次落選影帝的那一刻,你有沒有為直播鏡頭中眼含淚光的他感到心疼?這已經是他第四次獲得提名而希望落空了。
但你本沒必要懷揣期待—萊昂納多本人也是,因為微軟紐約研究院的經濟學家大衛·羅斯柴爾德在此前就宣布,最佳男主角花落《達拉斯買傢俱樂部》主演馬修·麥康納的概率高達90.9%。
這個數字是在收集了賭博市場、好萊塢證券交易所、用戶自動生成信息等大量公開數據後,建立的預測模型所分析出來的結果。事實證明,大數據贏了:在本屆奧斯卡共24個獎項中,大衛預測中了21個,包括競爭最激烈的「最佳原創劇本獎」。
事實上,大衛去年就「猜」到了第85屆奧斯卡的19個獎項;2012年,他用一個數據驅動模型正確預測了美國51個行政區中50個的總統大選結果;其他「業務」還包括預測一年一度的「超級碗」(美國國家橄欖球聯盟年度冠軍賽)賽事結果……以至於每當此類事件發生,人們都會去他的官方網站PredictWise上看看「先知」怎麼說。
大數據時代,驚喜已死。
不過,相比於影迷和體育比賽觀眾,政客與商人更歡迎大數據。他們需要的不是驚喜,而是洞察力,然後「對症下葯」。
最成功的案例大概是位於芝加哥的牛排連鎖餐廳Morton。
當一位顧客開玩笑地通過Twitter要求它在自己乘飛機抵達紐約時准時送上外賣,一場品牌營銷就開始了。首先分析推特數據,發現該顧客是本店常客,再根據以往的訂單記錄推測出其所乘的航班,然後派出一位身著燕尾服的侍者提前抵達機場,為客戶呈上晚餐—一炮而紅。
如此突破想像力而實用的技能,為數據分析師們帶來了更多的工作機會。大數據領域最優秀的科學家們紛紛轉行股票、期貨,乃至賭博。如果你能准確預測九成英超足球聯賽的比賽結果,情況會怎樣?Betegy會告訴你:一夜暴富不再是夢想。這家波蘭在線撲克游戲公司正將勃勃野心擴展到更廣闊的博彩業,它為全球21個國家的職業聯賽提供結果預測服務,並宣稱對英超的預測准確率高達90%。
如何做到這一點?利用雙層數據。第一層包括基本統計信息,如最近表現、兩隊對抗歷史、陣容以及平均進球數。第二層則更深一步,將天氣及其他可能影響球員發揮的因素考慮在內。不過,該公司對其他一些比賽的預測成功率僅有50%。
被稱為美國「演算法之神」、曾為棒球網站寫比賽預測的奈特·西爾弗也給賭徒們潑了一盆冷水。他曾在采訪中說:「我一般都在下注時賭相反的結果,因為其他人會按我說的來,如果我跟他們一樣,估計贏不了。」
那麼,被大數據奪走了「驚喜」的普通人,能獲得怎樣的補償呢?或許奈特的這項研究比較易於操作—通過分析想要維持長期戀愛關系和想要一夜情的人在一周中不同時間外出約會的比例,他建議:想尋找刺激的話,在周三出去碰碰運氣吧。
Ⅲ 自由數據告訴你,大數據分析哪個領域運用最多
大數據有很多奇妙得運用,幫助人們真正從中獲益。社會中的大多數企業基本會受到大數據分析的影響,但大數據是是如何增加企業及其產品價值的呢?
下面讓我們來看看9個大數據高效益運用的關鍵領域:
1.拓展客戶,分析客戶需求,提供客戶需要的服務
這是大數據應用最普遍,也最廣為人知的一個領域,其主要方向是企業通過大數據分析更好地了解自己客戶的行為和喜好。為了更全面的獲得這些信息,企業都熱衷於手機社交媒體、瀏覽器日誌、文本分析和感測器的相關數據。一切工作的總目標是創建預測模型,比如美國零售商Target通過大數據分析可以准確地預測客戶什麼時候想要小孩,沃爾瑪可以更好地預測哪些產品將會熱賣,而政府能更好的掌握政務與群眾生活的相關性。
2.企業對內優化業務流程,提升工作效率
在很多領域中,大數據越來越多地用於業務流程的優化,主要手段是收集社交媒體數據、網路搜索趨勢及天氣預報等方面大數據信息,進行大數據分析,從中挖掘出有針對性的預測信息,使得包括零售商在內的大多企業可以准確精細的分析出自身業務流程的優勢和不足,並根據大數據分析得出的結論找到合適的調整方式與業務模式。比如人力資源業務流程也能夠通過使用大數據分析來改進,優化人才招聘,衡量企業文化和運功參與度等之類的問題。
3.機器和設備的性能優化
在大數據時代,機器和設備的發展趨勢必然是更加智能和自主化,像被大數據工具運行的谷歌自駕車、GPS及強大的計算機和感測器,在未來的道路上,不再需要人工的干預。
4.國家提高安全和執法
信用卡安全、網路安全、犯罪活動等都是治安執法的不變的主題,警察可以使用大數據工具來捉住最煩,預測犯罪活動,而信用卡公司可以利用大數據工具來檢測欺詐性交易。大數據被廣泛運用於治安執法的過程中,提高了執法的靈敏性,增加了對犯罪和恐怖主義活動的可控、可預測性。
5.智慧城市建設和智能化轉型
大數據在國家安全和執法中的運用,改善了安全和執法,同時也是城市與國家轉型的必要工具。很多城市都在試點運用大數據分析技術,將交通和公共設施納入智能化的范圍,試圖轉變為智能城市。大數據分析技術基於城市的實時交通信息、社交媒體和天氣數據,適時優化交通情況,匯總成實時交通訊息。除此之外,在城市和國家轉向智能化的過程中,大數據工具和技術能提供的是一個不可或缺的平台和道路。
6.個人生活中息息相關的大數據
適用於政府和企業的大數據,其實也適用於個人的生活。當人工智慧產品進入日常的生活(如智能手錶),我們就可從穿戴設備的應用中生成數據,追蹤個人的熱量消耗、睡眠模式等。甚至大數據也能成為尋找愛情的好幫手,眾多社交平台和網站都運用大數據工具和演算法分析用戶的屬性等其他信息,幫助自己的用戶尋找到最合適的對象。
7.大數據使醫療技術應用和研發更快捷、高效
如每個人能受益於智能產品一樣,在醫療衛生領域,大數據也能幫助醫生更好的研究、診斷和治療疾病。目前,大數據技術已被用來監視早產嬰兒以及患病嬰兒,記錄每次心跳,分析呼吸模式,醫生能在任何不適症狀出現之前預測24小時內的病情,使得患病嬰兒得到更早的救助。未來的臨床實驗不僅局限於小樣本,更會服務於每個人,並且使醫護人員與研究人員能更好地理解和預測疾病模式,運用大數據分析的計算能力能在幾分鍾內解碼整個DNA,縮短找到新治療方法的周期。
8.全方位追蹤運動員以獲得更優的改進
在運動領域運用大數據分析技術已不佔少數,這樣的監測幾乎滲透進了運動員生活的方方面面。比如網球鼻塞的TBM Slam Tracker工具,它使用視頻分析追蹤足球或棒球比賽中每個球員的表現。而若在運動器材中使用感測器技術,(如籃球或高爾夫俱樂部)則是通過獲得鼻塞的數據,以分析結果為依據進行改進。除此之外,不少的精英運動隊還利用智能技術追蹤賽外運動員的活動,獲得其營養狀況及睡眠,甚至是社交對話等更日常、細節的信息監控其情感狀況。
9.金融交易中使用,精準賣出和買入
金融行業應用大數據主要是在金融交易一塊,尤其是高頻交易(HFT)領域。大多數股權交易都是通過大數據演算法進行的,這些演算法越來越多地開始考慮社交媒體和新聞網站的影響因素,以此在幾秒內作出買入和賣出的決定。
上述9個領域是目前應用大數據最多的領域,隨著大數據工具越來越普及,還會有更多的其他應用領域,以及更多新的應用。
提供大數據工具和技術的平台也會隨之增多,覆蓋領域更廣更全。作為國內優秀的企業數據定製服務平台之一, 自由數據 致力於為企業和開發者提供優質的數據資源、 API介面 和 數據定製服務 等,重點覆蓋企業徵信數據、 金融數據 、 社會輿情 、 生活數據 等領域。
Ⅳ 漫談大數據的思想形成與價值維度
漫談大數據的思想形成與價值維度
清華基於微博分析獲得的大數據幸福指數發現人們周六最幸福,相信大家心情不錯,因此今天不談枯燥的技術。關於大數據的思維、理念、方法論已經被反復消費了,本來我想直接進入交互環節,繼挺兄還是要求先有一部分規定動作,我就先自彈自唱幾十分鍾,既然是漫談,也不見得扣題,說到哪裡是哪裡。各位有問題,我可以擇時擇機插入討論。
先說大數據思想的形成吧。自從人類開始文字和數字,數據就開始產生。就數據增長曲線而言,極小的初值確實要經歷漫長的過程達到人類能感知的曲線拐點。谷歌前CEO埃里克·施密特曾給出了一個有趣的數據:從人類文明曙光初現到2003年一共產生的數據,只相當於2010年兩天產生的數據量。而一旦越過拐點,「大數據摩爾定律」的滾滾鐵輪下,指數效應爆發:最近兩年產生的數據量相當於之前產生的全部數據量。
在漫長的數據蓄水過程中,數學和統計學逐漸發展,人們開始注意對數據的量化分析,在人類進入信息時代以前這樣的例子就不勝枚舉。比如經濟上,黃仁宇先生對宋朝經濟的分析中發現了「數目字管理」(即定量分析)的廣泛應用(可惜王安石變法有始無終)。又如軍事,「向林彪學習數據挖掘」的橋段不論真假,其背後量化分析的思想無疑有其現實基礎,而這一基礎甚至可以回推到2000多年前,孫臏正是通過編造「十萬灶減到五萬灶再減到三萬灶」的數據、利用龐涓的量化分析習慣對其進行誘殺。
到上世紀50-60年代,磁帶取代穿孔卡片機,啟動了數據存儲的革命。磁碟驅動器隨即發明,它帶來的最大想像空間並不是容量,而是隨機讀寫的能力,這一下子解放了數據工作者的思維模式,開始數據的非線性表達和管理。資料庫應運而生,從層次型資料庫(IBM為阿波羅登月設計的層次型資料庫迄今仍在建行使用),到網狀資料庫,再到現在通用的關系資料庫。與數據管理同時發源的是決策支持系統(DSS),80年代演變到商業智能(BI)和數據倉庫,開辟了數據分析——也就是為數據賦予意義——的道路。
那個時代運用數據管理和分析最厲害的是商業。第一個數據倉庫是為寶潔做的,第一個太位元組的數據倉庫是在沃爾瑪。沃爾瑪的典型應用是兩個:一是基於retaillink的供應鏈優化,把數據與供應商共享,指導它們的產品設計、生產、定價、配送、營銷等整個流程,同時供應商可以優化庫存、及時補貨;二是購物籃分析,也就是常說的啤酒加尿布。關於啤酒加尿布,幾乎所有的營銷書都言之鑿鑿,我告訴大家,是Teradata的一個經理編的,人類歷史上從沒有發生過,但是,先教育市場,再收獲市場,它是有功的。
僅次於沃爾瑪的樂購(Tesco),強在客戶關系管理(CRM),細分客戶群,分析其行為和意圖,做精準營銷。
這些都發生在90年代。00年代時,科研產生了大量的數據,如天文觀測、粒子碰撞,資料庫大拿吉姆·格雷等提出了第四範式,是數據方法論的一次提升。前三個範式是實驗(伽利略從斜塔往下扔),理論(牛頓被蘋果砸出靈感,形成經典物理學定律),模擬(粒子加速太貴,核試驗太臟,於是乎用計算代替)。第四範式是數據探索。這其實也不是新鮮的,開普勒根據前人對行星位置的觀測數據擬合出橢圓軌道,就是數據方法。但是到90年代的時候,科研數據實在太多了,數據探索成為顯學。在現今的學科里,有一對孿生兄弟,計算XX學和XX信息學,前者是模擬/計算範式,後者是數據範式,如計算生物學和生物信息學。有時候計算XX學包含了數據範式,如計算社會學、計算廣告學。
2008年克里斯·安德森(長尾理論的作者)在《連線》雜志寫了一篇《理論的終結》,引起軒然大波。他主要的觀點是有了數據,就不要模型了,或者很難獲得具有可解釋性的模型,那麼模型所代表的理論也沒有意義了。跟大家說一下數據、模型和理論。大家先看個粗糙的圖。
首先,我們在觀察客觀世界中採集了三個點的數據,根據這些數據,可以對客觀世界有個理論假設,用一個簡化的模型來表示,比如說三角形。可以有更多的模型,如四邊形,五邊形。隨著觀察的深入,又採集了兩個點,這時發現三角形、四邊形的模型都是錯的,於是確定模型為五邊形,這個模型反映的世界就在那個五邊形里,殊不知真正的時間是圓形。
大數據時代的問題是數據是如此的多、雜,已經無法用簡單、可解釋的模型來表達,這樣,數據本身成了模型,嚴格地說,數據及應用數學(尤其是統計學)取代了理論。安德森用谷歌翻譯的例子,統一的統計學模型取代了各種語言的理論/模型(如語法),能從英文翻譯到法文,就能從瑞典文翻譯到中文,只要有語料數據。谷歌甚至能翻譯克萊貢語(StarTrek里編出來的語言)。安德森提出了要相關性不要因果性的問題,以後舍恩伯格(下面稱之為老舍)只是拾人牙慧了。
當然,科學界不認同《理論的終結》,認為科學家的直覺、因果性、可解釋性仍是人類獲得突破的重要因素。有了數據,機器可以發現當前知識疆域裡面隱藏的未知部分。而沒有模型,知識疆域的上限就是機器線性增長的計算力,它不能擴展到新的空間。在人類歷史上,每一次知識疆域的跨越式拓展都是由天才和他們的理論率先吹起的號角。
2010年左右,大數據的浪潮捲起,這些爭論迅速被淹沒了。看谷歌趨勢,」bigdata」這個詞就是那個時間一下子躥升了起來。吹鼓手有幾家,一家是IDC,每年給EMC做digitaluniverse的報告,上升到澤位元組范疇(給大家個概念,現在硬碟是太位元組,1000太=1拍,阿里、Facebook的數據是幾百拍位元組,1000拍=1艾,網路是個位數艾位元組,谷歌是兩位數艾位元組,1000艾=1澤);一家是麥肯錫,發布《大數據:創新、競爭和生產力的下一個前沿》;一家是《經濟學人》,其中的重要寫手是跟老舍同著《大數據時代》的肯尼思?庫克耶;還有一家是Gartner,杜撰了3V(大、雜、快),其實這3V在2001年就已經被編出來了,只不過在大數據語境里有了全新的詮釋。
咱們國內,歡總、國棟總也是在2011年左右開始呼籲對大數據的重視。
2012年子沛的書《大數據》教育政府官員有功。老舍和庫克耶的《大數據時代》提出了三大思維,現在已經被奉為圭臬,但千萬別當作放之四海而皆準的真理了。
比如要數據全集不要采樣。現實地講,1.沒有全集數據,數據都在孤島里;2.全集太貴,鑒於大數據信息密度低,是貧礦,投入產出比不見得好;3.宏觀分析中采樣還是有用的,蓋洛普用5000個樣本勝過幾百萬調查的做法還是有實踐意義;4.采樣要有隨機性、代表性,采訪火車上的民工得出都買到票的結論不是好采樣,現在只做固定電話采樣調查也不行了(行動電話是大頭),在國外基於Twitter采樣也發現不完全具有代表性(老年人沒被包括);5.采樣的缺點是有百分之幾的偏差,更會丟失黑天鵝的信號,因此在全集數據存在且可分析的前提下,全量是首選。全量>好的采樣>不均勻的大量。
再說混雜性由於精確性。擁抱混雜性(這樣一種客觀現象)的態度是不錯的,但不等於喜歡混雜性。數據清洗比以前更重要,數據失去辨識度、失去有效性,就該扔了。老舍引用谷歌PeterNovig的結論,少數高質量數據+復雜演算法被大量低質量數據+簡單演算法打敗,來證明這一思維。Peter的研究是Web文本分析,確實成立。但谷歌的深度學習已經證明這個不完全對,對於信息維度豐富的語音、圖片數據,需要大量數據+復雜模型。
最後是要相關性不要因果性。對於大批量的小決策,相關性是有用的,如亞馬遜的個性化推薦;而對於小批量的大決策,因果性依然重要。就如中葯,只到達了相關性這一步,但它沒有可解釋性,無法得出是有些樹皮和蟲殼的因導致治癒的果。西葯在發現相關性後,要做隨機對照試驗,把所有可能導致「治癒的果」的干擾因素排除,獲得因果性和可解釋性。在商業決策上也是一樣,相關性只是開始,它取代了拍腦袋、直覺獲得的假設,而後面驗證因果性的過程仍然重要。
把大數據的一些分析結果落實在相關性上也是倫理的需要,動機不代錶行為。預測性分析也一樣,不然警察會預測人犯罪,保險公司會預測人生病,社會很麻煩。大數據演算法極大影響了我們的生活,有時候會覺得挺悲哀的,是演算法覺得了你貸不貸得到款,谷歌每調整一次演算法,很多在線商業就會受到影響,因為被排到後面去了。
下面時間不多了,關於價值維度,我貼一些以前講過的東西。大數據思想中很重要的一點是決策智能化之外,還有數據本身的價值化。這一點不贅述了,引用馬雲的話吧,「信息的出發點是我認為我比別人聰明,數據的出發點是認為別人比我聰明;信息是你拿到數據編輯以後給別人,而數據是你搜集數據以後交給比你更聰明的人去處理。」大數據能做什麼?價值這個V怎麼映射到其他3V和時空象限中?
再貼上解釋。「見微」與「知著」在Volume的空間維度。小數據見微,作個人刻畫,我曾用《一代宗師》中「見自己」形容之;大數據知著,反映自然和群體的特徵和趨勢,我以「見天地、見眾生」比喻之。「著」推動「微」(如把人群細分為buckets),又拉動「微」(如推薦相似人群的偏好給個人)。「微」與「著」又反映了時間維度,數據剛產生時個人價值最大,隨著時間decay最後退化為以集合價值為主。
「當下」和「皆明」在Velocity的時間維度。當下在時間原點,是閃念之間的實時智慧,結合過往(負軸)、預測未來(正軸),可以皆明,即獲得perpetual智慧。《西遊記》里形容真假孫悟空,一個是「知天時、通變化」,一個是「知前後、萬物皆明」,正好對應。為達到皆明,需要全量分析、預測分析和處方式分析(prescriptiveanalytics,為讓設定的未來發生,需要採取什麼樣的行動)。
「辨訛」和「曉意」在Variety的空間維度。基於大體量、多源異質的數據,辨訛過濾雜訊、查漏補缺、去偽存真。曉意達到更高境界,從非結構數據中提取語義、使機器能夠窺探人的思想境界、達到過去結構化數據分析不能達到之高度。
先看知著,對宏觀現象規律的研究早已有之,大數據的知著有兩個新特點,一是從采樣到全量,比如央視去年「你幸福嗎」的調查,是街頭的采樣,前不久《中國經濟生活大調查》關於幸福城市排名的結論,是基於10萬份問卷(17個問題)的采樣,而清華行為與大數據實驗室做的幸福指數(繼挺兄、我、還有多位本群群友參與),是基於新浪微博數據的全集(托老王的福),這些數據是人們的自然表達(而不是面對問卷時的被動應對),同時又有上下文語境,因此更真實、也更有解釋性。北上廣不幸福,是因為空氣還是房價或教育,在微博上更容易傳播的積極情緒還是消極情緒,數據告訴你答案。《中國經濟生活大調查》說「再小的聲音我們都聽得見」,是過頭話,采樣和傳統的統計分析方法對數據分布採用一些簡化的模型,這些模型把異常和長尾忽略了,全量的分析可以看到黑天鵝的身影,聽到長尾的聲音。
另一個特點是從定性到定量。計算社會學就是把定量分析應用到社會學,已經有一批數學家、物理學家成了經濟學家、寬客,現在他們也可以選擇成為社會學家。國泰君安3I指數也是一個例子,它通過幾十萬用戶的數據,主要是反映投資活躍程度和投資收益水平的指標,建立一個量化模型來推知整體投資景氣度。
再看見微,我認為大數據的真正差異化優勢在微觀。自然科學是先宏觀、具體,進入到微觀和抽象,這時大數據就很重要了。我們更關注社會科學,那是先微觀、具體,再宏觀、抽象,許小年索性認為宏觀經濟學是偽科學。如果市場是個體行為的總和,我們原來看到是一張抽象派的畫,看不懂,通過客戶細分慢慢可以形成一張大致看得懂的現實圖景,不過是馬賽克的,再通過微分、甚至定位個人,形成高清圖。我們每一個人現在都生活在零售商的bucket中(前面說的樂購創造了這個概念),最簡單的是高收入、低收入這類反映背景的,再有就是反映行為和生活方式的,如「精打細算」、「右鍵點擊一族」(使用右鍵的比較techsavvy)。反過來我們消費者也希望能夠獲得個性化的尊崇,Nobodywantstobenobodytoday。
了解並掌握客戶比以往任何時候都更重要。奧巴馬贏在大數據上,就是因為他知道西岸40-49歲女性的男神是喬治·克魯尼,東岸同樣年齡段女性的偶像則是莎拉·傑西卡·帕克(《慾望都市》的主角),他還要更細分,搖擺州每一個郡每一個年齡段每一個時間段在看什麼電視,搖擺州(俄亥俄)1%選民隨時間變化的投票傾向,搖擺選民在Reddit上還是Facebook上,都在其掌握之中。
對於企業來說,要從以產品為中心,轉到以客戶(買單者)甚至用戶(使用者)為中心,從關注用戶背景到關注其行為、意圖和意向,從關注交易形成轉到關注每一個交互點/觸點,用戶是從什麼路徑發現我的產品的,決定之前又做了什麼,買了以後又有什麼反饋,是通過網頁、還是QQ、微博或是微信。
再講第三個,當下。時間是金錢,股票交易就是快魚吃慢魚,用免費股票交易軟體有幾秒的延遲,而佔美國交易量60-70%的高頻程序化交易則要發現毫秒級、低至1美分的交易機會。時間又是生命,美國國家大氣與海洋管理局的超級計算機在日本311地震後9分鍾發出海嘯預警,已經太晚。時間還是機會。現在所謂的購物籃分析用的其實並不是真正的購物籃,而是結帳完的小票,真正有價值的是當顧客還拎著購物籃,在瀏覽、試用、選擇商品的時候,在每一個觸點影響他/她的選擇。數據價值具有半衰期,最新鮮的時候個性化價值最大,漸漸退化到只有集合價值。當下的智慧是從刻舟求劍到見時知幾,原來10年一次的人口普查就是刻舟求劍,而現在東莞一出事網路遷徙圖就反映出來了。當然,當下並不一定是完全准確的,其實如果沒有更多、更久的數據,匆忙對網路遷徙圖解讀是可能陷入誤區的。
第四個,皆明。時間有限,就簡單說了。就是從放馬後炮到料事如神(predictiveanalytics),從料事如神到運籌帷幄(prescriptiveanalytics),只知道有東風是預測分析,確定要借箭的目標、並給出處方利用草船來借,就是處方性分析。我們現在要提高響應度、降低流失率、吸引新客戶,需要處方性分析。
辨訛就是利用多源數據過濾雜訊、查漏補缺和去偽存真。20多個省市的GDP之和超過全國的GDP就是一個例子,我們的GPS有幾十米的誤差,但與地圖數據結合就能做到精確,GPS在城市的高樓中沒有信號,可以與慣性導航結合。
曉意涉及到大數據下的機器智能,是個大問題,也不展開了。貼一段我的文章:有人說在涉及「曉意」的領域人是無法替代的。這在前大數據時代是事實。《點球成金(Moneyball)》講的是數量化分析和預測對棒球運動的貢獻,它在大數據背景下出現了傳播的誤區:一、它其實不是大數據,而是早已存在的數據思維和方法;二、它刻意或無意忽略了球探的作用。從讀者看來,奧克蘭競技隊的總經理比利·比恩用數量化分析取代了球探。而事實是,在運用數量化工具的同時,比恩也增加了球探的費用,軍功章里有機器的一半,也有人的一半,因為球探對運動員定性指標(如競爭性、抗壓力、意志力等)的衡量是少數結構化量化指標無法刻畫的。大數據改變了這一切。人的數字足跡的無意識記錄,以及機器學習(尤其是深度學習)曉意能力的增強,可能逐漸改變機器的劣勢。今年我們看到基於大數據的情感分析、價值觀分析和個人刻畫,當這些應用於人力資源,已經或多或少體現了球探承擔的作用。
以上是小編為大家分享的關於漫談大數據的思想形成與價值維度的相關內容,更多信息可以關注環球青藤分享更多干貨
Ⅳ 如何利用大數據工具,輔助教師教學
無論你是在千禧年出生,還是在嬰兒潮時期降臨這個世界,今日的課堂與我們兒時的課堂相比,已經非常不同。
今日的小孩一上學就有平板電腦或者筆記本電腦,很多小孩拿到電腦時甚至還不能識字。一些國家為了讓學生適應基於電腦的標准化測試,要求二年級的學生必須具備每分鍾輸入60個單詞的能力。現在的小孩上學前就已經有姓名、住址、出生日期、醫學和行為記錄等數字記錄。
在課堂上應用技術和大數據的設想已經成為現實,並且正以非常快的速度在發展,快到我們都無法預測未來幾年內孩子們接受的規范教育將會變成怎樣。這是我們的生活已經離不開大數據的又一證據。但當這個事情發生在我們孩子的教育上時,到底是好事還是壞事呢?
形成反饋閉環和大數據在教育中的益處
就教育而言,最重要的地方一直都是形成反饋閉環。教師提出一個問題,然後學生嘗試去解決問題。從學生嘗試解決問題的行為中,教師可以發現學生理解了哪些內容,以及哪些內容是不理解的,然後再基於此對教學行為作出相應的調整。同樣的,學生在嘗試解決問題的過程中,也能加深對問題的理解。
這個閉環在一對一或者是師生人數比率較低的情況下,非常有效,但是當學生數量過多,同時不同學生之間的水平存在差異之時,要想創建這種有效的閉環就變得異常困難。這時大數據和技術就可以發揮作用了。
任何一名教師都可以帶著學生學一門課程,但是要做到對每個學生具體的問題進行精準定位,就沒有那麼容易了,尤其是在班級學生數量較大的情況下。一家名為Knewton的大數據公司開發了一個數字平台,該平台分析了幾百萬學生(從幼兒園到大學)的學習過程,並基於這一分析來設計更加合理的測試題目和更加個性化課程目標。最近,該公司與Houghton Mifflin Harcourt建立了合作關系,開發出了K-12階段的個性化數學課程,同時還與法國創業公司Gutenberg Technology一道,開發了智能數字教科書。
簡單來說,這些課程和教科書能夠適應每個學生的差異。該程序可以根據學生的表現,判斷當前的題目的難度是否過大,是否太容易,還是剛剛好?然後,基於判斷實時的改變題目的難度。學生可以按照自己的節奏來控制學習進度,而不會受到周圍其他學生的行為的影響。然後,系統會給教師一個反饋,告知哪個學生在哪個方面有困難,同時給出全班學生的表現的整體分析數據。
那麼,這種教學方法有什麼缺點嗎?
大數據教育的阻礙
與其它所有使用大數據的應用一樣,在教育中使用大數據也有人表示出不理解和擔憂。人們最常擔心的問題就是數據泄露,而且這種事情已經發生過了。2009年的時候,美國田納西州的一個學區由於疏忽,將18000名K-12階段學生的姓名、住址、出生日期和完整的社保號碼暴露在了一個不安全的伺服器上,而且整個過程持續了數月。
人們的另一個擔憂是,這些數據會像以前學校曾經使用的神秘的「永久性檔案」一樣,一直伴隨學生的整個教育生涯。畢竟,一個學生在小學時被標記為「搗蛋鬼」,並不代表他上了中學之後還是「搗蛋鬼」,反而可能會變成另外一個完全不一樣的人。但是,由於他的數字檔案里依然標記其為「搗蛋鬼」,學校當局和老師可能會基於這個過去的評價來對待已經改變的學生,這顯然不合適。
另外一些團體還擔心,這些學生的數據將被用於商業營銷。理論上講,學校和大數據軟體開發商確實可以在特定的領域,向學生精準投放個性化廣告。或許,學生寫了一篇關於棒球的論文,然後就會收到關於當地棒球比賽的門票廣告。
教師角色的轉變
所有涉及數據的領域,從財經到零售業都會遇到這些擔憂和阻礙,但是在教育領域使用大數據還有另外一個問題——教師角色的轉變。隨著越來越多的技術和數據應用投入的教學中,教師的角色也應該隨之發生轉變,即由教學角色向數據驅動的管理角色轉變。然而,這是一個非常困難的過程。
優秀的教師選擇成為教師,主要是因為他們熱衷於教育學生。他們喜歡看到學生理解了一個問題之後,兩眼放光的樣子。他們也喜歡學生沉浸在一個知識點的時候,釋放出的熱情。不幸的是,這些優秀的教師對於讓演算法接管這一切感到不樂意,他們也不願意做一些數據輸入和管理工作,雖然這一切或許最終都能幫助學生走向卓越。
因此,大數據和技術或許並不是解決教育問題的靈丹妙葯。我相信,我們應該開發出一些應用來輔助優秀的教師進行教學,而不是用大數據和數據分析替代他們。最終,理解和應用數據及其分析過程,將像在其他行業一樣,讓學生和教師都從中獲得益處。
不知道各位如何看待這個問題,我們應該用數據記錄和分析學生在課堂上的一切表現嗎?還是我們應該保持傳統教學方式,讓大數據靠邊站?
Ⅵ 大數據的應用領域有哪些
1.了解和定位客戶
這是大數據目前最廣為人知的應用領域。很多企業熱衷於社交媒體數據、瀏覽器日誌、文本挖掘等各類數據集,通過大數據技術創建預測模型,從而更全面地了解客戶以及他們的行為、喜好。
利用大數據,美國零售商Target公司甚至能推測出客戶何時會有Baby;電信公司可以更好地預測客戶流失;沃爾瑪可以更准確的預測產品銷售情況;汽車保險公司能更真實的了解客戶實際駕駛情況。
滑雪場利用大數據來追蹤和鎖定客戶。如果你是一名狂熱的滑雪者,想像一下,你會收到最喜歡的度假勝地的邀請;或者收到定製化服務的簡訊提醒;或者告知你最合適的滑行線路。。。。。。同時提供互動平台(網站、手機APP)記錄每天的數據——多少次滑坡,多少次翻越等等,在社交媒體上分享這些信息,與家人和朋友相互評比和競爭。
除此之外,政府競選活動也引入了大數據分析技術。一些人認為,奧巴馬在2012年總統大選中獲勝,歸功於他們團隊的大數據分析能力更加出眾。
2.
改善醫療保健和公共衛生
大數據分析的能力可以在幾分鍾內解碼整個DNA序列,有助於我們找到新的治療方法,更好地理解和預測疾病模式。試想一下,當來自所有智能手錶等可穿戴設備的數據,都可以應用於數百萬人及其各種疾病時,未來的臨床試驗將不再局限於小樣本,而是包括所有人!
蘋果公司的一款健康APPResearchKit有效將手機變成醫學研究設備。通過收集用戶的相關數據,可以追蹤你一天走了多少步,或者提示你化療後感覺如何,帕金森病進展如何等問題。研究人員希望這一過程變得更容易、更自動化,吸引更多的參與者,並提高數據的准確度。
大數據技術也開始用於監測早產兒和患病嬰兒的身體狀況。通過記錄和分析每個嬰兒的每一次心跳和呼吸模式,提前24小時預測出身體感染的症狀,從而及早干預,拯救那些脆弱的隨時可能生命危險的嬰兒。
更重要的是,大數據分析有助於我們監測和預測流行性或傳染性疾病的暴發時期,可以將醫療記錄的數據與有些社交媒體的數據結合起來分析。比如,谷歌基於搜索流量預測流感爆發,盡管該預測模型在2014年並未奏效——因為你搜索「流感症狀」並不意味著真正生病了,但是這種大數據分析的影響力越來越為人所知。
3.提供個性化服務
大數據不僅適用於公司和政府,也適用於我搏衫們每個人,比如從智能手錶或智能手環等可穿戴設備採集的數據中獲益。Jawbone的智能手環可以分析人們的卡路里消耗、活動量和睡眠質量等。Jawbone公司已經能夠收集長達60年的睡眠數據,從中分析出一些獨到的見解反饋給每個用戶。從中受益的還有網路平台「尋找真愛」,大多數婚戀網站都使用大數據分析工具和演算法為用戶匹配最合適的對象。
4.
了解和優化業務流程
大數據也困畢越來越多地應用於優化業務流程,比如供應鏈或配送路徑優化。通過定位和識別系統來跟蹤貨物或運輸車輛,並根據實時交通路況數據優化運輸路線。
人力資源業務流程也在使用大數據進行優化。SociometricSolutions公司通過在員工工牌里植入感測器,檢測其工作場所及社交活動——員工在哪些工作場所走動,與誰交談,甚至交流時的語氣如何。美國銀行在使用中發現呼叫中心表現最好的員工——他們制定了小組輪流休息制度,平均業績提高了23%。
如果在手機、鑰匙、眼鏡等隨身物品上粘貼RFID標簽,萬一不小心丟失就能迅速定位它們。假想一下未來可能創造出貼在任何東西上的智能標簽。它們能告訴你的不僅是物體在哪裡,還可以反饋溫度,濕度,運動狀態等等。這將打開一個全新的大數據時代,「大數據」領域尋求共性的信息和模式,那麼孕育其中的「小數據」著重關注單個產品。
5.
改善城市和國家建設
大數據被用於改善我們城市和國家的方方面面。目前很多大城市致力於構建智慧交通。車輛、行人、道路基礎設施、公共服務場所都被整合在智慧交通網路中,以提升資源運用的效率,優化城市管理和服務。
加州長灘市正在使用智能水表實時檢測非法用水,幫助一些房主減少80%的用水量。洛杉磯利用磁性道路感測器和交通攝像頭的數據來控制交通燈信號,從而優化城市的交通流量。據統計目前已經控制了全市4500個交通燈,將交通擁堵狀況減少了約16%。
6.提升科學研究
大數據帶來的無限可能性正在改變科學研究。歐洲核子研究中心(CERN)在全球遍布了150個數據中心,有65,000個處理器,能同時分析30pb的數據量,這樣的計算能力影響著很多領域的科學研究。比如政汪銀芹府需要的人口普查數據、自然災害數據等,變的更容易獲取和分析,從而為我們的健康和社會發展創造更多的價值。
7.提升機械設備性能
大數據使機械設備更加智能化、自動化。例如,豐田普銳斯配備了攝像頭、全球定位系統以及強大的計算機和感測器,在無人干預的條件下實現自動駕駛。XcelEnergy在科羅拉多州啟動了「智能電網」的首批測試,在用戶家中安裝智能電表,然後登錄網站就可實時查看用電情況。「智能電網」還能夠預測使用情況,以便電力公司為未來的基礎設施需求進行規劃,並防止出現電力耗盡的情況。在愛爾蘭,雜貨連鎖店Tescos的倉庫員工佩戴專用臂帶,追蹤貨架上的商品分配,甚至預測一項任務的完成時間。
8.強化安全和執法能力
大數據在改善安全和執法方面得到了廣泛應用。美國國家安全局(NSA)利用大數據技術,檢測和防止網路攻擊(挫敗恐怖分子的陰謀)。警察運用大數據來抓捕罪犯,預測犯罪活動。信用卡公司使用大數據來檢測欺詐交易等等。
2014年2月,芝加哥警察局對大數據生成的「名單」——有可能犯罪的人員,進行通告和探訪,目的是提前預防犯罪。
9.
提高體育運動技能
如今大多數頂尖的體育賽事都採用了大數據分析技術。用於網球比賽的IBMSlamTracker工具,通過視頻分析跟蹤足球落點或者棒球比賽中每個球員的表現。許多優秀的運動隊也在訓練之外跟蹤運動員的營養和睡眠情況。NFL開發了專門的應用平台,幫助所有球隊根據球場上的草地狀況、天氣狀況、以及學習期間球員的個人表現做出最佳決策,以減少球員不必要的受傷。
還有一件非常酷的事情是智能瑜伽墊:嵌入在瑜伽墊中的感測器能對你的姿勢進行反饋,為你的練習打分,甚至指導你在家如何練習。
10.金融交易
大數據在金融交易領域應用也比較廣泛。大多數股票交易都是通過一定的演算法模型進行決策的,如今這些演算法的輸入會考慮來自社交媒體、新聞網路的數據,以便更全面的做出買賣決策。同時根據客戶的需求和願望,這些演算法模型也會隨著市場的變化而變化。
Ⅶ 大數據分析 應用的九大領域
大數據分析 應用的九大領域
隨著大數據的應用越來越廣泛,應用的行業也越來越低,我們每天都可以看到大數據的一些新奇的應用,從而幫助人們從中獲取到真正有用的價值。很多組織或者個人都會受到大數據的分析影響,但是大數據是如何幫助人們挖掘出有價值的信息呢?下面就讓我們一起來看看九個價值非常高的大數據的應用,這些都是大數據在分析應用上的關鍵領域:
1.理解客戶、滿足客戶服務需求
大數據的應用目前在這領域是最廣為人知的。重點是如何應用大數據更好的了解客戶以及他們的愛好和行為。企業非常喜歡搜集社交方面的數據、瀏覽器的日誌、分析出文本和感測器的數據,為了更加全面的了解客戶。在一般情況下,建立出數據模型進行預測。比如美國的著名零售商Target就是通過大數據的分析,得到有價值的信息,精準得預測到客戶在什麼時候想要小孩。另外,通過大數據的應用,電信公司可以更好預測出流失的客戶,沃爾瑪則更加精準的預測哪個產品會大賣,汽車保險行業會了解客戶的需求和駕駛水平,政府也能了解到選民的偏好。
2.業務流程優化
大數據也更多的幫助業務流程的優化。可以通過利用社交媒體數據、網路搜索以及天氣預報挖掘出有價值的數據,其中大數據的應用最廣泛的就是供應鏈以及配送路線的優化。在這2個方面,地理定位和無線電頻率的識別追蹤貨物和送貨車,利用實時交通路線數據制定更加優化的路線。人力資源業務也通過大數據的分析來進行改進,這其中就包括了人才招聘的優化。
3.大數據正在改善我們的生活
大數據不單單只是應用於企業和政府,同樣也適用我們生活當中的每個人。我們可以利用穿戴的裝備(如智能手錶或者智能手環)生成最新的數據,這讓我們可以根據我們熱量的消耗以及睡眠模式來進行追蹤。而且還利用利用大數據分析來尋找屬於我們的愛情,大多數時候交友網站就是大數據應用工具來幫助需要的人匹配合適的對象。
4.提高醫療和研發
大數據分析應用的計算能力可以讓我們能夠在幾分鍾內就可以解碼整個DNA.並且讓我們可以制定出最新的治療方案。同時可以更好的去理解和預測疾病。就好像人們戴上智能手錶等可以產生的數據一樣,大數據同樣可以幫助病人對於病情進行更好的治療。大數據技術目前已經在醫院應用監視早產嬰兒和患病嬰兒的情況,通過記錄和分析嬰兒的心跳,醫生針對嬰兒的身體可能會出現不適症狀做出預測。這樣可以幫助醫生更好的救助嬰兒。
5.提高體育成績
現在很多運動員在訓練的時候應用大數據分析技術了。比如例如用於網球鼻塞的IBMSlamTracker工具,我們使用視頻分析來追蹤足球或棒球比賽中每個球員的表現,而運動器材中的感測器技術(例如籃球或高爾夫俱樂部)讓我們可以獲得對比賽的數據以及如何改進。很多精英運動隊還追蹤比賽環境外運動員的活動-通過使用智能技術來追蹤其營養狀況以及睡眠,以及社交對話來監控其情感狀況。
6.優化機器和設備性能
大數據分析還可以讓積極和設備在應用上更加智能化和自主化。例如,大數據工具曾經就被谷歌公司利用研發谷歌自駕汽車。豐田的普瑞就配有相機、GPS以及感測器,在交通上能夠安全的駕駛,不需要人類的敢於。大數據工具還可以應用優化智能電話。
7.改善安全和執法
大數據現在已經廣泛應用到安全執法的過程當中。想必大家都知道美國安全局利用大數據進行恐怖主義打擊,甚至監控人們的日常生活。而企業則應用大數據技術進行防禦網路攻擊。警察應用大數據工具進行捕捉罪犯,信用卡公司應用大數據工具來檻車欺詐性交易。
8.改善我們的城市
大數據還被應用改善我們日常生活的城市。例如基於城市實時交通信息、利用社交網路和天氣數據來優化最新的交通情況。目前很多城市都在進行大數據的分析和試點。
9.金融交易
大數據在金融行業主要是應用金融交易。高頻交易(HFT)是大數據應用比較多的領域。其中大數據演算法應用於交易決定。現在很多股權的交易都是利用大數據演算法進行,這些演算法現在越來越多的考慮了社交媒體和網站新聞來決定在未來幾秒內是買出還是賣出。
以上九個是大數據應用最多的九個領域,當然隨著大數據的應用越來越普及,還有很多新的大數據的應用領域,以及新的大數據應用。
以上是小編為大家分享的關於大數據分析 應用的九大領域的相關內容,更多信息可以關注環球青藤分享更多干貨