Ⅰ 教你如何看懂旅遊大數據
教你如何看懂旅遊大數據_數據分析師考試
有時候,一句話、一張圖片都會蘊含巨大的數字商機,但這是一門需要高度精準性的技術活兒,並非人人都看得懂大數據。
看懂遊客行為
大家都在說大數據,攜程近期投資專攻大數據研究的眾薈信息技術有限公司(下稱「眾薈」)、阿里系的去啊旅行則與石基信息合作,而東呈酒店、如家酒店等也紛紛推出智能化管理。
每個旅遊業者都會有自己的會員和消費數據記錄,這些記錄就是大數據的基礎信息,然而在一堆數字和消費者行為面前究竟該如何分析處理並得出結論呢?
「首先要知道什麼是大數據,大數據分為兩大類,即結構化數據和非結構化數據,前者就是大家看到的一系列數字,後者則可能是一張圖、一句話等並非直接體現為數字的信息。因此真正意義上的大數據分析不僅要做直接的數字分析,還要懂得建立數學模型,將非結構化數據轉變為結構化數據並得出結論,這些並不簡單。」眾薈數據智能事業部總經理焦宇告訴記者。
焦宇給記者舉了一個例子,現在很多遊客會在OTA(在線旅遊代理商)上比價和預訂酒店,那麼其搜索的關鍵詞和瀏覽痕跡就會體現在OTA的記錄里,如果客人瀏覽過這家酒店的頁面卻跳轉了,並未下訂單,則可以通過這個記錄分析該客人不下單的原因,當這個客人通過價格、品牌、區域等關鍵詞排序查找酒店信息後,其留下的瀏覽記錄則可以統計出人們是對於價格敏感還是品牌敏感。
「經過研究,大部分人還是看重價格因素,由於價格的選擇是有區間的,這就可以用瀏覽痕跡得出一個最讓遊客接受的價格區間數字。只有11%的人在意品牌,說明同類酒店可替代性很強。如果以區域關鍵詞搜索,則代表地理位置數據,若可以精準到具體方位,並將這一信息傳達給該區域的酒店,則無疑提高了酒店的入住率還能根據消費者行為適當調整房價,當供大於求時下調房價,反之則提升房價。還有一個頗有意思的研究,即遊客瀏覽記錄中若有A酒店的競爭對手酒店,則可以推理這個客人對於A這一類酒店有需求,該客人就是A酒店應該關注的潛在客人。」焦宇指出,要將海量的瀏覽記錄變成有效數據,還得依靠數學模型,模型分為收斂型和發散型,大數據通常要經過收斂型模型將非結構化數據轉化成結構化數據並得出結論。
一位連鎖酒店經營者告訴記者,這些涵蓋了消費者較能接受的價格區間、品牌等信息的大數據可以讓酒店對價格、定位和營銷等做出策略性調整,以提升入住率,提高酒店整體收益管理。
神奇的語言分析
除了價格、品牌,語言文字也是一種非結構化數據,尤其是如今當客人預訂酒店旅遊產品時一定會先看一下點評,或者自己體驗後也會留言評價,這些語言背後也大有大數據學問。
記者多方采訪和觀察後了解到,不少客人會對已經入住的酒店進行評估,這些點評中經常會出現對酒店環境、客房設施、餐飲和服務的評價,比如「房間很乾凈,但是送餐服務比較慢」、「前台的服務差評」、「洗浴感受不錯」等。這需要用專業的語義分析進行精準細分化分析並轉換成結構化數據反饋給酒店經營者。
在人工智慧和計算語言學中,語義分析為知識推理和語言提供了方法,也是未來搜索引擎發展的方向。比如,輸入「蘋果」通過語義分析,能夠知道用戶想找的是手機而不是水果。
「首先我們會通過專業的語義分析去除一批虛假點評或無實質內容的點評,而將真正對酒店有實質內容的點評留下,並對於每一句話進行斷句和多維度切割。舉個簡單的例子,比如『這個酒店很乾凈,但是送餐服務比較慢』,經過我們的斷句和多維度切割分析後可以知道客房清潔度不錯,但送餐有問題,那麼我們接下來就要把結論進行細化分類並反饋給各部門。這里的問題就是速度,有時還涉及口味或者服務態度等。有時一段話的分析是非常復雜的,其中還有糾錯比例。」眾薈市場部高級副總裁胡凡表示。
從事酒店業超過15年的李先生告訴記者,比起簡單的「好」或「不好」,經過多維度語義分析後得出的結論可以反饋到酒店各個相關部門,並且細化到是哪個細節好,或哪個細節有問題需要改進,那麼管理層開例會時就能明確知道接下來的工作方向,而經過改善服務態度、速度甚至裝飾風格,其所在的酒店入住率提升了10%,且RevPAR(RevenuePerAvailableRoom,每間可供租出客房產生的平均實際營業收入)有約15%的增加。
據悉,一些科技信息公司對於語義分析的維度已經可以達到1000個。
跨界與圖片信息怎麼玩
有時候,對於旅遊大數據的分析還涉及跨界合作。
「國外是跨領域研究的,結合了多領域,比如地理信息、IT、商學院、社會學等。我舉個跟蹤遊客的例子,現在我們採用跨界合作的多方位社交媒體來跟蹤遊客行為。社交媒體上有很多遊客留下的痕跡,比如flickr,flickr上的圖片留下了照片的地理坐標、拍攝時間、評論信息等,這些都是非常可貴的旅遊大數據。」長期在澳大利亞研究旅遊大數據分析的學者程明明告訴記者,用地理坐標來追蹤軌跡則需要懂地理學的專家來幫忙,而商業管理方面的專才則可以分析遊客去哪兒、是什麼時間去等具有商業價值的數據。
在多方跨界分析研究後,業者可以知道哪些景點受歡迎、哪些是新的景點、遊客在幾點左右在景點甚至每次停留多久等。掌握這些大數據信息分析結果後,相關的旅遊業者可以有效做到分流,不會造成景點承載力過於飽和。同時,對比景點信息和遊客屬性,可以知道不同國家遊客對景點有什麼不同需求,比如亞洲人是否更喜歡文化景點,如果是,則當地旅遊推廣營銷時就要更多推出人文景點。
記者在采訪中獲悉,目前中國不少景區也正在與相關大數據分析公司合作,希望通過分析來預測未來一段時間的客流量,尤其是旺季黃金周的客流量預計,能幫助景區控制進入人數,提高安全性和服務質量。
頗有意思的是,圖片也屬於大數據。
「比如一些大型旅遊預訂網站上有大量圖片,對於圖片,我們需要IT技術人員來幫忙進行機器人訓練(machinelearning)幫助我們識別不同的圖片。比如究竟是人物還是風景效果好,然後我們再通過數學模型和旅遊局、旅行社宣傳的圖片進行對比,得出遊客感興趣的圖片和旅遊局、旅行社所宣傳的是否一致。如果不一致,那麼不一致在什麼方面,並需要如何改進。」程明明說道。
據悉,另有一種腦電波測試方式,能測試出人們看到圖片時眼球第一秒會注視的地方即最吸引點,以及人們對於被測試圖片的喜好或厭惡程度等。業者通過這些分析可以決定是否在銷售時更換樣圖,餐廳或景點的宣傳圖片究竟是有人好還是空景好,合適的樣圖能夠促進銷量。
「當然,要做好旅遊大數據研究並不簡單,其數學模型比較復雜,比如包含線性回歸之類的。其實,大數據研究是一個數據不斷整合和多學科交叉的過程,未來還有很多商機可以依靠大數據被挖掘出來。」程明明如是說。
以上是小編為大家分享的關於教你如何看懂旅遊大數據的相關內容,更多信息可以關注環球青藤分享更多干貨
Ⅱ 大數據攻略案例分析及結論
大數據攻略案例分析及結論
我們將迎來一個「大數據時代」。與變化相始終的中國企業,距離這場革命還有多遠?而追上領先者又需要多快的步伐?
{研究結論}
怎樣才能用起來大數據?障礙如何解決?中國企業家研究院對10多家在大數據應用方面的領先企業進行了采訪調研,更多家企業進行了書面資料調研,我們發現:
■ 當前中國企業的大數據應用可以歸類為:大數據運營、大數據產品、大數據平台三大=領域,前兩者更多是企業內部的應用,後者則在於用大數據來繁榮整個平台企業群落的生態。
■ 大數據營銷的本質是一個影響消費者購物前心理路徑的問題,而這在大數據時代前很難做到。
■ 對於傳統企業而言,要打通線上與線下營銷,實現新的商業模式,如O2O等,離不開大數據。
■ 雖然大數據應用往往集中於大數據營銷,但對於一些企業,大數據的應用早已超越了營銷范疇,全面進入了企業供應鏈、生產、物流、庫存、網站和店內運營等各個環節。
■ 對於大部分企業,由於數據分析人員與業務人員之間的彼此視角與思考方向不同,大數據分析和運營之間存在脫節情況,這是大數據無法用於企業運營最大的阻力
■ 對於大多數互聯網公司來說,大數據量、大用戶量是一個相互促進,強者越強的循環過程。
■ 對於大型互聯網平台,大數據已經成為其生態循環中的血液,對於這些企業,最重要
的不是如何利用大數據改進自身運營,而是利用大數據更好地繁榮平台生態。
■ 對於平台企業,它們的大數據策略正逐漸從大數據運營,向運營大數據轉變,前者和
後者的差別在於,前者只是運營改進的動力,而後者則成為企業實現未來戰略的核心資源。
我們都已被反復告知:我們將迎來一個「大數據時代」。
大數據應用,將和雲計算、3D列印這些技術變革一樣,顛覆既有規則,並成為先行企業的制勝關鍵。
與變化相始終的中國企業,距離這場革命還有多遠?而追上領先者又需要多快的步伐?
來自於互聯網、移動互聯網、物聯網感測器、視頻採集系統的數據正海量增長,匯成大數據的海洋,相伴的是海量數據存儲、分析技術的突破性發展,所有這一切都給企業的應用帶來了無限可能性。
許多企業希望將大數據用起來,帶動企業的經營,但不知從哪裡著手。它們不惜重金投資大數據信息系統、分析系統,聘請更多的人才,希望能從這個新趨勢中獲益,不過卻無奈地發現,大數據仍然停留在雲端,沒有帶來多少實際收益。它們找不到大數據與業務結合的突破口。而一些真正將大數據應用於實戰的企業,卻在應用過程中困難重重:大數據無法與業務結合;沒有收集、分析海量數據的能力;經營人員缺少應用大數據的動力;數據來源魚龍混雜難以使用……
中國企業家研究院對當前中國企業大數據應用的狀況進行了歸納分類,以幫助企業了解實際應用大數據時的困局難點,並提供領先企業的典型案例以資借鑒。
表1
表2
大數據運營—企業提升效率的助推力
對於大多數企業而言,運營領域的應用是大數據最核心的應用,之前企業主要使用來自生產經營中的各種報表數據,但隨著大數據時代的到來,來自於互聯網、物聯網、各種感測器的海量數據撲面而至。於是,一些企業開始挖掘和利用這些數據,來推動運營效率的提升。大數據運營應用中,大數據的應用分為三類:用於企業外部營銷、用於內部運營,以及用於領導層決策。
一、大數據營銷
大數據營銷的本質是影響目標消費者購物前的心理路徑,它主要應用在三個方面:1、大數據渠道優化,2、精準營銷信息推送,3、線上與線下營銷的連接。在消費者購物前,通過各種方式,直接介入其信息收集和決策過程。而這種介入,是建立在對於線上與線下海量用戶數據分析的基礎之上。相比傳統狂轟濫炸或等客上門的營銷,大數據營銷無論在主動性和精準性方面,都有非常大的優勢。它是目前主要的大數據應用領域。
大數據營銷不僅僅是用大數據找出目標顧客,向其發布促銷信息,它還可以做到:
實現渠道優化。根據用戶的互聯網痕跡進行渠道營銷效果優化,就是根據互聯網上顧客的行為軌跡來找出哪個營銷渠道的顧客來源最多,哪個來源顧客實際購買量最多,是否是目標顧客等等,從而調整營銷資源在各個渠道的投放。例如東風日產,它利用對顧客來源的追蹤,來改進營銷資源在各個網路渠道如門戶網站、搜索和微博的投放。
精準營銷信息推送。精準建立在對海量消費者的行為分析基礎之上,消費者網路瀏覽、搜索行為被網路留下,線下的購買和查看等行為可以被門店的POS機和視頻監控記錄,再加上他們在購買和注冊過程中留下的身份信息,在商家面前,正逐漸呈現出消費者信息的海洋。
一些企業通過收集海量的消費者信息,然後利用大數據建模技術,按消費者屬性(如所在地區、性別)和興趣、購買行為等維度,挖掘目標消費者,然後進行分類,再根據這些,對個體消費者進行營銷信息推送。比如孕婦裝品牌十月媽咪通過對自己微博上粉絲評論的大數據分析,找出評論有「喜愛」相關關鍵詞的粉絲,然後打上標簽,對其進行營銷信息推送。京東商城副總經理李曦表示:「用大數據找出不同細分的顧客需求群,然後進行相應的營銷,是京東目前在做的事情。」小也化妝品將自身網站作為收集消費者信息的雷達,對不同消費者推薦相應的肌膚解決方案,創始人肖尚略希望在未來,大數據營銷能替代網站的作用,真正成為面向顧客的前端。
打通線上線下營銷。一些企業將互聯網上海量消費者的行為痕跡數據與線下購買數據打通,實現了線上與線下營銷的協同。比如東風日產,線上與線下的協同營銷方式為:其門戶網站帶來訂單線索,而通過這些線索,服務人員進行電話回訪,從而推動顧客在線下交易。在此過程中,東風日產記錄了消費者進入、瀏覽、點擊、注冊、電話回訪和購買各個環節的數據,實現了一個橫跨線上線下,以大數據分析為支持的,營銷效果不斷優化的閉環營銷通路。而國雙科技,衡量某一地區線下促銷活動的效果,就是看互聯網上,來自這個地區對於促銷內容的搜索量。一些企業,通過鼓勵線下顧客使用微信和Wi-Fi等可追蹤消費者行為和喜好的設備,來打通線上與線下數據流,銀泰百貨計劃鋪設Wi-Fi,鼓勵顧客在商場內使用,然後根據Wi-Fi賬號,找出這個顧客,再通過與其它大數據挖掘公司合作,以大數據的手段,發掘這個顧客在互聯網的歷史痕跡,來了解這個顧客的需求類型。
二、大數據用於內部運營
相比大數據營銷,大數據在內部運營中的應用更深入,對於企業內部的信息化水平,以及數據採集和分析能力的要求更高。本質上,是將企業外部海量消費者數據與企業內部海量運營數據聯系起來,在分析中得到新的洞察,提升運營效率。(詳見P96表5:大數據在內部運營中的應用)
表5
三、大數據用於決策
在大數據時代,企業面對眾多新的數據源和海量數據,能否基於對這些數據的洞察,進行決策,進而將其變成一項企業競爭優勢的來源?同大數據營銷和大數據內部運營相比,運用大數據決策難度最高,因為它需要一種依賴數據的思維習慣。
已有少數企業開始嘗試。比如國內一些金融機構在推出一個金融產品時,會廣泛分析該金融產品的應用情況和效果、目標顧客群數據、各種交易數據和定價數據等,然後決定是否推出某個金融產品。
但是,中國企業家研究院在調研中發現,目前中國企業當中,大數據決策的應用非常之少,許多企業領導者進行決策時,仍習慣於憑借歷史經驗和直覺。
大數據產品——企業利潤滋長的新源泉
大數據除了用於運營外,還能夠與企業產品結合,成為企業產品背後競爭力的核心支持或者直接成為產品。提供大數據產品的企業分為兩類,直接提供大數據產品的企業,以及將大數據作為產品和服務核心支撐的企業。前者主要為大數據產業鏈中提供數據服務的參與者,包括數據擁有者、存儲企業,挖掘企業、分析企業等,後者則主要是那些以大數據為產品核心支撐的企業,它們大多是互聯網企業,其產品和服務先天就有大數據基因,這些企業包括搜索引擎、在線殺毒、互聯網廣告交易平台以及眾多植根於移動互聯網之上,為用戶提供生活和資訊服務的APP等。
表3
表4
一、大數據作為產品核心支持
它們主要在以下幾方面使用大數據:
1、提供信息服務。很多互聯網企業通過對海量互聯網信息和線下信息的整合和分析,為個人和企業提供信息服務,典型的如網路、去哪兒、一淘、高德地圖、春雨醫生等等。在美國,一些互聯網企業甚至根據大數據提供更深度的預測信息服務,美國科技創新公司farecast,通過分析特定航線機票的價格,幫助消費者預測機票價格走勢。
2、分析用戶的個性化需求,藉此提供個性化產品和服務,或者實現更精準的廣告。典型的有移動社交工具陌陌、網路、騰訊、廣告交易平台品友互動以及一些互聯網游戲商。這種應用往往先是收集海量用戶的互聯網行為數據,將用戶分類,根據不同類型的用戶,提供個性化的產品,或者提供個性化的促銷信息。比如網易等門戶網站推出了訂閱模式,讓使用者按照個人喜好方便地定製和整合不同來源的信息。
3、增強產品功能。對於很多互聯網產品,如殺毒軟體、搜索引擎等等,海量數據的處理能夠讓產品變得更聰明更強大,如果沒有大數據,產品的功能就大大減弱。比如奇虎360公司的360殺毒軟體,憑借每天海量的殺毒處理,建立了龐大的病毒庫,這使它能夠更快地發現病毒,而一些小的殺毒軟體公司則無法做到這一點。
4、掌控信用狀況,提供信貸服務。阿里巴巴上匯集了海量中小企業的日常資金與貨品往來,通過對這些往來數據的匯總與分析,阿里巴巴能發現單個企業的資金流與收入情況,分析其信用,找出異常情況與可能發生的欺詐行為,控制信貸風險。
5、實現智能匹配。婚戀網站、交易平台等,利用大數據可以進行精準而高效的配對服務。網易花田會挖掘用戶行為數據,比如點擊哪些異性的頁面,發表什麼樣的評論,建立用戶興趣模型,從而挖掘到用戶所期待另一半的類型,然後主動推薦與對方匹配度比較高的人選。2010年,阿里巴巴嘗試性地推出「輕騎兵」服務,由阿里巴巴將中國各產業集群地的供應商與海外買家的個性采購需求進行快速匹配,所憑借的,就是對供應商的海量交易數據信息的整合與挖掘。
大數據作為產品核心支撐的關鍵在於用戶量。對於大多數互聯網公司來說,用戶量越多,收集的數據越多,憑借更多的數據,其產品與商業模式會不斷改進,進而帶來更多的用戶。
二、大數據直接作為產品
對一些企業,大數據直接成為了產品,這些產品包括海量數據、分析、存儲與挖掘的服務等,目前大數據產業鏈正在形成過程中,出現了一批開放、出售、授權大數據和提供大數據分析、挖掘的公司和機構,前者主要是一些擁有海量數據的公司,將數據服務作為新的盈利來源。如大型的互聯網平台、民航、電信運營商、一些擁有大數據的政府機構等等,後者主要包括一些能夠存儲海量數據或者將海量數據與業務場景結合,進行分析和挖掘,或者提供相關產品的公司,如IBM、SAP、拓而思、天睿公司。它們為大數據應用者們提供海量數據存儲、數據挖掘、圖像視頻、智能分析等服務以及相關系統產品。
大數據平台——企業群落繁榮的滋養劑
相對企業本身對大數據的應用,大數據平台更多是利用大數據來搭建企業生態。一些擁有龐大數據資源的大型互聯網平台,已變為包含海量寄生者的生態系統。在這個生態系統中,它們將海量用戶互聯網行為痕跡和分析提供給平台上的企業,用於它們改善經營,推動整個平台生態繁榮,在這一過程中,它們也收取數據服務費。阿里巴巴就是一個典型的例子,從數據魔方、黃金策到聚石塔,阿里巴巴不斷地為平台上中小電商提供數據產品和服務。
而網路已建成了包括網路指數、司南、風雲榜、數據研究中心和網路統計在內的五大數據體系平台,幫助其營銷平台上的企業了解消費者行為、興趣變化,以及行業發展狀況、市場動態和趨勢、競爭對手動向等信息。
而當大數據從企業內部運營的動力,變成平台企業的產品和服務時,平台企業也在經歷著一個從大數據運營到運營大數據的階段。數據從運營的支持工具,變成了生產資料。此前平台們的關注點,更多的是如何用好現有的大數據。而未來,它們的關注點則更多是如何將大數據這個生產資料管理好、經營好,如何更好地為平台上的企業服務。這就涉及到收集的數據質量怎樣?格式標準是否統一?數據作為一種原材料,其精細化程度如何?是否符合平台上企業應用的具體場景?是平台上企業拿來就能用的,還是還需要平台上的企業再加工?
為解決這些問題,各個平台在積極地努力。比如阿里巴巴建立了數據委員會,在統一數據格式標准、從源頭上保證數據的質量,採集和加工出精細化的數據,確保其能符合平台企業的應用場景等方面,不遺餘力地嘗試。尤其在大數據精細化方面,阿里巴巴更是作為其大數據戰略的重點。這方面,騰訊目前也在加快步伐。比如新版騰訊網出現了「一鍵登錄」的提示,用戶可以在上面通過一些細分標簽,訂閱自己關注的內容。實際上,這也是騰訊收集更精細化的用戶興趣數據的一個有效手段。
Tips
大數據實戰手冊
將大數據應用於內部運營中時,企業會遇到一些常見問題
1企業如何獲取與分析數據?
互聯網是大數據的一個主要來源,一些線下的傳統企業很難獲得。但它們可以:
a 和擁有或能抓取海量數據的平台、企業以及政府機構合作。比如淘寶上的電商就購買淘寶收集的海量數據中與自身運營相關的部分,用於自身業務。再如卡夫通過與IBM合作,在博客、論壇和討論版的內容中抓取了47.9萬條關於自己產品的討論信息,通過大數據分析出消費者對卡夫食品的喜愛程度和消費方式。
b 建立自己在互聯網上的平台,比如朝陽大悅城利用自己的微信、微博等平台收集消費者評論數據。
c 許多傳統企業沒有分析海量數據的能力,此時它們可以和大數據分析和挖掘公司合作,目前市場上已經有天睿公司、IBM、百分點、華勝天成等一批提供大數據分析和挖掘服務的公司,它們是傳統企業進行大數據分析可以藉助的力量。
2 如何避免大數據應用時的部門分割?
對於許多企業,其信息流被各部門彼此分割,數據難以互通,對於這種情況下,大數據的共享和匯集就只是一個泡影,更難以實現大數據的深度應用。
要打通部門之間信息分割的局面,首先要建立統一的、集中的數據系統。就像立白信息與知識總監王永紅所說的,「要真正用好大數據,企業要採用大集中的信息系統。」從更深入的角度來談,企業信息流的部門分割,更在於企業部門之間的分割,比如有一些企業的營銷按照渠道分割,導致對於顧客的大數據收集和分析效果大打折扣。
IBM智慧商務技術總監楊旭青認為,「很多時候由於組織結構問題,大數據分析有效性大大降低了。」這就需要組織與流程層面的重新設計,在這方面,阿里巴巴的部門負責人輪崗制度,對於打破部門壁壘無疑是一劑好葯。而一些企業為了打破部門分割,建立了矩陣型的組織結構,強化部門間的橫向合作,這些無疑為大數據的匯集、共享與應用創造了良好條件。
3 如何讓業務人員重視大數據的應用?
解決這個問題,一方面在於一把手對整個企業數據文化的倡導,比如1號店董事長於剛就要求業務人員無論在開會,還是匯報工作時,都以數據說話,而馬雲更是將大數據提升到了戰略高度。
另一方面,也在於數據部門的帶動,阿里巴巴數據委員會負責人車品覺分享了經驗,「因為運營部門的業務人員很難看到大數據的潛力,可以首先從一些對業務見效快,見效顯著的數據項目出發,通過一兩個項目的成功,調動對方的積極性,然後再逐步一個個地引導。」
4 為何大數據工作與運營需求脫節?
這往往是由於數據人員與業務人員視角、專業知識不同而導致的。大數據人員做了很多努力,但是業務人員卻認為這些努力無關痛癢。如何解決這個問題?
有的企業從組織設計上發力,將大數據納入業務分析部門的管理之下,用業務統馭數據。對於朝陽大悅城,由主要負責戰略和經營分析的部門來管理大數據工作,其中的大數據分析人員則作為支持人員。在負責人張岩看來,大數據要靠商業法則指導,關鍵是找到業務需求的點,然後由數據分析和挖掘人員實現。在具體操作中,大悅城對微信的數據挖掘,挖掘什麼樣的關鍵詞,由業務分析人員確定,而具體挖掘則由數據部門做;有的企業從流程設計上著手,推動業務部門與數據部門人員之間的溝通,建立數據人員工作與效果掛鉤的考核機制。
例如阿里巴巴根據數據挖掘的成效(比如帶來的商品轉化率的提升)來考核數據挖掘師,考核數據分析師則看其分析結果能否出現在經營負責人的報告中。從數據部門自身角度則需要降低運營部門使用數據的障礙和門檻,比如立白集團的數據人員會努力嘗試向運營部門提供更易懂、更生動的圖形化數據分析界面,在立白老闆辦公室上,就有一份「客戶運營健康體檢表」,讓老闆對全國經銷商的當月銷售情況一目瞭然。再如阿里巴巴開發的無線Bi,讓經營人員在手機上也可以看到大數據分析結果,拿車品覺的話說,「以數據之氧氣包圍經營人員。」
以上是小編為大家分享的關於大數據攻略案例分析及結論的相關內容,更多信息可以關注環球青藤分享更多干貨
Ⅲ 大數據的「感性」應用
大數據的「感性」應用
通過大數據分析、雲計算等領先技術能力提供社交、移動等數據分析,跟蹤並解析球迷心理,並與媒體緊密結合,將用戶情緒、性格等屬性可視化呈現,產出更易引發用戶共鳴的體驗。
大數據技術已經不是一個新鮮詞兒,它的價值也已被廣泛認可,藉助海量數據的分析利用,能有效幫助企業實現市場動向預測,幫助有效支持市場活動各個階段的不同商業行為決策,還能夠實現追蹤消費者行為,並對其心理甚至下一步行為實現相對精準的預測,產生更好的用戶體驗,滿足目標消費者的多元化需求。
大數據在體育賽事中的應用很常見,在網球賽事中,一發成功率、一發得分率和Ace球是標志球員競技水平的關鍵指標;發球速度、接發球成功率、上網成功率、得分點則突出體現了球員的打法特點。
上述都是來自大數據的直觀應用,教練員和運動員通過每項賽事背後的技術統計來評價本場比賽發揮的好壞。而這些數據也將直接影響教練員對比賽的掌控。
在本屆巴西世界盃,大數據應用又有了新模式——騰訊通過IBM的大數據分析、雲計算等技術提供社交、移動等數據分析,跟蹤並「解析」球迷心理,產出更易引發用戶共鳴的優質內容,為用戶打造全新的體育觀賽體驗。
6月12日,IBM與騰訊達成深度戰略合作,成為騰訊體育社交媒體數據分析合作夥伴。
IBM的大數據技術,從賽事、球迷、文化三大維度,深度挖掘了來自世界盃球迷關注的120個熱點關鍵詞,抓取50萬條主流社交媒體信息,包括球迷話題、球迷類型、個性分析等,並以此為基礎,製作了「世界盃聲量大比拼」、「世界盃飛魚秀」、「算數」、「球迷畫像」等專題欄目,通過數據分析,精準抓住球迷關注熱點,並迅速輸出報道內容。
球迷的另類體驗
在本屆世界盃中,騰訊通過IBM大數據實時分析,打造《世界盃球迷聲量大比拼》欄目,讓球迷即時看到64場比賽中對陣球隊的當前支持率,以及個人喜愛球星的支持率,看到全球有多少人跟自己同歡喜共悲傷,滿足球迷同理心,引發球迷共鳴。
IBM輿情系統實時分析社交媒體上球迷關注點,為「世界盃飛魚秀」欄目提供大量球迷實時狀態,分析球迷心態等數據盤點,呈現蒼老師微博秀力挺德國、內衣模特大拼球技等網路話題,由兩位脫口秀達人說出球迷們的心聲,引發廣大網友共鳴。期間欄目組還邀請了IBM數據工程師前去做客,展示IBM嚴肅的大數據系統如何支持網友娛樂生活的。
根據實時數據反饋,騰訊實時發布共32篇新聞報道,《德國更熱梅西最火球王超高關注率遠勝眾星》、《荷阿大戰遭瘋狂吐槽羅本關注度不及梅西一半》等球迷角度深挖的信息,綜合展示球賽期間球迷心理變化,引發球迷共鳴。單篇新聞最高閱讀量達萬次以上,95%均來自騰訊新聞客戶端。
騰訊體育基於IBM大數據,在世界盃期間輸出80期「算數」報告,深度剖析世界盃的角角落落,從球迷地域分布、性別比例,到歷史上各大洲入圍世界盃成功率等……這些基於大數據而呈現的報道內容,讓球迷看到了一個直觀的數字化的世界盃。
騰訊還策劃了有趣的「球迷畫像」,基於IBM大數據對用戶的多維度分析,總結刻畫了每位球星的球迷性格特徵,對不同球星的粉絲類型加以區分和刻畫,推出了不同球星的粉絲畫像。例如,葡萄牙球星C羅的粉絲70%為女性,她們的個性關鍵詞是「女王范」、「實際」、「有條理」和「欣賞美」。這樣的球迷畫像在騰訊的世界盃專區中定期推出,網友一致熱捧,該畫像成為鑒定自己是真球迷的另類標准。
合作共贏,火花沒那麼簡單
獨特視角的內容背後,是騰訊作為網路媒體在世界盃報道模式上的一次創新,也讓我們看到了大數據實際應用的另一種模式。
記者采訪了大數據提供方IBM品牌戰略部高級經理楊磊,他表示「這是IBM第一次嘗試在足球賽事中用大數據分析來探測球迷的反映,我們希望通過技術融合參與其中,與我們而言是一次露出,對騰訊,我們提供基於大數據分析的用戶洞察,支持騰訊微用戶提供即時感更強的內容」。IBM在1993年就開始進入體育賽事領域,贊助網球賽事,並提供比賽的IT技術支持。2005年,IBM通過SlamTracker追蹤了網球四大滿貫賽事8年來全部8128場比賽,每場比賽收集4100萬個數據點,包括5500個分析模型。與媒體合作,用大數據技術分析探測球迷心理,並產出報道內容,這還是第一次。
此次與騰訊的深度合作,IBM首先看重的是騰訊龐大的用戶基礎與年輕化的用戶屬性,其次是騰訊在重大體育賽事報道中的運營能力、立體報道能力和PC端移動端雙通道能力,這些優勢將有效助力IBM大數據分析的開展和應用實現。
騰訊此次在世界盃報道中,也借大數據之力,大量並及時輸出更貼合網友當下關注的熱點內容,並發揮出網路全媒體平台的優勢,將內容及時輸送到各個媒體平台、移動終端,引發大量網友關注,並幫助品牌廣告主實現了與用戶的深度互動,實現了商業目的。
楊磊表示未來IBM將更多嘗試B2B2C的傳播模式,我們會看到更多大數據應用的場景和模式,開拓更多想像空間。
用科技改善賽事體驗
目前媒體環境,社交、大數據、雲等技術出現,B2B企業已經意識到獨立消費者對企業的巨大影響,B2B企業的傳播方式不再局限於一對一,IBM希望通過消費者的體驗,運用B2B2C的方式讓企業有更多的資訊通過終端觸達消費者。
IBM其實一直致力於用科技來改善體育賽事的一些體驗,在網球、高爾夫球賽事,我們在全球有很多年歷史。但在足球,楊磊IBM品牌戰略部高級經理這次是第一次嘗試用大數據分析來探測球迷對這個賽事的反應。騰訊對於IBM是合適的合作夥伴,用戶基數夠大,用戶屬性年輕化,媒體平台全面,而且對於此次世界盃極其重視,並勇於嘗試。這次合作對彼此都是一個很有趣的嘗試和探索。讓技術與賽事融合,通過騰訊IBM實現品牌露出,對於騰訊則多了一個內容提供方,並且開啟了全新的報道模式,也為球迷帶來了獨特的觀球體驗。
以上是小編為大家分享的關於大數據的「感性」應用的相關內容,更多信息可以關注環球青藤分享更多干貨
Ⅳ 大數據時代帶來更理性、更可靠的決策
大數據時代帶來更理性、更可靠的決策_數據分析師考試
究竟是什麼魔力,讓「大數據」這一概念得到全球各國的普遍關注?到底什麼是「大數據」?它能夠在多大程度上改變我們的生活?在我們尋求對這些重要問題的解答時,牛津大學網路學院互聯網研究所教授維克托·邁爾-舍恩伯格出現在我們的視野中;希望我們對他的采訪,可以幫助讀者們找到這些疑問的答案。
最近一段時間,「大數據」的熱潮席捲全球,正如美國《福布斯》雜志所說的那樣,如今,在瀏覽新聞網站或者參加行業會議時,想看不見或聽不到「大數據」這個詞幾乎不可能。去年,美國6個聯邦政府部門宣布將啟動「大數據研發計劃」,投資超過2億美元以改進從海量和復雜的數據中獲取知識的能力。同時,我國科技部發布的「『十二五』國家科技計劃信息技術領域2013年度備選項目徵集指南」也把大數據研究列在首位。眼下召開的全國「兩會」上,有全國人大代表提出要把發展「大數據」上升為國家戰略。
究竟是什麼魔力,讓「大數據」這一概念得到全球各國的普遍關注?到底什麼是「大數據」?它能夠在多大程度上改變我們的生活?眼前對「大數據」的關注度是否已經過高了呢?在我們尋求對這些重要問題的解答時,英國牛津大學網路學院互連網研究所教授維克托·邁爾-舍恩伯格(Viktor Mayer-Schonberger)出現在我們的視野中,討論「大數據」,他如果不是最合適的人選,也起碼是合適人選之一。
20多年來,維克托一直致力於網路經濟、信息與創新、信息監管、網路規范與戰略管理的研究。還在「大數據」這一概念眾說紛紜時,維克托就已進行了系統深入的研究,2010年,他在英國《經濟學人》雜志上和數據編輯肯尼思·庫克耶一起,發表了長達14頁的大數據專題文章。稱他為最早洞見大數據時代發展趨勢的數據科學家之一,並不為過。
《經濟學人》說,在大數據領域,維克托是最受人尊敬的全方位發言人之一;美國《科學》雜志說,若要發起一場關於這個問題的深入討論,沒有比他更好的發起者了。
除了理論研究以外,維克托還非常接近實戰世界,早在上大學期間,他就先後成立了兩家數據安全和製作反病毒軟體的公司,而在他寫就的《大數據時代》一書中,那些最前沿、最嶄新的大數據應用案例,都得益於他多年來緊跟企業與商業應用的步伐。他的咨詢客戶中,不乏微軟、惠普、IBM、亞馬遜、臉書、推特、VISA等大數據先鋒們。
目前,維克托還是歐盟互聯網官方政策背後的重要制定者與參與者,尤為重要的是,他還任職過新加坡商務部、汶萊國防部、科威特商務部等部門,特別熟悉亞洲信息產業的發展與戰略布局。
希望我們通過電子郵件對維克托的采訪,可以幫助讀者們找到這些疑問的答案。
失去微觀層面上的精確度,為的是獲取宏觀層面上的洞察力
文匯報:今天,「大數據」已經成為全球炙手可熱的詞彙,您是從何時開始關注它的?
邁爾-舍恩伯格:多年來,我一直致力於研究數據在信息經濟的發展中所扮演的重要角色,我與肯尼思·庫克耶(Kenneth Cukier,我的合著者)一起發布了一系列相關研究報告。大約三年前,在我自己組織的一次會議上,我倆都意識到「大數據」的存在已經不僅僅是一種炒作或者什麼宏大的宣言了,而將實實在在地改變我們的工作、生活以及整個社會,於是,我們決定就此專題寫一本書。
文匯報:那麼在您看來,究竟什麼是大數據時代?它和傳統數據時代到底有什麼差別?我們知道,像沃爾瑪這樣的公司早在多年前,就已經將大數據運用到了商業實踐中。
邁爾-舍恩伯格:事實上,過去幾個世紀以來,數據已經在科學家們制定決策的過程中扮演了一定的角色,而過去幾十年間,這一做法又延伸到了一些公司的決策制定過程。但在大數據時代之前,數據是非常匱乏的,我們擁有的數據非常少。因此,我們的決策、我們構建的制度都是建立在這樣一種數據匱乏的基礎上。今天,一切變得非常不同,它體現在三個不同的方面,我們稱之為「更多」、「更亂」和「相關性」。
文匯報:這三個特徵也是您在《大數據時代》一書中非常強調的,它們甚至會顛覆我們過去的整個思維方式。您能否具體描述一下這到底是怎樣的過程?
邁爾-舍恩伯格:好的。我所說的「更多」,是指圍繞任何一個我們想要調查的特定問題,或者是需要我們回答的疑問,我們都可以比過去任何時候獲取更多的數據。在大數據時代,我們可以利用海量的數據得到非常詳盡的見解,這是傳統方法所不能做到的。
可以這么說,大數據時代和傳統數據時代的區別,就像解析度在200萬像素的舊數碼照片,一下子提高到2400萬像素那樣。後者是一個非常非常大的文件,它可以提供更多細節。它可以讓我們不斷放大,看清楚小到顆粒狀的細部,而具有較低解析度的圖像在這些細節方面就會非常模糊。
基因信息就是一個很好的例子。美國有一家叫23andMe的新公司提供個人的DNA測試分析,以發現一些疾病徵兆。它的成本只有兩三百美元,並提醒客戶關注會發展成嚴重疾病的個人癖好。但是公司並不對每個客戶的全基因組進行測序,而是針對已知特徵的位點(經研究得知因某種疾病存在,而可能會出問題的DNA片段)進行比對。這意味著,當一個新的特徵被研究發現時,23andMe公司就不得不再次對客戶的DNA進行測序並建立更完整的檔案。
蘋果公司的史蒂夫·喬布斯嘗試了非常不同的方法。他得了癌症後,就有了自己全部的基因密碼,數十億的鹼基對測序。這花費了他超過10萬美元的成本,但這可以讓醫生完整地洞察他的基因密碼。每當葯物由於喬布斯的癌症病變而失去有效性,他們就可以根據喬布斯特定的基因信息,尋找到有效的替代葯物。遺憾的是,這也沒有保住喬布斯的命,但是在這一過程中獲得的數據,已經延長了他的生命。
由於技術創新,現在收集大量信息的成本變得越來越低。數年前,史蒂夫·喬布斯花費了六位數的金額才做到的事情,今天,不到1000美元就可以獲得同樣的服務了。
而「更亂」指的是,在小數據時代,因為數據是如此稀少,我們可以確保自己收集的每一個數據點都是非常准確的。相比較而言,大數據往往是凌亂和質量參差不齊的。但是,相比以高額代價來保證測量和收集少量數據的精確性,在大數據時代,我們將接受這種雜亂,因為我們通常需要的只是一個大方向,而不是努力了解一種現象的細枝末節。我們並不是要完全放棄精確性,我們只是放棄對精確性的熱衷。我們失去微觀層面上的精確度,為的是獲取在宏觀層面上的洞察力。
電腦翻譯就是其中一個例子。1990年代,IBM的研究人員使用了一套非常精確的文件(加拿大議會記錄的法語和英語版)來訓練計算機。盡管計算機完全按照規則行事,但基於此的翻譯質量卻非常低。然後,谷歌在2006年開始介入這一領域,他們沒有使用來自加拿大政府的幾百萬句標准翻譯,而是使用隨手可得的任何語言。他們在整個互聯網上,利用數十億頁質量參差不齊的翻譯,這些翻譯不怎麼標准——但是,這是一個小的權衡——他們能夠使用的數據大大增加了,結果翻譯質量反而提高了。與更少、更標準的數據相比,更多凌亂的資料完勝了。
「更多」和「更亂」組合到一起,產生了第三個特點,「相關性」,這也是大數據帶給我們的最根本性的轉變。我們的思維將從因果關系轉向相關關系。至今為止的整個人類歷史里,全世界的人們都在尋找事件發生的原因,探尋「為什麼」。但我們對原因的執著探索往往帶領我們走向錯誤的方向。所以,我們建議,在大數據時代,在許多情況下,我們可以僅僅尋找「是什麼」,而不必完全理解「為什麼」。例如,對於大數據的分析中,我們可以發現機器震動中一些非常微小的變化,這些變化表明機器將很快損壞。這使我們能夠在部分機器零件報廢前更換它們,這被稱為「預測性維護」,它可以節省不少錢。但除了提高消費效率,「相關性」還可以做更多的事情。
比如對早產兒而言,即使他們長大成人,這些小寶寶仍舊是非常脆弱的,哪怕是遇上很小的感染。醫生卡羅琳·麥格雷戈研究如何給這些嬰兒最好的生存機會。使用大數據分析,每分鍾可以搜集這些嬰兒超過一千個數據點,麥格雷戈發現一個令人震驚的事實:每當這些早產兒出現非常穩定的標志時,他們的身體其實並不穩定,正在准備發病。有了這方面的知識,她就能在一個非常早期的階段,確定嬰兒是否需要葯物治療,從而挽救更多孩子的生命。
這是典型的大數據應用:醫生麥格雷戈通過更全面的感測器,可以比以往搜集到更多的數據。她也接受,在這種情況下,並不是所有的數據都是准確的,從而也會導致她分析中存在不精確的可能。她把「為什麼」這個問題放在一邊,而用一種更務實的方式來提供幫助,她尋找「是什麼」,這才是一個更好的預見感染的辦法。
我們應該記住:大數據也可以挽救生命。
正確使用大數據,可以改善醫療、教育水平,促進人類發展
文匯報:大數據時代的到來,是否將會引領新一輪的產業革命?我們應該怎樣客觀地看待它的價值?
邁爾-舍恩伯格:大數據將會極大地改變社會生活的方方面面,但是它的價值能否等同於工業革命,這個問題目前還不好說。我個人猜想可能不能,原因是在19世紀初工業革命剛剛開始的時候,經濟發展還處於非常低的水平上,所以相對來說,當時的人們從工業化過程中所能獲得的生活水平的提升是非常巨大的,今天則非常不一樣了。
我們真正想強調的是,大數據時代將推動我們從根本上改變企業的運作方式,以及我們在社會中的生活方式。大數據可以提高人類制定決策的能力,這種提高將是大幅度的。有了大數據,我們不是簡單地提高經濟效率,而是將挽救人類生命,延長我們自己的壽命。我們還將改善教育,促進發展。同樣的道理,我們必須要小心。大數據同樣也有「陰暗面」,正如我們在書中討論的那樣。如果應用錯誤,大數據也可能會化為一個強有力的武器。因此,我們必須確保正確使用大數據。
文匯報:您提到了大數據時代的「陰暗面」,它的到來會加深數字化鴻溝嗎?
邁爾-舍恩伯格:大數據是一個強大的工具。因此,如果我們使用了錯誤的方式,它就可能會加深數字鴻溝。但是,如果我們用得好,相信大數據就可能會改善我們的生活,尤其是對那些不那麼幸運的人而言。在這一點上,你可以把它想像成火、電或是抗生素等等。
文匯報:也就是說,您對大數據的價值認知,是基於一個更長時段的歷史發展。
邁爾-舍恩伯格:如果以非常廣闊的視角來看人類歷史,我認為,人類一直想要理解世界。起初,許多人的「知識」是基於迷信和預感。知識的發展非常慢,人們需要非常深層次的思考,再通過實踐進行檢驗,以確保知識是可用的。
但即使如此,我們的知識仍舊不是百分之百可靠的。例如,19世紀,路易·巴斯德一直在研究狂犬病疫苗,當時有一個被狗嚴重咬傷而染上狂犬病的小孩,父母擔心孩子會死去,懇求巴斯德試試他的試驗性疫苗。巴斯德照做了,孩子活了下來。隨後的慶祝活動上,巴斯德以一個英雄的身份出現,他挽救了年輕孩子的性命。但是事實的確如此嗎?今天,通過更深入的研究,我們知道,在被類似病狗咬到的兒童中,只有25%會感染狂犬病。所以75%的兒童哪怕使用了無效的疫苗,仍舊可以存活下來。這個故事告訴我們,我們以為自己生活在非常科學的世界中,但其實,我們擁有的數據非常少。一種新的治療方法在被證明安全之前,需要做幾十個甚至幾百個醫學實驗來進行測試。但這仍舊太少,人們還是會受到傷害,因為我們依靠的數據太少。在大數據時代,我們可以告別數據匱乏,做出的決策將更理性,更基於事實,當然也更可靠。這是大數據時代帶給我們的希望——更好的決策將會代替我們過往那些可疑的迷信和不可靠的人類預感。
文匯報:我們看到,麥肯錫公司2011年就發布報告推測,如果把大數據用於美國的醫療保健,一年可產生潛在價值3000億美元,用於歐洲的公共管理可獲得年度潛在價值2500億歐元;服務提供商利用個人位置數據可獲得潛在的消費者年度盈餘6000億美元;利用大數據分析,零售商可增加運營利潤60%,製造業設備裝配成本會減少50%。「數據創造價值」的預測已經非常振奮人心。在您看來,大數據是否只是一門價值不菲的生意?
邁爾-舍恩伯格:不,大數據可以做更多。醫療方面,我們前面已經提過,只是分析一些重要的徵兆,早產嬰兒的感染出現明顯症狀的數小時前,醫生就可以預見其生病。
同樣,通過大數據分析,我們也可以找出學校教科書中的哪一部分對學生而言效果最好,也可以找出效果不好的部分。到現在為止,我們只能按照人類的預感,即教師自己判斷學生在理解特定課程時是否會有疑問;但在大數據時代,我們有實際的數據可以參考,例如數據顯示,電子書籍的某些頁面被看過許多遍,因為它讓學生感覺費解,據此可以調整我們的教材。這將從根本上改變教育。
或者舉公共政策為例:Inrix是為智能手機提供導航軟體的公司,它還提供實時的交通數據。之所以能做到這一點,是因為每個用戶本身都成為了交通流量狀況的感測器,把位置和速度信息都發回Inrix公司。這樣一來,就可以給行進在交通堵塞路段周圍的客戶提供良好服務。Inrix公司有一大堆人們的活動數據,這還將有助於城市規劃者了解大家的通勤模式,人們從哪裡出發去工作,然後返回,並建設基礎設施,如道路和鐵路。這是最有效的應用。節省錢的同時,也有利於整個社會的管理。
文匯報:大數據對於商業決策、學術研究乃至國家治理的作用是顯而易見的;但是對日常生活中的普通人而言,他們一定會從中受益嗎?為什麼在大數據時代,還是有不少人主張遠離過載的信息和數據、返璞歸真回到傳統的社群生活之中呢?個人生活空間一定得從「簡單平面」轉變到「多維存在」才有意義嗎?
邁爾-舍恩伯格:千百年來,人類已經經歷的世界,都是在少量數據的基礎上產生很多想法的世界。海員們結束長途航行後回來,地圖才會在這一次經驗的基礎上進行重新繪制。這顯然不會很精確。經過試驗和犯錯的周而復始,人類發展得非常緩慢。但是,當我們只有非常少的數據時,這是理所當然的結果。今天,我們有這么多的數據,難怪人類會不堪重負。但是,現在大數據可以提供幫助。如果人類不太善於消化這些過多的信息,大數據分析可以幫助我們將信息進行過濾,並進一步可視化,使我們能夠輕松地加以使用。
人們尚未普遍具備與大數據時代相匹配的思維和技能
文匯報:有專家認為,大數據的未來是數據的APP(加速並行處理)而非基礎構架;也就是說,僅僅有數據平台和基礎構架是無法創造長期價值的。對此您怎麼看?
邁爾-舍恩伯格:我們認為,大數據時代將至少需要和過去時代一樣多的人的獨創性。同時,巨大的資源才是未來時代的金礦,那些擁有這些數據資源的人將獲得的回報是不可想像的。
文匯報:大數據時代,數據都是透明的,我們如何在保護個人隱私、商業機密和國家安全之間取得平衡?您所謂的「互聯網遺忘運動」會是最佳葯方嗎?
邁爾-舍恩伯格:大數據時代所面臨的挑戰是,我們發現了隱藏在數據背後的價值,所以,保留這些數據,然後一遍遍地重復使用數據,往往成為一種明智的選擇。同時,現行的保護個人隱私的法律,特別在西方,針對的是一個傳統數據的世界,而不是一個大數據世界。這就需要我們在保護隱私的規則方面作出調整。我們建議,可以通過調整相關保護規則來實現這一目標,正像你所提到的,我們可以在一定時間以後,選擇遺忘這些數據。
文匯報:大數據時代是一個海量數據有待處理的時代,同時又是一個海量無用信息需要刪除的時代。這是否就是您在《刪除》一書中強調我們要有所取捨的原因所在?
邁爾-舍恩伯格:是。在某種程度上,大數據本身也可以加強隱私的保護。因為如果有一百萬個數據點,一個單獨的數據點就不再那麼重要了,這和傳統數據時代非常不一樣。隨著時間的推移,忘記其中一些數據,並不會破壞整個大數據的運行和使用。
文匯報:大數據現在在全球究竟發展到了什麼階段?處理大數據的技術是否已經在全世界范圍內普及?
邁爾-舍恩伯格:管理和處理大數據的技術都已經存在了,而且並不是非常昂貴。但是,有一樣東西目前仍舊非常缺乏,那就是我們的思維——以理解數據背後所隱藏的巨大價值,以及提取這種價值的專門技能。今天,全球范圍內,人們還沒有普遍具備這種思維和技能,但是我相信,在未來,這種情況會發生改變。我們預計,世界各地的許多大學將提供針對大數據分析的課程,來培訓大數據時代所需要的技能。
文匯報:歷次產業技術革命,中國似乎都是學習者和模仿者;和上幾輪產業技術革命不同的是,大數據時代,中國幾乎和歐美發達國家同時開始技術研發,中國人口又居世界首位,將會成為產生數據量最多的國家。您看好中國在新時代的發展前景嗎?中國在大數據時代是否有創新和領先的可能?
邁爾-舍恩伯格:是的,我們對此非常樂觀。中國很可能成為大數據這一領域的先驅。在大數據時代,中國有很多優勢:中國人都受過良好的教育,特別是在數學和統計方面(這是非常重要的)。中國是一個巨大的多元化社會,這會創造大量機會來創造大數據這一資源,並建立大數據應用。同樣的道理,對於大數據的蓬勃發展,我們還需要相匹配的思維方式,有嘗試新事物和持續創新的願望,以實證事實來作為我們決策的依據。因此,和許多其他社會一樣,大數據時代的確也會給中國帶來非常大的變化。
以上是小編為大家分享的關於大數據時代帶來更理性、更可靠的決策的相關內容,更多信息可以關注環球青藤分享更多干貨
Ⅳ 阿里的總監將大數據、數字化的經驗,總結成資料干貨,可以收藏
阿里把企業的數字化轉型劃分為「數字化重構」和「數字化增長」兩大類別,這個概念是不是聽著很難懂?
重構,就是轉型嘛;增長,就是更進一步嘛,說白了還是原來的老樣子,換了個解釋而已。
說到數字化轉型,我覺得這是一個非常好的話題,甚至能衍生出很多干貨,無論是傳統企業,還是頂尖的互聯網大公司,如阿里騰訊,老闆都在朝這個方向努力。
所以和大數據有關的知識,還是很有必要學習的。
我給大家整理了很多干貨,我從一個10年從業者和管理者的角度,這份干貨,無論是底層幹活的,中層管控的,上層布局的,都能夠很清楚的學習到。
涉及到的方面還是很廣的:大數據、數倉、中台、AI、IT規劃、大數據平台、BI工具。
我是怎麼總結的?
從架構入手,到每個模塊的分解,再到每個地方的注意點,基本上就行了,太細的也不是通過文字去說清楚的。
只要能做到,看了干貨資料,能對實際工作產生指導,就可以了。
這只是一部分,還有更多,自己來看就好。
Ⅵ 專訪智慧空間龐濤:大數據時代,傳統行業的拓荒者之路
談到大數據,在這個領域比較擅長,並且為我們所熟知的,他們大多是一些互聯網公司,基於大量線上用戶交互作為數據支撐,從而實現精準營銷、提升效率和收益的目的。然而有關線下的數據收集,卻一直是行業的痛點難點所在。
逐鹿網此次對智慧空間CTO龐濤進行了專訪,以期希望能夠通過他們的產品「流量小盒」來幫助大家了解一下關於線下大數據如何被有效收集利用,以及傳統行業在擁抱互聯網時應該如何去面對?
午後的一個下午,我在新中關的星巴克見到了龐濤,他顯得形色匆忙,剛剛去微軟談了有關產品推廣的合作,就風塵僕僕的接受了我的采訪。
接地氣的硬體,智慧空間的客流小盒
龐濤所在的公司叫做智慧空間,在他看來天下熙熙這么多人流,作為一家專注線下大數據收集的企業應該理所應當的區覆蓋所有的地面空間,「我有一種責任幫助所有的地面空間,實現利用大數據來管理客流的一種能力。」
「智慧空間」這家公司在業內並沒有什麼知名度,他們的產品「客流小盒」也因為是2B端的產品,所以並不被用戶所熟知,但這並不妨礙他們在線下大數據方面的成功。
傳統的市場研究是找一個市場調查公司,做一些調查問卷,做一個通過統計學的原理來推斷市場客戶。而客流小盒則是幫助商家收集到足夠多的客流數據,為監測商家的客流量提供解決方案,幫助零售企業更好的實現市場研究。通過一個設備和數據的留存,可以識別出一個精準的用戶。
例如識別出一個客戶後,能識別出一個客戶從9點來到10點走,每5秒刷新一次之後就能識別出這個時間段內客戶一直在留存。如果能在半年內監測到這個客戶平均每個月到店4次,那店家就可以知道這個客戶的價值。客流小盒的覆蓋的半徑大約為30米,能把手機設備的型號識別的特別精準。而其可以利用無線網路監測的道理其實很簡單。
移動互聯網時代到來,每個人都會有手機,這些手機都會發射無線電波。而如果一台設備能夠聽到這個無線電波,同時又能識別這個無線電波,那麼就能夠通過記錄手機的個數,來比較准確的推出客流的個數。我們知道在無線電波傳輸的過程中,一定是帶有硬體的特徵碼,而且這個特徵碼是固定不變的,通過監控這個可以鎖定一個消費者在各個店鋪的消費情況。
客流小盒具體來說是怎樣的一個產品?用通俗的話來說,這是一個監控到店客流的硬體產品,但這或許是我所見到過的最接地氣的硬體了。在前端,客流小盒主要利用經濟成熟的無線wifi技術,識別客戶手機等無線設備,進而可以准確方便地統計客流量、駐留時間、進店率、回頭率等等有價值的數據。在後端,則通過系統後台提供專業易懂的客流相關數據報表,幫助客戶實現線下精準數據與CRM的完美結合,最終達到精準營銷。
現在客流小盒大概已經和五百多家實體店進行了合作,今年的目標是推廣到大概上萬家,推廣主要走2B的渠道,目前它們也已經獲得了天使輪融資。
艱難的前行者,線下數據的拓荒之路
在龐濤看來,互聯網巨頭沒辦法從根本上解決線下店鋪獲取用戶的需求。舉例來說,對一個具體的線下飯店,一天飯店裡來多少人吃飯,誰來你這吃飯,這些人都是什麼樣的人,實際上對於一個實體店鋪,他基本上沒有什麼手段,而所謂巨頭其實也沒辦法解決這種困境。
當然,不少線下店鋪會有一些很笨的手段,但這些手段往往都存在諸多弊端。
首先,存在大量數據缺失,監測無法達到有效的精準度。像Zara的所有門店都放了三路攝像頭,這個用來數到店人數。還有711便利店比較聰明,弄了一個只要計數器,只要你一開門,計數器就會自動加1,開一下就加1。其實商家並不是不想監控這些數,而是監控這些數的手段不夠多。像711這個,一下來了一堆20個人開了一下門,大家一塊監控,就沒辦法精確監控了。攝像頭也有同樣的問題,會出現一個人出現在兩個攝像頭里,被重復計數兩次的現象出現。而圖像識別的精準度又不是很高,這就導致你無法具體計算到底來了多少人。
其次,即使監測到了具體人數,也無法清楚客流動向。店鋪進來了多少人,這只是線下大數據的第一步,對商家來說他們更在意的是消費者最關注的是什麼?他們去了店鋪里的哪些地方,在什麼地方停留時間最長等等,這些數據對線下店鋪來說可以幫助他們迅速的調整商品策略。這種在線上很常見的監測流量的熱力圖,在線下卻沒有一個解決辦法。
最後,到店人數最終的轉化率。這個相信會是所有商家最關心的數據,到店的消費者當中到底哪些去了試衣間試衣服?現在的監控都是通過銷售後的數據,店鋪賣了幾單,這個客單價是多少?但事實上,一個品牌做了很多市場推廣,這個到店其實是有成本的。哪怕是自然流量,那也是支付了高額的成本才能獲得這個好的地段,所以才有了這個流量。商家當然希望能找到一種方法讓用戶獲取成本變得更低。
數據巨頭之戰,合作與競爭的沖突
在龐濤看來,線上的流量都是比較容易被監控的,無論你訪問什麼網頁都可以被監測到。但到了線下,卻往往沒有一個有效的手段去監測線下流量,人來人往、翻台率這種對商家最重要的數據,往往只能粗暴的依賴於售後的數據。
這顯然不是一個正確的事情,龐濤感慨道,「我們應該為線下的商家做點事情」。對於地面上的店鋪來說,它應該有某種手段,把自己的客戶抓住。但從始至終,很多人都會認為收集數據這應該是巨頭做的事情。
但龐濤並不是很認同這點,在他看來,BAT巨頭很多時候確實有這種能力可以幫助線下店鋪,比如阿里巴巴是送給店家路由器、POSS機,但這些巨頭都有一個核心的利益訴求是「線上流量的滯漲,所以需要去從線下抽取流量」,這也是為什麼阿里要收購銀泰的原因。
互聯網巨頭嘗試去做O2O,其實就是出於這個目的。以前是希望能夠從線上覆蓋到線下,但現在希望做的是如何從線下截取流量。它們很多時候會採用所謂的互聯網思維,簡單的來說就說通過低價或者免費來迎合這個市場。但BAT的出發點卻和智慧空間存在很大不同,即便是巨頭免費或者送錢給線下的店鋪,線下商家也不一定願意和巨頭合作。
龐濤表示,「BAT的核心訴求是要從線下的店鋪導流量走,這個是很可怕的。我們是幫助線下店鋪有從線上獲取用戶的能力以及幫助商家學會如何利用大數據做精準營銷。不過線上能力現在還不夠強,所以現在也在和一些線上的商家進行合作,希望打通一些線上的大數據源。一旦和線上的大數據源BAT+京東,他們都是有從線下導流的這種訴求,所以談判極其艱苦。」
線下的店鋪對智慧空間來說是最寶貴的客戶資源,站在客戶的角度來出發,沒辦法上來就把客流導給電商和線上的互聯網巨頭,但這往往又是這些巨頭的基本訴求。某種程度上在獲取線上數據的時候,往往處在一個矛盾的沖突之中,但龐濤表示仍然要堅持以線下的利益為主,「我們至少需要的是讓大家在一個平等的對話上進行流量的互換,這才有意義。否則的話,流量都白送了,線下將要如何立足。」
痛點以及難點,讓手機號成為唯一通行證
覆蓋率、地推成本高、商家合作意願不強等等,這些我們所常見的痛點難點,智慧空間也無法免俗。龐濤表示,現在智慧空間已經和兩個大型的購物中心展開合作,已經上線半年。在一些咖啡館、酒店都有客流小盒的鋪設。
關於監測精準度的問題,我在采訪中提到了一個疑問,簡單的通過「設備」來識別「人」,這會可能會沒辦法識別出「我是誰」。線上線下的會員卡現在都相當流行,這些卡片背後都擁有具體的一些身份特徵信息,年齡、收入、身高等。而客流小盒只能監測到客流量,看上去都是一些無效的流量。
「會員卡的成本太高了」這是龐濤給我的一個有力的回應。電子會員卡所填的信息比較多,當然會更加精準,但建立一套好的會員卡系統,至少需要上百萬,還需要單獨的設備去刷卡去核銷,一張會員卡的成本卡片製作成本就有10元。「大數據的時代,並不是強調這個數據到底有多麼的精準,而是在於獲取這個數據的大家有多大,這才是核心思想」客流小盒希望把手機作為唯一標示後,去再作為身份的唯一標示,最後讓手機號碼變成線下和線上的唯一通行證。
至於如何識別出這些手機號碼,龐濤表示主要通過和相應的廠家合作來結局。通過比對識別出來的特徵碼,和web認證的廠家合作。「我們來數頻次,他們來識別人。這些廠家沒辦法識別出手機的特徵碼,但他們手上有手機號碼。比如說這個店,有500人在,他們知道300個人的號碼。我們通過3次的挖掘,對比特徵碼和手機號碼。我01年給移動做數據挖掘師,打通這些數據,服務於這個商家。」
到最後,無論是線上還是線下完全不用帶一個會員卡了,識別出手機號碼和硬體特徵碼的一個組合,就成為會員體系身份識別的一個重新建立。再結合每5秒掃描獲得的硬體特徵碼,結合演算法識別,布放在各個地方的設備,基本上就能識別出這個用戶住在哪裡?把這些人維護住,這家店的基本命脈就維護住了。這樣來說,線下的店鋪就有一個很好很便宜的工具。
商家的困惑,如何利用線下客流量
這些數據最大的意義就是可以精準的識別出商家的目標客戶,例如在一定時間內監測到一個客戶重復到店兩次,這其實就是一個回頭客。在線上這可以很好的監測,但線下其實商家就很難監測到。
客流小盒每5秒刷新一次,這個號碼只要出現在這個店鋪里,就會在後台每5秒出現一個點,這其實形成了一個基礎數據。一方面可以對客戶進行定位,另外一方面對客戶進行跟蹤,知道客戶去了哪裡,換沒換衣服,有沒有結賬。像Zara這種店,肯定是不能把攝像頭放在試衣間的,這時候監測往往會是一個難點。通過店內的盒子布放進行監控,如果監測到一個客戶去了試衣間,那其實就能初步判斷這個客戶對商家的價值。但現在商家獲取這些數據的代價就是300元。
300元,這是客流小盒現在的售價,商家此外每個月還需支付30元的服務費。不過龐濤表示這30元的服務費並不是強制收取的,而是按照為客戶提供的服務效果收費,例如智慧空間幫助客戶鎖定了5000個客戶,每個客戶找商家收取5毛錢,這些用戶都是商家目標精準客戶,這個值得不值得?
解決了商家在成本上的困惑之後,就是關於收集到的數據如何被利用的問題。龐濤在京東的工作經歷,讓他對電商的那一套非常了解,「我在京東工作的時候會有一個監測線上數據的表,監測到pv、uv等,在618和雙11的時候為什麼可以做到幾分鍾換一件商品,上一雙鞋子5分鍾流量上不來立馬進行更換。在去年雙11的時候,傑克瓊斯花了比以前多一倍的錢,但流量還是來不了。這意味著,線上的流量其實已經到了一個瓶頸期了。無論你再砸多少錢,不會再快速增長了。所以今年無論是京東還是阿里都去線下了,大家看中了線下的客流。」
龐濤認為客戶的需求永遠都是多樣性的,電商會是一個很好的補充,但並不是所有,還是沒辦法完全取代線下。消費者去京東上購買3C產品最核心的因素在於便宜而且能保證,「如果京東比別人貴100元,你試試?之前蘇寧有一段時間保證比京東便宜了100元,後來就搶走了京東很多的貨」
這是所京東要大力發展第三方而不是自營原因,而到了現在京東也無法保證低價優勢了。所以現在無論是線上還是線下,變得殊途同歸。「你能維護住一個客戶的關鍵,不管是線下還是線上,綜合體驗和完整性給人感覺的價值最高才是最好。」
線下流量的正是應該讓商家能夠使得目標受眾感知到良好綜合體驗和性價比。比如說,客流小盒已經監測到一個客戶每個月都會到店幾次,這基本就可以斷定這個客戶應該是商家的忠實VIP。這個時候,可以直接給這個客戶一個8折卡,把這個客戶徹底留存下來。
上面說的這些只是一些初步的數據利用,客流小盒要幫商家解決最重要的兩件事情——拉新和留舊。「我們要把大數據做到很簡答,你不能把大數據做的讓大家看不懂。」通過客流小盒的後台,商家可以很輕松導出數據報表,這個報表可能會包括商場的管理者、日期、進店數、客流數、日總回頭客數、銷售額、客單價等數據。
任何商家都遵循金字塔理念,客流、轉化率、客單價、毛利率,這是企業最關鍵的四個指標,無論是電商還是線下商鋪永遠是遵循這個規律。客流小盒解決的問題是,幫助商家把那些收集不到的信息補全。對商家來說,能收集到的永遠都是客單價和毛利率這些銷售數據,提高商家的數據能力,自然就會幫助商家更好實現留舊。
龐濤表示,目前沒有一個人能夠有所有的數據,而客流小盒抓住了一個核心,你是誰,你從哪裡來,你到哪裡去,我怎麼和你聯系。當覆蓋范圍足夠大的時候,對用戶的畫像就會越來越精準。至於這些數據怎麼使用,還是還要看商家自身的經驗,客流小盒提供的只是一個工具。
「我們能檢測到這個VIP在這個商場待了多長時間,我們可以做一對一的精準營銷。商場10%的大客戶你知道是誰嗎?也是一些企業,他會給企業購買一些福利,采購辦公用品。我們可以幫助店鋪抓住這些客戶,當然這必須要有一些傳統手段,比如人盯人。但如果有我們這個監測系統,他人來了,你過去送一杯汽水,這會不會感覺更好。我們會告訴用戶說,你來我這消費,我們這邊是有專人給你服務的。我們就是幫助線下,婉轉線下。」
關於增量方面,客流小盒的核心關鍵在於同業之間形成一個聯盟。龐濤表示,「A和B兩家客戶都是我的,我不可能把A客戶的數據給B,同樣也不可能把B客戶的數據給A,這是有悖於道德的。但是如果不相互交叉,他們之間的增量從哪裡來呢。那我要同時和A、B兩個談,在這個行業裡面,大家同時分享這個數據,你把你的貢獻出來,他把他的貢獻出來,大家都在一個池子裡面。當然我不告訴任何一個人,這個客戶是從哪裡來的。但這個池子裡面是有這么多客戶供大家使用,共享的,從而你就可以拿到增量。然後就可以對增量進行收費。」
簡單的舉個例子,這里有三家咖啡館,每家300人,總共900人。這900人對他們就是這個商場裡面的目標客戶,但客流小盒不會告訴這些客戶具體屬於哪家店鋪,而只是告訴商家這900人都喜歡喝咖啡,之後比拼的就是這三家咖啡的品質和綜合體驗的自身能力了。
未來、變革、嘗試以及商業模式
線下的大數據,這個事情大家都想做,擺在創業者面前最困難的事情,就是推廣。智慧空間團隊現在有20個人,95%的人是做研發。但早前沒有進行大規模推廣,龐濤認為這是他們的產品做的還不夠完善。
「O2O的概念現在很火,很多人都在做這個事情,但是能夠拿得出這些表的人並不多。誰能給你看,你一家店鋪每天到店的客戶、聯系方式以及這些人是不是你的忠實客戶,沒人能給你看。我們已經在這個行業深耕兩年半了,但一直覺得產品體驗不夠,沒辦法對外宣傳。但現在一直等到這張表出來後,我們覺得可以做一些精準營銷了,所以開始推廣了,領先競爭對手長達2年時間。」
而談到商業模式方面,龐濤表示平台積累的數據不會賣給別人,這並不是因為數據是核心資產,而這個數據真正的擁有者和買單者應該是這個商場,這是智慧空間和電商最大的不同。因為目標很簡單就是幫助線下的商鋪成長,最終分取一些店鋪的營銷費用。所以一開始是幫助商家維系老客戶,這方面可能是不收費的,但當商家希望能夠獲得增量的時候,就會希望商家能夠給一些傭金,這樣就可以覆蓋住成本。
而關於硬體領域最大的成本問題,龐濤表示他們對成本並不是十分敏感。只要數據夠快夠准,即使報價再高,商家還是會買單,B端市場和C端市場最大的差別就在這里。
對龐濤的客流小盒來說,或許最大的風險就是用戶隱私方面的問題。因為當商家獲取到目標客戶的電話號碼時,必然會通過簡訊進行營銷,而這是沒有獲得用戶允許的。這和外面的私人基站性質某種程度上有點類似。
對此龐濤表示,基站有一個致命的問題,它是沒有歷史數據進行比對的,基站是截獲手機信號,那個時候手機是打不出電話的,所以國家在打擊這個事情。而客流小盒不一樣,比如說消費者逛了一家商場的A/B/C三家店鋪,這些都是有特徵的,平台會給消費者推薦相關的東西,而不是簡單粗暴的發送垃圾簡訊。而且推送這個簡訊,並不是平台做的事情,智慧空間沒有商品,給商家推送是無意義的。平台只是賦予商家這種推送的能力,再控制商家,在不準的時候,不會讓他們進行推送,在準的時候可以送出去。
寫到這里,差不多談話也結束了,龐濤對客流小盒未來的發展想的足夠透徹,線下大數據的收集和利用仍然會是一個不小的痛點。客流小盒通過掃描設備特徵碼,識別出用戶的手機號碼,也仍然存在一定的法律風險。但這至少讓我產生了一個思考,互聯網人在宣稱要改造傳統行業之時,真正要解決的是幫助線下企業,而不是從他們身上獲取什麼,這或許才是一條正確的道路。
微信號:hizhulu 微博:逐鹿網
Ⅶ 大數據應用如何開啟新局面
大數據應用如何開啟新局面
隨著大數據應用的經濟社會效應不斷顯現,大數據已經在市場營銷、金融、交通、製造、醫療等各個領域開展試水應用,取得了一定的成果。不過,業界認為我國大數據應用仍處於初級階段,還未形成普遍應用的局面,對大多數企業,特別是傳統領域的企業而言,還未找到有效的應用模式。如何進一步普及大數據應用,通過應用帶動整個產業鏈發展,成為當前迫切需要解決的問題之一。
大數據應用未形成燎原之勢
大數據應用呈散發狀,目前主要集中於互聯網市場營銷場景。
「目前,我國大數據應用仍處於初級階段,《促進大數據發展行動綱要》的出台為我國大數據應用拓展起到了有力的推動作用。」工信部信息化和軟體服務業司司長陳偉近日向《中國電子報》記者這樣表示。他認為,大數據在電子商務領域的應用逐漸增多,成為大數據最成熟的應用模式。
京東通過建立PB級大數據平台,將每個用戶在其網站上的行為數據進行記錄和分析,提高與用戶間的溝通效率、提升用戶體驗。實現了向不同用戶展示不同的內容的效果,帶來了10%的訂單提升。比如提供給推薦搜索調用,針對不同用戶屬性特徵、性格特點或行為習慣在他搜索或點擊時展示符合該用戶特點和偏好的商品,給用戶以友好舒適的購買體驗,能大幅提高用戶的購買轉化率甚至重復購買,提高用戶忠誠度和用戶黏性。基於用戶點擊數據、瀏覽頁面信息等信息的數據模型和數據資源在經過淘寶商城的挖掘和分析之後,向用戶和商家開放了查詢APP。通過數據挖掘和分析為淘寶提供了定向廣告投遞的能力。開放查詢APP則為用戶和商家提供了便捷的選擇服務。淘寶網還建立了「淘寶CPI」,通過採集、編制淘寶上390個類目的熱門商品價格來統計CPI。
不過,研究機構中國信息通信研究院研究成果表明,大數據應用呈散發狀,並沒有形成燎原之勢。目前主要集中於互聯網的市場營銷場景。盡管金融、電信、零售、製造、醫療、交通、物流、IT等行業對大數據應用表現出極大熱情,但目前在媒體和各種論壇上所公開的大數據應用案例仍然非常零散,這表明大家雖然都很關注大數據,但推進實際的應用仍然存在一定的困難。唯一眾多企業都推出或者採納大數據應用的領域是基於互聯網的市場營銷。
另外,從技術角度看,大數據仍以初級應用為主,多數應用仍然使用傳統分析流程和工具,只是擴大了數據的來源、增加了數量。中國信息通信研究院調研發現,與傳統數據分析相比,新的大數據應用雖然開始使用非結構化數據,但在實際應用過程中,這些非結構化數據只是被壓縮、清洗和結構化後,放入傳統的ETL 和分析流程中去。另一些大數據應用通過採用雲存儲和雲處理技術,提高了數據處理效率,從而增加了數據處理的規模,但這些應用也仍然採用原有的ETL和分析流程。缺乏應用模式上的創新,使得目前大數據應用仍停留在初級技術階段。
陳偉也認為,目前我國數據資源建設和應用水平較低。「目前,用戶普遍不重視數據資源的建設,即使有數據意識的機構也大多隻重視數據的簡單存儲,很少針對後續應用需求進行加工整理。數據資源普遍存在質量差,標准規范缺乏,管理能力弱,數據價值難以被有效挖掘利用。」陳偉說。
與新一代信息技術集成應用勢在必行
物聯網、3D列印等新一代信息技術與大數據相互作用,促進應用落地。
業界認為,新一代信息技術與經濟社會各領域的深度融合,引發了數據量的爆發式增長,使得數據資源成為國家重要的戰略資源和核心創新要素。利用大數據分析,能夠總結經驗、發現規律、預測趨勢、輔助決策,充分釋放和利用海量數據資源中蘊含的巨大價值,推動新一代信息技術與各行業的深度耦合、交叉創新。
事實上,國家戰略層面也已經意識到這個趨勢。國務院正式印發的《促進大數據發展行動綱要》指出,推動大數據與新一代信息技術融合發展。抓住互聯網跨界融合機遇,促進大數據、物聯網、雲計算和3D列印技術、個性化定製等在製造業全產業鏈集成運用,推動製造模式變革和工業轉型升級。
記者從工信部獲悉,工信部將組織實施「工業和新興產業大數據工程」,促進大數據、雲計算、工業互聯網、3D列印、個性化定製等的融合集成,推動製造模式變革和工業轉型升級。
對於大數據與新一代信息技術集成應用,三迪時空網路科技股份有限公司董事長李培學在接受《中國電子報》記者采訪時表示,以大數據為中心的3D列印分布式智能製造將是趨勢。在未來的雲智造平台上,任何人即使不具備建模的知識,但只要有創意,就可以和設計師溝通,設計出自己想要的三維模型,然後通過3D列印機來實現,同時,雲智造平台必須能夠確保設計師贏利,設計師的創造力、創意思維才能源源不斷地發揮出來。有了完善的設計師平台,在人群聚集的互聯網上,創新就可以得到實現,有了以3D列印機為工具的分布式製造單元,可以為周邊的普通用戶提供個性化定製的產品,而這一切都基於大數據。
例如,以大數據平台為基礎的3D列印定製鞋是3D列印技術在垂直行業領域中的具體應用。通過對人足部特徵掃描、采樣,將三維數據和人員信息匯聚到數據中心,構建大數據平台,再結合3D列印定製化生產的特點和傳統製造批量生產的優勢,將虛擬的三維數據對象轉化為實體成品。「用戶可以利用大數據平台的查詢檢索功能,找到真正適合自己的鞋類,實現個性化定製;鞋類廠商則可以根據大數據分析,精確地定位消費群體的需求,包括特殊人群的腳型數據,將精確估算出產品的訂單需求,更加精確地批量生產。定製化數據可以跟蹤人們足部生長的階段來進行調整,用戶可以根據數據分析來選擇不同的品牌不同的類型。」李培學表示。
PTC全球副總裁兼中國區總裁壽宇澄在接受《中國電子報》記者采訪時也表示,大數據在物聯網中起到至關重要的作用,相互依賴。
「在製造業一些核心技術領域,例如飛機發動機的研發,我國的研發水平要追上國際先進水平還需要一定的時間積累,但是我們若把信息化擴大到產品全生命周期尤其是重視產品出廠後的流程優化,把產品出廠前的虛擬世界和出廠後的實體世界並行發展,那麼我國的製造業整體實力也能得到有效提升,而物聯網恰恰能實現這一點。物聯網的初衷之一就是把信息化延伸到產品全生命周期,不僅包括研發環節,還包括產品出廠後的流程。當然,物聯網應用的形態也發生了變化。
以前是過程驅動模式,是以企業家的經驗為主,但當企業發展到一定階段,面臨的市場環境更為復雜,企業產生的數據量更大,面對這些龐大的數據,公司管理者很難再像以前那樣以事先定好的流程和經驗進行處理和決策,必須要依靠機器的智能幫助人們進行大數據分析,這就需要數據驅動模式。從流程的驅動變為數據的驅動,產品出廠前以研發為主的數據只是一類數據,但當這類產品出廠後每個產品流向市場後的數據則成幾何規模擴大,這就形成了大數據。這時,企業就需要對這些大量的數據進行分析,從而對公司決策進行支持。
以上是小編為大家分享的關於大數據應用如何開啟新局面的相關內容,更多信息可以關注環球青藤分享更多干貨
Ⅷ 大數據 掌握話語權要關注基礎技術
大數據:掌握話語權要關注基礎技術
《2015年中國大數據交易白皮書》顯示,預計到2020年,中國大數據產業市場規模將是2014年規模的10倍,由2014年的767億元擴大至8228.81億元。全球大數據市場高速增長,已經成為全球IT領域中的增長亮點。在中國盡管大數據仍處於起步階段,但各地發展大數據的積極性較高,行業應用推廣迅速。在這個熱情高漲的大數據市場,中國要想進一步釋放大數據的價值,掌控大數據的技術話語權,必須關注大數據的基礎技術。
眼下,雖然中國對大數據的熱情很高,但我們必須看到目前中國在大數據關鍵技術上的布局其實是有所欠缺的。目前世界各國都在搶先布局大數據的關鍵技術、基礎技術,因為從目前的技術架構和技術基礎來看,用現成的技術來解決大數據的問題還面臨諸多的挑戰。不久前,IBM中國研究院院長沈曉衛接受《中國電子報》記者采訪時坦言,我們要想真正從數據中獲得洞察、獲得價值,需要更高效、更智能的數據處理和分析平台,以及相應的工具。其一,傳統的IT技術,需要有更大的突破。比如物聯網處理系統需要一秒鍾處理上百萬信息,比如對非結構化的數據進行存儲和處理,需要新的技術。其二,需要引入物理模型來模擬物理世界。比如對天氣的理解,比如對疾病的風險控制的理解,比如對智能工廠的理解,都需要構建大量的物理模型,並挑出更合適的模型,對物理世界作出更好的模擬和理解。其三,需要更強大的認知計算,要求認知計算有更強大的自然語言的能力、更強的機器學習能力等。
基於對市場需求和技術趨勢的判斷,事實上國外IT巨頭在大數據的關鍵技術上投入了大量人力、物力和財力來進行關於大數據關鍵技術的研發。我們大家都知道現在談及大數據的利用,一定都會提及開源的Hadoop技術,事實上對於大數據的利用僅僅依靠Hadoop是不夠的。我們朝向產業互聯網推進時面臨非常多的挑戰,我們的計算架構、計算模式也面臨很大挑戰。比如傳統的計算機分析和數據整理方式,首先是收集數據,然後儲存在資料庫程序中,然後在收到請求後搜索這些數據。這是一個高效的處理方式,但卻是一個緊綳的結構,而且通常會造成時間的浪費。而在流計算當中,高級軟體的運演算法則在接收流數據時就開始對其進行分析。流計算在實時數據分析領域具有巨大的應用空間,包括天氣、江河、電力、股票交易等等。但目前,中國的IT產業在流計算方面並沒有太多的話語權。面對大數據的挑戰,有非常多類似流計算的新技術,關鍵技術都需要中國IT企業做更多的布局,只有這樣,我們的大數據發展,大數據利用才不會變成「無根」的產業。
事實上不僅僅是在平台和工具等基礎技術維度,中國要想在大數據領域擁有更大的話語權,更好地釋放數據的價值,還必須在數據模型的維度、在數據科學家等維度進行大量的投入。目前全球前1500強的企業都有自己的數據科學家。據國外職業人士社交網站LinkedIn公布的2014年最受僱主喜歡、最炙手可熱的25項技能,統計分析和數據挖掘技能位列榜首。研究機構Gartner預測,2015年,全球將新增440萬個與大數據相關的工作崗位,25%的組織將設立首席數據官職位。
不久前,阿里雲宣布啟動阿里雲大學合作計劃AUCP,聯合國內8所高校開設雲計算與數據科學專業方向,目標是到大學里培養大數據的科學家。應該說阿里巴巴是國內企業中「大數據意識」覺醒比較早的企業。對於大數據這樣的應用學科的人才培養,需要充分藉助企業的資源。在國外企業中,IBM對於全球大數據的人才培養投入了巨大資源,已與全球1000多所大學一同合作,構建一個輸送數據科學家的「通道」。
推進大數據應用需要大量的數據科學家,需要教育體系更重視大數據的人才培養,需要更多的領先企業參與進來,僅僅有阿里巴巴或者是IBM是遠遠不夠的。
以上是小編為大家分享的關於大數據 掌握話語權要關注基礎技術的相關內容,更多信息可以關注環球青藤分享更多干貨
Ⅸ 大數據之父舍恩伯格:互聯網比你更了解你
大數據之父舍恩伯格:互聯網比你更了解你
牛津大學網路研究院網路監督及管理學教授,研究領域為網路經濟。曾任哈佛大學肯尼迪學院信息監管科研項目負責人,哈佛國家電子商務研究中心網路監管項目負責人;曾任新加坡國立大學李光耀學院信息與創新策略研究中心主任。並擔任耶魯大學、芝加哥大學、弗吉尼亞大學、聖地亞哥大學、維也納大學的客座教授。
有100多篇論文公開發表在《科學》、《自然》等著名學術期刊上,同時也是哈佛大學出版社、麻省理工出版社、通信政策期刊、美國社會學期刊等多家出版機構的特約評論員。
信息權威與顧問,咨詢客戶包括微軟、惠普和IBM等全球頂級企業。早在1986年與1995年就擔任兩家軟體公司的總裁兼CEO,1991年躋身奧地利軟體企業家前5名之列,2000年被評為奧地利薩爾斯堡州的年度人物。
機構和國家政府高層的信息政策智囊,專注於信息安全與信息政策與戰略的研究,是歐盟專家之一,也是世界經濟論壇、馬歇爾計劃基金會等機構的咨詢顧問,先後擔任新加坡商務部高層、汶萊國防部高層、科威特商務部高層、迪拜及中東政府高層的咨詢顧問。
超過兩年沒穿的衣服會送人,拍得不好看的照片要當即刪除
大數據之父舍恩伯格:互聯網比你更了解你
時代周報記者 韓瑋 發自上海
舍恩伯格又要戴著他標志性的約翰·列儂式的圓眼鏡來中國了。
9月25日,時代周報舉辦2015「影響力·中國」秋季峰會,舍恩伯格將受邀出席,講他最擅長的大數據。
最近兩年,這位數據科學領域的權威學者每隔幾個月就會出現在中國,而他所到之處,無不受到媒體、讀者的簇擁。
舍恩伯格之所以在國內名聲大噪,主要是因為他的兩本暢銷書、關於大數據的先河之作—《大數據:一場將改變我們生活、工作和思考方式的革命》(Big Data :A Revolution That Will Transform How We Live, Work, and Think,中文版又名《大數據時代》)以及《刪除:大數據取捨之道》(Delete: The Virtue of Forgetting in the Digital Age)。前者揭示了大數據給人類帶來的巨大改變,後者則嘗試探索大數據時代人類應該如何構建積極而安全的未來。
作為最早洞悉大數據發展趨勢的數據科學家,舍恩伯格在國內受追捧並不奇怪。畢竟,此刻的中國—國務院剛剛印發《促進大數據發展行動綱要》,提出推動大數據發展和應用在未來5-10年逐步實現的目標及主要任務。國內的大數據產業正迎來大發展時期。
而由於大數據太火,在這個新淘金時代,人們對舍恩伯格的興趣不再停留於他的研究,還延伸至他本人以及他獲得一系列學術成就的過程。
恰好,舍恩伯格是個性格有趣而經歷豐富的人。比如,他曾因不想繼承家業而與父親爭執數十年,最終走上學術之路。
代碼少年
「我母親以前經營一家電影院,我每年都會問她,過去一年最好的電影是什麼?她總是說,我知道,是×××。但她總是錯的。」
舍恩伯格常常在演講中提起這個例子,盡管只是為了佐證大多數人都需要數據分析工具這個觀點,但無意間卻把很多人的興趣引向了他的過去。
這位如今在全球數據科學領域極具名望的科學家其實算得上是「富二代」。他出生在距離莫扎特故鄉奧地利薩爾茨堡兩小時車程的一個小鎮上,父親是當地的稅務律師,有自己的事務所;母親則打理著小型電影院、花店等生意。
1966年,舍恩伯格出生那年,他的父親買來了小鎮上的第一台電腦,價格不菲。當時,鎮上所有人都覺得他瘋了,肯定會破產。而這台巨大的個人電腦運轉時發出的嗡嗡聲陪伴了舍恩伯格的整個童年。
小時候,舍恩伯格喜歡看阿斯特麗德·林德格倫的童話書。這位已故瑞典作家最著名的作品是那本充滿想像力的《長襪子皮皮》。而那時的舍恩伯格夢想成為發明家,因為,讓想法變成現實是一件特別誘人的事。
「如果還可以和林德格倫共進午餐,我想問她,她如何激發自身的想像力?愛因斯坦說過,想像力比知識更重要。」舍恩伯格說。
讀書時,舍恩伯格最喜歡的科目是物理和數學,進而又對計算機著迷。十一二歲時,他就想用那台嗡嗡作響的電腦編程。
「當時,只有大學才有計算機,我就去當地大學報了一門編程課。但老師覺得我不可能學會,就讓我自己玩。於是,我便在角落裡自學。」到了高中時期,這位天賦異稟的少年先後在國際物理奧林匹克競賽和奧地利青年程序員競賽中獲了獎。
17歲時,舍恩伯格第一次觸網。當時,他無意間得到一個聲音耦合器,其實不過是簡陋的數據機—使用者得把電話聽筒與之連接,從而激活以聲音傳送方式進行的數據傳輸。
在此之前,舍恩伯格聽說過互聯網,但從沒體驗過。於是,他搗鼓了好幾個月,試掉了一大筆電話費,最終連上了一個提供初級的郵件、論壇等商業在線服務的無線電通訊網站「The Source」。此後,舍恩伯格便一發不可收拾,對網路著了迷。
1986年,年僅20歲、沒讀完大學的舍恩伯格「創業」了—成立殺毒軟體公司Ikarus,並開發了一款當時奧地利最暢銷的軟體Virus Utilities。至今,網路對Virus Utilities的介紹上寫著,這是一款剽悍的殺毒軟體。1991年,年輕的舍恩伯格還被評選為奧地利最頂尖的5位軟體企業家之一。
這段程序員的經歷為舍恩伯格的未來打下了基礎。許多年後,在《大數據時代》這本書中,舍恩伯格寫道,真正的數據科學家是統計學家、軟體程序員、圖形設計師與作家的結合體。
父與子
在舍恩伯格的學術之路上,很難繞開的一個人物,就是買來了小鎮上第一台電腦的父親。
舍恩伯格與父親的關系並不差。至今,他記憶最深的關於父母的細節是,每天晚餐後,父親都會耐心聽他講述那天發生的事以及他的一些想法。舍恩伯格覺得,這是父親的「超能力」。
不過,父親始終不希望舍恩伯格滿腦子想著如何成為計算機學家,盡管他遷就兒子喜歡計算機。這位在小鎮上有頭有臉的稅務律師總在勸說自己的孩子盡早學完法律,繼承家業。在子承父業和投身計算科學之間,舍恩伯格與父親爭執了數十年,直到後者去世。
而在20歲左右的年齡,舍恩伯格還是順從父親,先在奧地利薩爾茨堡大學讀了法學本科。據說,因為法律太無趣,這位學霸硬是在3年半里讀完了7年的書。
接著,父親要求舍恩伯格繼續在法律上深造,但這個年輕人心不甘情不願,於是便賭氣地只申請了一所學校—哈佛。他覺得,自己肯定不會被錄取。
收到錄取通知書那天,舍恩伯格以為是朋友開玩笑,於是按照上面的電話號碼打過去斥責,「這是愚蠢的玩笑!」而電話另一頭卻有聲音說,「不,這里是哈佛。有什麼能幫你嗎?」
這不是舍恩伯格唯一一次「厚積薄發」。其實,在學生時代的大部分時期,舍恩伯格雖然出色,但不是最出色的那個。但到了最後一個學年,他就像突然間開了竅,過去學過的東西頓時「融會貫通」了。於是,出乎所有人包括他自己的意料,他在畢業前的最後一次考試中獲得了學生生涯唯一一次的全A。
而在美國最古老的法學院哈佛法學院,舍恩伯格開始覺得自己學的法律不再像本科時那麼了無生趣。盡管如此,他依然不想學成後接手父親的公司。
有記者采訪舍恩伯格時曾問,「你後來為什麼當上了大學教授?」他說,「我一直想成為發明家,直到我那個一直『逼』我接手家業的父親有天問我,如果不想做稅務律師,你想做什麼時,我才下定決心當大學教授。至少,對於我父母來說,這會是一個比發明家更容易接受、更受人尊敬的工作。」
從哈佛畢業後,舍恩伯格又拿到了薩爾茨堡大學的法學博士以及倫敦政經學院的理學碩士學位,並依照對父親的承諾,在倫敦一所大學謀得了教職。
當時,舍恩伯格的父親面對這樣的局面依然感到有些失落,最後竟然猝然辭世。父親去世的第二天,舍恩伯格選擇離開倫敦,放棄自己的事業和學術,回到自家的鎮子上,做起了以前無數次拒絕的稅務律師。
「我的人生,和大多數人一樣,既是連貫的,同時又屢受波折。我最初喜歡物理、數學,轉而對計算機產生興趣,進而關注數據安全和數據編碼,並喜歡上了研究隱私法、知識產權法以及網路法。依照這個路徑,數據逐漸成為我關注的重點。但我的生活又被一次次打亂。比如,父親的離世讓我放棄了原來的事業規劃,回到了老家;但一年後,我又賣掉父親的公司,艱難地重回學術圈;後來,偶然的機會讓我得以到哈佛大學肯尼迪學院任教。某種意義上說,這些波折給我製造了意想不到的困難,但也帶來了意想不到的機會。」舍恩伯格告訴時代周報記者。
大數據之父
自1998年始,舍恩伯格的學術研究步入正軌。他進入哈佛大學肯尼迪學院任教,並在那裡度過了10年。此後,他曾在新加坡國立大學李光耀公共政策學院做過3年副教授,借機觀察亞洲的信息政策,而今則在牛津大學互聯網研究院擔任治理與監管專業的教授。
這10餘年間,互聯網飛速發展,人們開始使用手機上網、聊天、購物,完成很多過去必須線下操作的事。而這些變化都被舍恩伯格陸續記錄在論著里。
2010年,在舍恩伯格組織的一次研討會上,幾乎所有參會者發言時都開始提及社會運轉模式正在發生某種改變,但誰也說不出這種變化的實質是什麼。當時,《經濟學人》的數據編輯肯尼思·庫克耶(Kenn Cukier)也在會場,他不久前剛做過一期《大數據的沖擊》的特刊報道。
那場研討會後,舍恩伯格與庫克耶進行了很多次深入交談,「然後,我們決定合寫一本書,探討大數據對於當下的意義以及大數據時代的本質」。
2012年12月,舍恩伯格與庫克耶合寫的《大數據時代》出版。這本大數據研究的先河之作不僅廣受媒體好評,還讓舍恩伯格知名度大漲。
在書里,舍恩伯格通過各種例子展現大數據帶來的改變。比如,一家叫Farecast的公司通過近十萬億條價格記錄來預測美國國內航班的票價。到2012年為止,票價預測的准確率達到75%,使用Farecast票價預測工具購買機票的旅客,平均每張機票可節省50美元。
「大數據的核心是預測。它通常被視為人工智慧的一部分,或者說是一種機器學習。但其實,這種定義具有誤導性。大數據不是要教機器像人一樣思考,相反,它是把數學演算法運用到海量數據上來預測事情發生的可能性。」舍恩伯格寫道。
在這本書里,舍恩伯格還提出了一個廣為引用的觀點—大數據關注的不是隨機樣本,而是全體數據;不是精確性,而是混雜性;不是因果關系,而是相關關系。
「具體來說,大數據的目的是全面的數據收集和分析;同時,我們要明白,在數據質量和數據數量之間要有一個平衡,所以,『不是精確性,而是混雜性』,而『不是因果關系,而是相關關系』,這是讓我們意識到,因果關系不再是解釋這個世界的唯一邏輯。」舍恩伯格告訴時代周報記者。
此外,舍恩伯格還是倡導大數據商業應用的第一人。在《大數據時代》中,他指出,如今的數據已經成為一種商業資本、一項重要的經濟投入,可以創造新的經濟利益。而這也是他屢屢被正在大力推動大數據產業發展的中國人當作座上賓的原因之一。
在關注數據的價值之餘,舍恩伯格感興趣的另一重要領域是如何避免數據被濫用。在早於《大數據時代》出版的《刪除:大數據取捨之道》一書中,舍恩伯格提出了數字時代最大的問題:互聯網記住了人們希望自己忘記的東西。當遺忘成為例外,記住變成常態,人類理性決策的能力就會受到威脅。所以,在大數據時代,所有人都應該享受「被遺忘的權利」。
事實上,舍恩伯格本人早早地為自己確立了一套關於刪除的生活准則。比如,那些超過兩年沒穿的衣服會被他送人或處理;那些拍得不好看的照片,他會當即刪除。因為,「如果不刪除,在數字時代,互聯網可能會比你自己更加了解你」。
舍恩伯格這些新穎的想法曾一度讓讀者直呼開了眼界。而目前,他告訴時代周報記者,自己的興趣點轉到了小型無人機上。其實,一直以來,舍恩伯格對飛機駕駛以及基於大數據分析的無人駕駛都頗感興趣。只是不知道,這位數據科學家未來又會在這個問題上帶來怎樣「讓人感覺腦洞大開」的思考。
對話舍恩伯格:
「只要他們不濫用權力,不必對數據寡頭反壟斷」
時代周報記者 韓瑋 發自上海
9月13日,在接受時代周報記者獨家專訪時,舍恩伯格講述了自己對大數據的一些理解,以及收獲這些理解的過程。
影響最深的人是高中物理老師
時代周報:今年暑假,以艾倫·圖靈為原型的傳記電影《模仿游戲》在中國上映,感動了很多人。你看過這部影片嗎?艾倫·圖靈是計算機科學之父,他對你從事數據科學研究是否有影響?
舍恩伯格:我看過這部電影。事實上,很多年前,我就讀過一些圖靈的論著。你可能記得,我以前做軟體公司時就需要編碼,所以,圖靈的書肯定要看。
不過,影響我最深的人不是圖靈,而是我的高中物理老師。他讓我開始接觸到熵的概念、相對論、量子理論等。對於我來說,他就像是為我打開了通往新世界的大門。
時代周報:大家都認為你是當今最重要的數據科學家之一。我特別好奇,大數據給你本人的日常生活帶來改變了嗎?
舍恩伯格:我是大數據服務的「大用戶」。平常,我會戴蘋果手錶,一直以來,它為我的身體健康提供了很多幫助;我也喜歡諸如亞馬遜一類的電子商務公司,同時,還經常使用谷歌地圖。此外,維基網路對我來說是個難得的好幫手,它讓我比過去更加容易獲得有用的信息,對我的幫助很大。
時代周報:我今年曾采訪過暢銷書《大停滯》(The Great Stagnation)的作者、美國經濟學家泰勒·考恩。在談到對大數據的看法時,他告訴我,「大數據被高估了,因為,大多數人都不知道他們手握的這些數據要用來干什麼,企業也一樣。大數據能幫助我們在某些邊緣地帶提高效率,比如針對性的廣告,但它無法改變全局。這其中,最困難的是問對問題,並且找到問題背後特定的模式,再用數據去加以匹配。這非常難以實現。」你認同他的觀點嗎?
舍恩伯格:我非常欣賞泰勒·考恩,《大停滯》是一本很棒的著作。我還曾引用過這本書里的一些觀點。但在大數據的問題上,我覺得他的觀點是錯誤的,或許,這是因為這方面不是他所研究的核心專業領域。
大數據可減少資源不公平的危害
時代周報:現在,大多數行業提起大數據就言必稱「這是一場行業革命,要顛覆過去」。你認為,大數據真的會顛覆那些傳統行業嗎?
舍恩伯格:會的,這種顛覆已經發生,並在快速進行。施樂帕羅奧爾托研究中心前主管約翰·西里·布朗(John Seely Brown)就發現,過去幾十年,超大型企業的壽命正在縮短。與此同時,我們看到,就在最近幾年,大數據驅動、估值達到數百億美元以上的互聯網企業不斷涌現。在人類歷史上,沒有哪個時期在比今天更多的領域,發生比今天更快的變化。
時代周報:目前,中國存在網路、阿里巴巴、騰訊三大互聯網巨頭,分別統治著搜索、電商、社交三個領域,他們不斷吸納著用戶的網上行為數據,幾乎肯定會成為中國的數據寡頭。你認為,在數據層面是否需要反壟斷?
舍恩伯格:我認為必要的一點是,互聯網要對新的創新主體保持開放的狀態。只要大企業不濫用自己的權力,將那些更小但更好的初創企業趕出市場,那麼,他們就不會製造太多的威脅。所以,我更關注的是這些企業的實際行為,而非他們的規模。
時代周報:除了數據,我知道,你還對教育問題有著深入研究。今年1月,你出版了一本名為《與大數據同行:學習和教育的未來》的新書,專門探討大數據研究在教育領域的應用,以求真正實現因材施教。而中國教育的主要問題是教育資源分配不公平,大數據能解決這個問題嗎?
舍恩伯格:大數據不能從根本上消除這種不公平,但是,通過大數據的手段,我們能以相對較低的成本提供高度個性化的教育,從而減少這種不公平帶來的危害。換言之,大數據能讓學生以很低的成本,獲得至少像「私人家教」那樣的訂制教育。所以,大數據可以成為改變整個游戲的因子。
以上是小編為大家分享的關於大數據之父舍恩伯格:互聯網比你更了解你的相關內容,更多信息可以關注環球青藤分享更多干貨
Ⅹ 為何說大數據是「看得見的生產力」(1)
為何說大數據是「看得見的生產力」(1)
有人曾說,未來社會是數據社會;就連阿里巴巴也標榜自己不是電商,而是大數據公司。近日,國務院又剛剛印發《促進大數據發展行動綱要》,提出未來5至10年大數據發展和應用目標。
記者采訪了國家「千人計劃」專家、北京百分點信息科技有限公司創始人蘇萌。作為從事大數據研究和創業多年的學者型企業家,在他眼裡,這些「看不見的大數據」,有著「看得見的生產力」。
大數據把消費者送到商家「碗里來」
還能不能讓人安靜的工作?作為一個網路時代的消費者,你可能經常會有這樣的經歷:忽然有一天心血來潮,特別想買一台微單相機,可是在購物網站上看了半個多小時,還是沒有下單的決心,畢竟不是一個小數目。接著你會發現,在未來幾天上網時,很多網站的插入廣告都會向你推薦那幾款曾經讓你猶豫不決的微單相機,有時候還會推薦一些功能和價格相似,但你卻從來沒有點擊查看過的品牌,引誘你每天都點進去看一下。經過幾天甚至幾周的猶豫,你終於決定下單。
「這就是創業初期幾年我們在做的事情,成立一家基於大數據的個性化推薦引擎技術公司,幫電商發現用戶的潛在需求,變被動接受用戶為主動了解用戶。」蘇萌介紹,對於大多數中小型電商而言,雖然掌握著大量的用戶數據,但是卻並不知道如何去有效應用和分析,將數據轉化為生產力也就更加無從談起。
隨著電商之間的競爭加劇,大數據技術公司的存在價值和專業性也就體現出來了。蘇萌表示,「通過對電商用戶數據的分析建立數據模型,分析消費者的行為軌跡,能夠知道那個用戶更關心價格,哪個用戶更關注性能或外觀,幫商家找到最佳的商品推薦模式,盡量減少無效推薦。」在他看來,做到推薦容易,但是做到精準的個性化推薦則很難,對大數據公司的技術能力要求也就越來越高。
(圖片來自網路)
大數據讓傳統企業成為用戶「肚子里的蛔蟲」
如果認為只有互聯網企業需要大數據服務那就錯了,因為越來越多的企業認識到,發展到最後所有的企業都會成為數字企業,能夠挖掘自身數據的價值,決定著企業運營和發展。
「然而,對大多數傳統企業來說,普遍缺乏對大數據價值的認識,造成數據散落,數據管理技術薄弱,缺少數據應用,在業務發展中,往往偏向於經驗主義而非精準的數據分析。」如今,蘇萌感受到,越來越多的傳統企業意識到數據的價值,因此就給了專業大數據公司與傳統企業合作的契機。
通過與一些3C產品生產企業和汽車製造企業的合作,蘇萌意識到,為傳統企業實現其用戶的標簽化至關重要。傳統企業不像互聯網企業,它需要大數據企業提供給業務人員的是直接的信息指導,來幫助企業的日程運營,對企業的銷售和服務提供直接建議。
「大數據分析能為企業建立一個獨有的『標簽工廠』,通過將繁復的用戶數據高度提煉成一些短語,給用戶打上一個個標簽,成為用戶的身份標示。」蘇萌解釋,如此一來,企業就像成了用戶肚子里的蛔蟲。比如,促銷活動還沒有開始,企業就能知道哪些老用戶和目標用戶對哪種信息更加敏感,更容易出現購買傾向。用戶的數據標簽在售後領域也能夠有效發揮作用,當售後人員接到用戶投訴電話時,能夠迅速掌握用戶的行為特點,提供更具針對性的服務。
以上是小編為大家分享的關於為何說大數據是「看得見的生產力」(1)的相關內容,更多信息可以關注環球青藤分享更多干貨