導航:首頁 > 網路數據 > 大數據牛人

大數據牛人

發布時間:2023-08-20 11:19:40

⑴ 國內有哪些數據分析和數據挖掘的牛人

數據分析牛人 (排名不分先後)一、沈浩老師中國傳媒大學教授,這位老師給我深的印象就是比較喜歡旅遊、愛攝影,除此之外更多的介紹還一下子想不起來。不過在博客分享了很多非常好的數據分析方法、數據可視化等。二、劉萬祥ExcelPro劉萬祥老師,《Excel圖表之道》、《用地圖說話》作者。專注於最專業、有效的商務圖表溝通方法,追求圖表的有效溝通,和專業的商務氣質。三、張文彤老師英德知聯恆市場咨詢有限公司全國技術總監,是國內最早一批玩SPSS之一,前些年在大學從教,現如今投身咨詢行業,在理論功底和SPSS軟體使用有較高的造詣,感興趣的還可以關注下張老師的培訓。四、張磊IDMERSAS公司首席咨詢顧問。現在的分析,不搞點挖掘、模型的,似乎就不夠高級、不夠唬人。這位博主可是數據挖掘的牛人,SAS、SPSS Clementine 的專家顧問啊。五、數據化管理黃老師是零售行業的老前輩,善於發現數據背後的故事,專注數據化管理的咨詢及培訓業務!14年快速消費品、通訊行業的銷售經驗!5年的零售企業《數據化管理》的咨詢顧問、培訓導師六、小蚊子樂園《誰說菜鳥不會數據分析》作者,專注在市場調查研究,SPSS使得很熟練,對PPT、excel也熱愛有加,博客開的似乎很早了,有很多好內容。七、數據挖掘與數據分析知名博客主、微博主,資深數據分析師,多年從事咨詢、互聯網行業數據分析工作,在微博、博客分享了大量干貨。

⑵ 那些從事大數據,人工智慧的牛人,他們是怎麼成長的

其實大數據人工智慧都是練出來的
很多基礎知識在科班已經教了,只是當前應用是新的,只要基礎好,應用都容易出現突破
所以打好基礎是最重要的,越厲害的學校 基礎越扎實

⑶ 大數據時代 無處不在的演算法應用

大數據時代 無處不在的演算法應用
能不能講講演算法在工作中的運用?你個人學習演算法的過程是怎樣的?我對演算法還是有點怕。除此之外,你認為大學是應該多花時間學應用技術還是理論知識呢?
今天就來聊聊我自己學習演算法的過程,以及演算法在實際工作中的應用。
以前,我們認為大數據總是優於好演算法。也就是說,只要數據量足夠大,即使演算法沒有那麼好,也會產生好的結果。
前一陣子「極客時間」 App 發布了一條極客新聞:「演算法比數據更重要,AlphaGo Zero 完勝舊版。」新聞的內容是谷歌人工智慧團隊 DeepMind 發布了新版的 AlphaGo 計算機程序,名為 AlphaGo Zero。這款軟體能夠從空白狀態開始,不需要人類輸入任何命令,便可以迅速自學圍棋,並以 100 比 0 的戰績擊敗了上一代 AlphaGo。
AlphaGo Zero 最大的突破在於實現了「白板理論」。白板理論認為:嬰兒是一塊白板,可以通過後天學習和訓練來提高智力。AI 的先驅圖靈認為,只要能用機器製造一個類似於小孩的 AI,然後加以訓練,就能得到一個近似成人智力,甚至超越人類智力的 AI。
自學成才的 AlphaGo Zero 正是實現了這一理論。AlphaGo 的首席研究員大衛·席爾瓦(David Silver)認為,從 AlphaGo Zero 中可以發現,演算法比所謂的計算或數據量更為重要。事實上,AlphaGo Zero 使用的計算要比過去的版本少一個數量級,但是因為使用了更多原理和演算法,它的性能反而更加強大。
由此可見,在大數據時代,演算法的重要性日漸明晰。一個合格的程序員,必須掌握演算法。
我不知道大家是怎樣一步步開始精通演算法和數據結構的。大二時,我第一次接觸到了《數據結構》,因為從來沒有過這方面的思維訓練,當時的我學習這門課比較費力。那時候接觸到的編程比較少,所以並沒有很多實際經驗讓我欣賞和體味:一個好的數據結構和演算法設計到底 「美」 在哪裡。
開始學習的時候,我甚至有點死記硬背的感覺,我並不知道 「如果不這樣設計」,實際上會出現哪些問題。各種時間和空間復雜度對我而言,也僅僅是一些不能融入到實際問題的數學游戲。至於「每種最壞情況、平均情況的時間空間復雜度與各種排序」,這些內容為什麼那麼重要,當時我想,可能因為考試會考吧。
沒想到後來的時日,我又與演算法重新結緣。可能是因為萊斯大學給的獎學金太高了,所以每個研究生需要無償當五個學期的助教 。好巧不巧,我又被演算法老師兩次挑中當助教。所以,在命運強制下,一本《演算法導論》就這樣被我前前後後仔細學習了不下四遍。這樣的結果是,我基本做過整本書的習題,有些還不止做了一遍。我學習演算法的過程,就是反復閱讀《演算法導論》的過程。
那麼,學習演算法到底有什麼用處呢?
首先,演算法是面試的敲門磚國內的情況我不太清楚,但就矽谷的 IT 公司而言,不但電話面試偏演算法,現場面試至少有兩輪都是考演算法和編程的。
大一些老一些的公司,像谷歌、Facebook、領英、Dropbox 等,都是直接在白板上寫程序。小一些新一些的公司,如 Square、Airbnb 等,都是需要現場上機寫出可運行的程序。Twitter、Uber 等公司則是白板上機兼備,視情況而定。
雖說還有其它考系統設計等部分,但如果演算法沒有打好基礎,第一關就很難過,而且演算法要熟悉到能夠現場短時間內寫出正解,所以很多人准備面試前都需要刷題。
有一次我當面試官,電話面試另外一個人,當時是用 Codepad 共享的方式,讓對方寫一個可運行的正則表達式解析器。45 分鍾過去了,對方並沒有寫出來。我就例行公事地問:「你還有什麼問題想問或者想了解么?」 對方估計因為寫不出程序很有挫敗感,就反問:「你們平時工作難道就是天天寫正則表達式的解析器么?」
一瞬間,我竟無言以對。想了想,我回復說:「不用天天寫。那我再給你 15 分鍾,你證明給我看你還會什麼,或者有什麼理由讓我給你進一步面試的機會?」 對方想了一會,默默掛掉了電話。
老實說,我對目前面試中偏重演算法的程度是持保留意見的。演算法題答得好,並不能說明你有多牛。牛人也有因為不願刷題而馬失前蹄的時候。但是除了演算法測試,顯然也沒有更好的方法佐證候選人的實力;然而怎樣才能最優化面試流程,這也是個討論起來沒完的話題,並且每次討論必定無果而終。
其次,編程時用到的更多是演算法思想,而不是寫具體的演算法說到實際工作中真正需要使用演算法的機會,讓我想一想 —— 這個范圍應該在 10% 的附近遊走。
有些朋友在工作中遇到演算法場景多些,有的少些。更多的時候,是對業務邏輯的理解,對程序語言各種特性的熟練使用,對代碼風格和模式的把握,各種同步非同步的處理,包括代碼測試、系統部署是否正規化等等。需要設計甚至實現一個演算法的機會確實很少,即使用到,現學可能都來得及。
但是熟悉基本演算法的好處在於:如果工作需要讀的一段代碼中包含一些基本演算法思想,你會比不懂演算法的人理解代碼含義更快。讀到一段爛代碼,你知道為什麼爛,爛在哪,怎麼去優化。
當真的需要在程序中設計演算法的時候,熟悉演算法的你會給出一個更為完備的方案,對程序中出現的演算法或比較復雜的時間復雜度問題你會更有敏感性。熟悉演算法你還可以成為一個更優秀的面試官,可以和別的工程師聊天時候不被鄙視。
最後,不精通演算法的工程師永遠不是好工程師當然,除了演算法導論中那些已成為經典的基本演算法以及演算法思想(Divide-and-conquer,Dynamic programming)等,其實我們每天接觸到的各種技術中,演算法無處不在。
就拿人人都會接觸的存儲為例吧,各種不同的資料庫或者鍵值存儲的實現,就會涉及各種分片(Sharding)演算法、緩存失敗(Cache Invalidation)演算法、 鎖定(Locking)演算法,包括各種容錯演算法(多復制的同步演算法)。 雖然說平時不太會去寫這些演算法 —— 除非你恰恰是做資料庫實現的 —— 但是真正做到了解這項技術的演算法細節和實現細節,無論對於技術選型還是對自己程序的整體性能評估都是至關重要的。
舉個例子,當你在系統里需要一個鍵值存儲方案的時候,面對可供選擇的各種備選方案,到底應該選擇哪一種呢?
永遠沒有一種方案在所有方面都是最佳的。就拿 Facebook 開源的 RocksDB 來說吧。了解它歷史的人都知道,RocksDB 是構建在 LevelDB 之上的,可以在多 CPU 伺服器上高效運行的一種鍵值存儲。而 LevelDB 又是基於谷歌的 BigTable 資料庫系統概念設計的。
早在 2004 年,谷歌開始開發 BigTable,其代碼大量的依賴谷歌內部的代碼庫,雖然 BigTable 很牛,卻因此無法開源。2011 年,谷歌的傑夫·迪恩和桑傑·格瑪沃爾特開始基於 BigTable 的思想,重新開發一個開源的類似系統,並保證做到不用任何谷歌的代碼庫,於是就有了 LevelDB。這樣一個鍵值存儲的實現也用在了谷歌瀏覽器的 IndexedDB 中,對於谷歌瀏覽器的開源也提供了一定的支持。
我曾經在文章中提到過 CockroachDB,其實又可以看作是基於 RocksDB 之上的一個分布式實現。從另一個層面上講,CockroachDB 又可以說是 Spanner 的一個開源實現。知道這些,就知道這些資料庫或鍵值存儲其實都同出一系。再來看看 LevelDB 底層的 SSTable 演算法,就知道他們都是針對高吞吐量(high throughput),順序讀 / 寫工作負載(sequential read/write workloads)有效的存儲系統。
當然,一個系統里除了最基本的演算法,很多的實現細節和系統架構都會對性能及應用有很大的影響。然而,對演算法本身的理解和把握,永遠是深入了解系統不可或缺的一環。
類似的例子還有很多,比如日誌分析、打車軟體的調度演算法。
拿我比較熟悉的支付領域來說吧,比如信用卡 BIN 參數的壓縮,從服務端到移動 App 的數據傳輸,為了讓傳輸數據足夠小,需要對數據進行壓縮編碼。
每個國家,比如中國、韓國、墨西哥信用卡前綴格式都不一樣,如何盡量壓縮同時又不會太復雜,以至於影響移動 App 端的代碼復雜度,甚至形成 Bug 等,也需要對各種相關演算法有詳盡地了解,才有可能做出最優的方案。
關於演算法我們來總結一下:
在大數據時代,數據和演算法都同等重要,甚至演算法比計算能力或數據量更為重要。
如何學習演算法呢?讀經典著作、做題,然後在實踐中閱讀和使用演算法。
演算法是面試的敲門磚,可以幫助你得到一份自己喜歡的工作。
寫程序中用到的更多是演算法思想,不是寫具體的演算法。
不精通演算法的工程師永遠不會是一個優秀的工程師,只有對各種相關演算法有詳盡理解,才有可能做出最優的方案。

⑷ 建平台解決企業大數據分析需求

建平台解決企業大數據分析需求

還記得雙十一期間那篇熱傳網文么——《大數據之下,電商會把假貨賣給誰?》,讓大數據再一次成為人們眼中的熱詞。實際上,大數據和我們的工作生活密切相關。在重慶郵電大學,就有這樣一支大數據創新技術分析團隊,在首屆中國「互聯網+」大學生創新創業大賽全國總決賽上獲得全國銀獎。這一期「創新創業在重郵」,讓我們一起了解大數據分析創新團隊和他們的大數據分析平台。
「牛人」聚集團隊共獲百餘獎項
在首屆中國「互聯網+」大學生創新創業大賽全國總決賽上,該團隊「大數據分析中間件平台及應用系統」項目獲得全國銀獎,成為重慶市進入創意組決賽中唯一獲得銀獎的團隊。而同樣在今年舉辦的第十四屆「挑戰杯」全國大學生課外學術科技作品競賽重慶賽區的比賽中,該項目還獲得了特等獎。
這樣一個屢獲大獎項目的背後,有著一個群英薈萃的團隊。團隊成員參與項目研發10餘項;獲得軟體設計師、會計從業資格證等資格認證;獲得第十四屆「挑戰杯」全國大學生課外學術科技作品競賽重慶賽區競賽特等獎等評獎評優100餘項。
說到籌備比賽,團隊負責人之一、計算機學院研二學生李松陽介紹,最困難、記憶最深刻的時期莫過於參加比賽時的前期准備了。因為都是非經濟管理專業的理科生,最棘手的便是寫創業計劃書。起先通過自己查閱相關資料而成稿的計劃書,因為不成熟而被老師批評、重寫。在准備過程中,指導老師們暑假也沒有休息,犧牲休息時間對項目進行指導。經過一次又一次的演練與角逐,大賽前戮力同心,才最終獲得美滿的結果。
「變形金剛」幫助企業做好大數據分析
這樣一個創新項目來自於兩年多前。項目的發起者,重慶郵電大學計算機學院計算機科學與技術專業的研三學生盧星宇說,他跟隨導師在攻克幾個數據分析方面的科研項目時發現,「大數據分析對於各行各業來說都是需要的,但有能力做大數據分析的企業並不多,大多數企業有大量的數據,也有大數據分析的需求,卻因為數據分析與傳統系統的差異,做大數據分析非常困難。」
團隊有多年的雲計算、數據分析沉澱,為什麼不搭建一個大數據分析平台,解決企業的巨大需求呢?在學院支持下,盧星宇組建團隊,開始了研發之路。
「大數據分析中間件平台及應用系統」究竟是什麼?「這個平台實際上是我們開發的一種簡潔、高效、可編程的全新數據分析架構平台,就像是變形金剛。」盧星宇解釋,變形金剛面對不同的戰場(不同企業)便會變換手中的裝備(不同模型),不同的企業、不同種類的大數據分析,需要應用到不同的演算法,而這個平台中搭載了各種演算法,就像一個變形金剛,可以根據現實需要使用相應的武器(演算法和模型)。
將成立公司走上創業之路
目前,這個平台已經聚集了50多種演算法,涵蓋了目前大數據分析需求的大部分標准演算法。而隨著項目的推進,演算法還會不斷增加。「我們這個平台某種意義上說就像淘寶。」盧星宇說,「只是買賣的是演算法,研究者提供演算法和模型,企業通過平台找到自己的需求,由於演算法不是貨物,平台還提供運行演算法的引擎」。目前,平台已經和中國移動研究院合作,進行了關鍵用戶識別、用戶畫像、個性化推薦等系列大數據分析系統,還成功開發出「維度」社交網路分析工具、計程車推薦系統等示範性系統。
關於與企業合作的具體應用場景,盧星宇介紹,通過關鍵用戶識別、用戶畫像、個性化推薦等系列大數據分析,運營商可以通過用戶的大數據,能夠精確地掌握哪些是本行業的價值用戶或潛在價值用戶,再根據分析出的用戶消費行為習慣,選擇不同的營銷方式。「比如有客戶適合被電話銷售,有客戶適合簡訊廣告,還有的人對電子郵件類的營銷並不那麼反感。」
對於今後的發展,盧星宇透露,經過前期市場調研,他們發現大數據分析需求巨大,「我們將著力於幫助中小企業解決大數據分析需求。」盧星宇介紹,他們決定成立公司,目前正在尋找合適的商業模式將科研成果推向市場。

⑸ 國內有哪些數據分析和數據挖掘的牛人

數據分析的頂級牛人,是被各國頂級賭場拉黑名單的。

次一等的,是自己版玩投放做點大家都會但都覺得不權賺錢卻只有他自己能悶聲賺錢的。

再往下,股票證券的自動高頻交易系統,一水的大數據。廣告優化平台,類似芒果移動,mediav這樣的,以及推薦平台 百分點這樣的,靠數據吃飯的公司。

閱讀全文

與大數據牛人相關的資料

熱點內容
win10切換輸入語言 瀏覽:696
haier電視網路用不了怎麼辦 瀏覽:361
蘋果6手機id怎麼更改 瀏覽:179
米家掃地機器人下載什麼app 瀏覽:82
如何在編程貓代碼島20種樹 瀏覽:915
手機基礎信息存儲在哪個文件 瀏覽:726
如何查找手機備份文件 瀏覽:792
內存清理工具formac 瀏覽:323
iphone過濾騷擾電話 瀏覽:981
wap網路如何使用微信 瀏覽:699
手機迅雷應用盒子在哪個文件夾 瀏覽:351
windows8網路連接 瀏覽:442
怎麼快速增加qq群人數 瀏覽:919
錘子視頻播放器文件不存在 瀏覽:707
蘋果手機怎麼清理app緩存 瀏覽:682
花園戰爭2豪華升級包 瀏覽:517
電腦無法向u盤傳輸文件 瀏覽:823
bpn配置文件 瀏覽:932
501完美越獄工具 瀏覽:119
中間夾菜單裡面不能顯示壓縮文件 瀏覽:952

友情鏈接