在學習大數據,教材比較容易找hadoop權威指南就可以,大家一件比較統一。但是視頻教程比較多,也沒看到有公認比較突出的。所以我決定一點點看並把感想分享在這里。
1,馬士兵老師的Hadoop教程以及相關大數據教程
我剛看完,實在斗魚直播上進行的,所以含有大量冗餘。但是作為入門教程是十分合適的。首先因為馬士兵老師是個明白人,說話都准確干練,入門的思路也很簡單。
看完這個教程可以搭建一個集群環境,並且進行文件上傳管理,一個maprece的例子。學完應該對HDFS,MapRece,Yarn三個主要模塊有個比較清晰的認識。
2,尚學堂肖斌的hadoop100課,正在看
目前感覺比較啰嗦,也不是沒用,只是不太適合我。重點不夠精煉,看完之後在做評價。
㈡ 怎樣進行大數據的入門級學習
一、整體了解數據分析——5小時
新人們被」大數據「、」人工智慧「、」21世紀是數據分析師的時代「等等信息吸引過來,立志成為一名數據分析師,於是問題來了,數據分析到底是干什麼的?數據分析都包含什麼內容?
市面上有很多講數據分析內容的書籍,在此我推薦《深入淺出數據分析》,此書對有基礎人士可稱消遣讀物, 但對新人們還是有一定的作用。閱讀時可不求甚解,重點了解數據分析的流程、應用場景、以及書中提到的若干數據分析工具,無需糾結分析模型的實現。5個小時,足夠你對數據分析工作建立初步的印象,消除陌生感。
二、了解統計學知識——10小時
15個小時只夠你了解一下統計學知識,作為入門足夠,但你要知道,今後隨著工作內容的深入,需要學習更多的統計知識。
本階段推薦書籍有二:《深入淺出統計學》《統計學:從數據到結論》,要了解常用數理統計模型(描述統計指標、聚類、決策樹、貝葉斯分類、回歸等),重點放在學習模型的工作原理、輸入內容和輸出內容,至於具體的數學推導,學不會可暫放一邊,需要用的時候再回來看。
三、學習初級工具——20小時
對於非技術類數據分析人員,初級工具只推薦一個:EXCEL。推薦書籍為《誰說菜鳥不會數據分析》,基礎篇必須學習,提高篇不一定學(可用其他EXCEL進階書籍),也可以學習網上的各種公開課。
本階段重點要學習的是EXCEL中級功能使用(數據透視表,函數,各類圖表適用場景及如何製作),如有餘力可學習VBA。
四、提升PPT能力——10小時
作為數據分析人員,PPT製作能力是極其重要的一項能力,因此需要花一點時間來了解如何做重點突出,信息明確的PPT,以及如何把各類圖表插入到PPT中而又便於更新數據。10個小時並不算多,但已經足夠(你從來沒做過PPT的話,需要再增加一些時間)。具體書籍和課程就不推薦了,網上一抓一大把,請自行搜索。
五、了解資料庫和編程語言——10小時
這個階段有兩個目標:學習基礎的資料庫和編程知識以提升你將來的工作效率,以及測試一下你適合學習哪一種高級數據分析工具。對於前者,資料庫建議學MySQL(雖然Hadoop很有用但你不是技術職位,初期用不到),編程語言建議學Python(繼續安利《深入淺出Python》,我真沒收他們錢……)。資料庫學到聯合查詢就好,性能優化、備份那些內容用不到;Python則是能學多少學多少。
六、學習高級工具——10小時
雖然EXCEL可以解決70%以上的問題,但剩下30%還是需要高級工具來做(不信用EXCEL做個聚類)。高級分析工具有兩個選擇:SPSS和R。雖然R有各種各樣的好處,但我給的建議是根據你在上一步中的學習感覺來定學哪一個工具,要是學編程語言學的很痛苦,就學SPSS,要是學的很快樂,就學R。不管用哪一種工具,都要把你學統計學時候學會的重點模型跑一遍,學會建立模型和小幅優化模型即可。
七、了解你想去的行業和職位——10+小時
這里我在時間上寫了個」+「號,因為這一步並不一定要用整塊時間來學習,它是貫穿在你整個學習過程中的。數據分析師最需要不斷提升的能力就是行業和業務知識,沒有之一。你將來想投入哪個行業和哪個職位的方向,就要去學習相關的知識(比如你想做網站運營,那就要了解互聯網背景知識、網站運營指標體系、用戶運營知識等內容)。
八、做個報告——25小時
你學習了那麼多內容,但現在出去的話你還是找不到好工作。所有的招聘人員都會問你一句話:你做過哪些實際項目?(即使你是應屆生也一樣) 如果你有相關的項目經驗或者實習經驗,當然可以拿出來,但是如果沒有,怎麼辦?答案很簡單,做個報告給他們看,告訴招聘者:我已經有了數據分析入門級(甚至進階級)職位的能力。同時,做報告也會是你將來工作的主要內容,因此也有可能出現另外一種情況:你費盡心血做了一個報告,然後發現這不是你想要的生活,決定去干別的工作了……這也是件好事,有數據分析能力的人做其他工作也算有一項優勢。
㈢ 大數據入門需學習哪些基礎知識
前言,學大數據要先換電腦:
保證電腦4核8G內存64位操作系統,盡量有ssd做系統盤,否則卡到你喪失信心。硬碟越大越好。
1,語言要求
java剛入門的時候要求javase。
scala是學習spark要用的基本使用即可。
後期深入要求:
java NIO,netty,多線程,ClassLoader,jvm底層及調優等,rpc。
2,操作系統要求
linux 基本的shell腳本的使用。
crontab的使用,最多。
cpu,內存,網路,磁碟等瓶頸分析及狀態查看的工具。
scp,ssh,hosts的配置使用。
telnet,ping等網路排查命令的使用
3,sql基本使用
sql是基礎,hive,sparksql等都需要用到,況且大部分企業也還是以數據倉庫為中心,少不了sql。
sql統計,排序,join,group等,然後就是sql語句調優,表設計等。
4,大數據基本了解
Zookeeper,hadoop,hbase,hive,sqoop,flume,kafka,spark,storm等這些框架的作用及基本環境的搭建,要熟練,要會運維,瓶頸分析。
5,maprece及相關框架hive,sqoop
深入了解maprece的核心思想。尤其是shuffle,join,文件輸入格式,map數目,rece數目,調優等。
6,hive和hbase等倉庫
hive和hbase基本是大數據倉庫的標配。要回用,懂調優,故障排查。
hbase看浪尖hbase系列文章。hive後期更新。
7,消息隊列的使用
kafka基本概念,使用,瓶頸分析。看浪尖kafka系列文章。
8,實時處理系統
storm和spark Streaming
9,spark core和sparksql
spark用於離線分析的兩個重要功能。
10,最終方向決策
a),運維。(精通整套系統及故障排查,會寫運維腳本啥的。)
b),數據分析。(演算法精通)
c),平台開發。(源碼精通)
自學還是培訓?
無基礎的同學,培訓之前先搞到視頻通學一遍,防止盲目培訓跟不上講師節奏,浪費時間,精力,金錢。
有基礎的盡量搞點視頻學基礎,然後跟群里大牛交流,前提是人家願意,
想辦法跟大牛做朋友才是王道。
㈣ 入門大數據需要學習什麼內容
作為一名零基礎學習者,請不要將大數據開發看做一門與Java、python等相似的IT語言,大數據更像是一門技術,其所包含的內容相對比較多。在正式開始學習之前,可以買一些大數據相關書籍或者找一些網上的學習資料,先建立對行業以及對大數據相關職位的了解。
比如,大數據分為哪些發展方向,不同的發展方向對應哪些發展職位,各個職位的發展所要求的核心技能點是什麼,企業對於大數據人才的需求是什麼樣的,了解清楚了這些,才能真正考慮清楚,學什麼怎麼學。
以大數據開發來說,其中涉及到的主要是大數據應用開發,要求一定的編程能力,在學習階段,主要需要學習掌握大數據技術框架,包括hadoop、hive、oozie、flume、hbase、kafka、scala、spark等等……
以大數據分析來說,有主攻業務運營方面的數據分析師,也有主攻機器學習、深度學習等的數據挖掘師,具體到其中的各個職位,更是有著更加具體的技能要求,那麼在學習階段就要先做好相關的准備了。
關於入門大數據需要學習什麼內容,青藤小編就和您分享到這里了。如果您對大數據工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於數據分析師、大數據工程師的技巧及素材等內容,可以點擊本站的其他文章進行學習。
㈤ 求黑馬程序員大數據視頻教程,入門的就行!
大數據課程是有些難度的,建議還是實踐和理論課一起進行,可以多了解幾家綜合比較一下,利用空閑時間專門學習。我目前看的是黑馬程序員大數據的視頻,感覺入門很不錯的。
㈥ 大數據怎麼學習
興趣是第一老師。選擇學習一門課程和技能時,個人興趣是至關重要,對於學習像大專數據這樣抽象的技能更是如屬此。
學習Java語言和Linux操作系統,這兩個是學習大數據的基礎。
最關鍵的是學習Hadoop+spark,掌握大數據的收集、生成、調用工具。
樹立大數據思維,創造性開發、使用大數據。
深度了解大數據的意義、價值、市場、開發及運用前景。
到大數據管理中心、運用企業實習實踐,掌握開發、運用技能。
㈦ 0基礎自學大數據哪裡找視頻教材
零基礎想要學習大數據,講真,真的還是一件困難的事,不過人生就是這樣,只有你越過更大的困難,才知道自己會有更大的收獲。就像現在的大數據行業,人人都說大數據行業好,薪資高,但是你看到過每一個學習大數據的學生為此付出的慘痛經歷嗎?你看到過大數據工程師曾經日夜苦讀、鑽研書籍和教程嗎?付出不一定有回報,但不付出一定不會有回報,想要更大的收獲,先來收下這波大數據書籍和視頻教程吧!
一、大數據書籍推薦:
1、《為數據而生》
書中分別闡述在大數據1.0、大數據2.0和大數據3.0時代下,相對應的數據分析需要做到分析、外化、集成。
2、《智能時代》
這本書作者分七章從不同角度對大數據進行介紹,分別以技術和思維方式的改變為主線,從工業革命這個角度嵌入,順理成章的延伸出大數據與智能化,但是沒有將過多筆墨放在技術的深究上,而是選擇從應用層面體現大數據的理念。大數據應用則會滲透到各行各業,這正是作者的用心之處。
3、《R語言預測實戰》
R語言橫跨了金融、生物、醫學、互聯網等多個領域,主要用於統計、建模及可視化。由於上手快、效率高,備受技術人員青睞。預測是大數據挖掘的主要作用之一,藉助R語言來做大數據預測,可以兼具效率與價值於一身。
3、《數據之巔》
這本書中,從小數據時代到大數據的崛起,作者以宏大的歷史觀、文化觀、大數據觀,給我們描繪了一幅數據科學、智慧文化的全景圖。
4、《Hadoop權威指南》
《Hadoop權威指南(中文版)》從Hadoop的緣起開始,由淺入深,結合理論和實踐,全方位地介紹Hadoop這一高性能處理海量數據集的理想工具。
5、《Hive編程指南》
《Hive編程指南》是一本Apache Hive的編程指南,旨在介紹如何使用Hive的SQL方法HiveQL來匯總、查詢和分析存儲在Hadoop分布式文件系統上的大數據集合。
大數據視頻教程
對於零基礎想學大數據的同學,小編不建議你一上來就接觸大數據,你和大數據的近距離接觸還有一個門檻,那就是編程語言的學習,學習大數據的首要綱領,就是熟練掌握一門編程語言。小編咨詢了千鋒大數據講師,當前大數據所運用的編程語言基本都是java,也會涉及到Python、Scala編程語言,所以先從掌握一門編程語言學起吧!
java全套視頻教程總目錄
python最新基礎視頻教程
進行完大數據編程語言的學習,這時候你就可以真正的接觸大數據技術知識了,我們知道大數據以Hadoop、spark、storm等核心技術組成,自然也會以此為重點突破。
大數據教程:Spark基礎及源碼分析
大數據課程:hadoop生態圈視頻
㈧ 求大數據視頻教程,小白入門的
大數據hadoop入門精講
資料鏈接:https://pan..com/s/1smCTwRj 密碼:vp5v
目錄