1. 數據挖掘好學嗎
其實還是要看個人的學習能力和吸收能力,以及能不能堅持。如果計算機、統計學方面基礎比較弱,那麼學習起來難度會比較大,但是如果能堅持學下來,還是可以掌握的。
很多人認為數據挖掘必須掌握復雜高深的演算法,需要掌握技術開發,才能夠把數據挖掘分析做好,其實不需要這么復雜。如果過於鑽研復雜演算法和技術開發,只可能讓你走火入魔,並且效果也不大。在公司實際工作中,最好的大數據挖掘工程師必然是最熟悉和理解業務的人。學習數據挖掘一定要結合實際業務背景和案例背景,這樣才是以解決問題為導向的學習方法。
關於數據挖掘的相關學習,推薦CDA數據師的相關課程,課程內容兼顧培養解決數據挖掘流程問題的橫向能力以及解決數據挖掘演算法問題的縱向能力。要求學生具備從數據治理根源出發的思維,通過數字化工作方法來探查業務問題,通過近因分析、宏觀根因分析等手段,再選擇業務流程優化工具還是演算法工具,而非「遇到問題調演算法包」點擊預約免費試聽課。
2. 數據挖掘什麼軟體簡單
數據挖掘用什麼軟體
1.R是用於統計分析和圖形化的計算機語言及分析工具;
2.Weka可能是名氣最大的開源機器學習和數據挖掘軟體,但用起來並不方便,界面也簡單了點;
3.Tanagra 是使用圖形界面的數據挖掘軟體;4.RapidMiner現在流行的滾返罩勢頭在上升,但它的操作方式和商用軟體差別較大,不支持分析流程圖的方式,當包含的運算符比較多的時候就不容易查看了;
5.KNIME和Orange看起來都不錯,Orange界面看上去很清爽,但我發現它不支持中 文。推薦KNIME,同時安裝Weka和R擴展包。
對於普通用戶可以選 用界面友好易於使用的軟體,對於希望從事演算法開發的用戶則可以根據軟體開發工具不同(java、R、C++、Python等)來選擇相應的軟體。
求推薦簡單好用的數據挖掘軟體 10分
那肯定是SPSS啊,網上自學教程也一堆,如果你不追求特別專業的,只是想數據可視化的基礎上有意思數據挖掘的功能,也可以用watson *** ytics,它還支持自然語言呢
常用的數據挖掘工具有哪些
RapidMiner、R、Weka、KNIME、GGobi、Orange,都是優秀的挖掘工具,可以依據自己的需要選擇。
常用數據挖掘工具有哪些
EXCEL MATLAB Origin 等等
當前流行的圖形可視化和數據分析軟體有Matlab,Mathmatica和Maple等。這些軟體功大鬧能強大,可滿足科技工作中的許多需要,但使用這些軟體需要一定的計算機編程知識和矩陣知識,並熟悉其中大量的函數和命令。而使用Origin就像使用Excel和Word那樣簡單,只需點擊滑鼠,選擇菜單命令就可以完成大部分工作,獲得滿意的結果。 但它又比excel要強大些。一般日常的話可以用Excel,然後載入宏,裡面有一些分析工具,不過有時需要資料庫軟體支持
學習數據挖掘一般要學哪些軟體和工具
1、WEKA
WEKA 原生的非 Java 版本主要是為了分析農業領域數據而開發的。該工具基於 Java 版本,是非常復雜的,並且應用在許多不同的應用中,包括數據分析以及預測建模的可視化和演算法。與 RapidMiner 相比優勢在於,它在 GNU 通用公共許可證下是免費的,因為用戶可以按照自己的喜好選擇自定義。
WEKA 支持多種標准數據挖掘任務,包括數據預處理、收集、分類、回歸分析、可視化和特徵選取。添加序列建模後,WEKA 將會變得更強大,但目前不包括在內。
2、RapidMiner
該工具是用 Java 語言編寫的,通過基於模板的框架提供先進的分析技術。該款工具最大的好處就是,用戶無需寫任何代碼。它是作為一個服務提供,而不是一款本地軟體。值得一提的是,該工具在數據挖掘工具榜上位列榜首。另外,除了數據挖掘,RapidMiner 還提供如數據預處理和可視化、預測分析和統計建模、評估和部署等功能。更厲害的是它還提供來自 WEKA(一種智能分析環境)和 R 腳本的學習方案、模型和演算法。
RapidMiner 分布在 AGPL 開源許可下,可以從 SourceForge 上下載。SourceForge 是一個開發者進行開發管理的集中式場所,大量開源項目在此落戶,其中就包括 *** 使用的 MediaWiki。
3、NLTK
當涉及到語言處理任務,沒有什麼可以打敗 NLTK。NLTK 提供了一個語言處理工具,包括數據挖掘、機器學習、數據抓取、情感分析等各種語言處理任務。
而您需要做的只是安裝 NLTK,然後將一個包拖拽到您最喜愛的任務中,您就可以去做其他事了。因為它是用 Python 語言編寫的,你可以在上面建立應用,還可以自定義它的小任務。
4、Orange
Python 之所以受歡迎,是因為它簡單易學並且功能強大。如果你是一個 Python 開發者,當涉及到需要找一個工作用的工具時,那麼沒世御有比 Orange 更合適的了。它是一個基於 Python 語言,功能強大的開源工具,並且對初學者和專家級的大神均適用。
此外,你肯定會愛上這個工具的可視化編程和 Python 腳本。它不僅有機器學習的組件,還附加有生物信息和文本挖掘,可以說是充滿了數據分析的各種功能。
5、KNIME
數據處理主要有三個部分:提取、轉換和載入。 而這三者 KNIME 都可以做到。 KNIME 為您提供了一個圖形化的用戶界面,以便對數據節點進行處理。它是一個開源的數據分析、報告和綜合平台,同時還通過其模塊化數據的流水型概念,集成了各種機 器學習的組件和數據挖掘,並引起了商業智能和財務數據分析的注意。
KNIME 是基於 Eclipse,用 Java 編寫的,並且易於擴展和補充插件。其附加功能可隨時添加,並且其大量的數據集成模塊已包含在核心版本中。
6、R-Programming
如果我告訴你R項目,一個 GNU 項目,是由 R(R-programming簡稱,以下統稱R)自身編寫的,你會怎麼想?它主要是由 C 語言和 FORTRAN 語言編寫的,並且很多模塊都是由 R 編寫的,這是一款針對編程語言和軟體環境進行統計計算和制圖的免費軟體。
R語言被廣泛應用於數據挖掘,以及開發統計軟體和數據分析中。近年來,易用性和可擴展性也大大提高了 R 的知名度。除了數據,它還提供統計和制圖技術,包括線性和非線性建模,經典的統計測試,時間序列分析、分類、收......
學習數據挖掘一般要學哪些軟體和工具
1、WEKA
WEKA 原生的非 Java 版本主要是為了分析農業領域數據而開發的。該工具基於 Java 版本,是非常復雜的,並且應用在許多不同的應用中,包括數據分析以及預測建模的可視化和演算法。與 RapidMiner 相比優勢在於,它在 GNU 通用公共許可證下是免費的,因為用戶可以按照自己的喜好選擇自定義。
WEKA 支持多種標准數據挖掘任務,包括數據預處理、收集、分類、回歸分析、可視化和特徵選取。添加序列建模後,WEKA 將會變得更強大,但目前不包括在內。
2、RapidMiner
該工具是用 Java 語言編寫的,通過基於模板的框架提供先進的分析技術。該款工具最大的好處就是,用戶無需寫任何代碼。它是作為一個服務提供,而不是一款本地軟體。值得一提的是,該工具在數據挖掘工具榜上位列榜首。另外,除了數據挖掘,RapidMiner 還提供如數據預處理和可視化、預測分析和統計建模、評估和部署等功能。更厲害的是它還提供來自 WEKA(一種智能分析環境)和 R 腳本的學習方案、模型和演算法。
RapidMiner 分布在 AGPL 開源許可下,可以從 SourceForge 上下載。SourceForge 是一個開發者進行開發管理的集中式場所,大量開源項目在此落戶,其中就包括 *** 使用的 MediaWiki。
3、NLTK
當涉及到語言處理任務,沒有什麼可以打敗 NLTK。NLTK 提供了一個語言處理工具,包括數據挖掘、機器學習、數據抓取、情感分析等各種語言處理任務。
而您需要做的只是安裝 NLTK,然後將一個包拖拽到您最喜愛的任務中,您就可以去做其他事了。因為它是用 Python 語言編寫的,你可以在上面建立應用,還可以自定義它的小任務。
目前業界常用的數據挖掘分析工具有哪些
數據分析的概念太寬泛了,做需要的是側重於數據展示、數據挖掘、還是數據存儲的?是個人用還是企業、部門用呢?應用的場景是製作簡單的個人圖表,還是要做銷售、財務還是供應鏈的分析?
那就說說應用最廣的BI吧,企業級應用,其實功能上已經涵蓋了我上面所述的部分,主要用於數據整合,構建分析,展示數據供決策分析的,譬如FineBI,是能夠」智能」分析數據的工具了。
哪個軟體建立資料庫比較簡單好用
隨著數據大數據的發展,數據安全已經上升到一個很高的高度。隨著國家對數據安全的重視,國產資料庫開始走進中國個大企業,其中不乏 *** 、國企。
實時資料庫系統是開發實時控制系統、數據採集系統、CIMS系統等的支撐軟體。在流程行業中,大量使用實時資料庫系統進行控制系統監控,系統先進控制和優化控制,並為企業的生產管理和調度、數據分析、決策支持及遠程在線瀏覽提供實時數據服務和多種數據管理功能。實時資料庫已經成為企業信息化的基礎數據平台,可直接實時採集、獲取企業運行過程中的各種數據,並將其轉化為對各類業務有效的公共信息,滿足企業生產管理、企業過程監控、企業經營管理之間對實時信息完整性、一致性、安全共享的需求,可為企業自動化系統與管理信息系統間建立起信息溝通的橋梁。幫助企業的各專業管理部門利用這些關鍵的實時信息,提高生產銷售的營運效率。如果你想定製這款國產資料庫 可以打 前面是 一三六 中間是 六一二零 末尾是 四一四七
北京開運聯合信息技術股份有限公司-實時性工業資料庫軟體(CreatRun Database )
實時性工業資料庫軟體(CreatRun Database )是什麼?
1、實時性工業資料庫軟體(CreatRun Database ) 是開運聯合公司針對行業應用,獨立研發的,擁有全部自主知識產權的企業級實時/歷史資料庫平台。為企業監控生產情況、計算性能指標、進行事故分析和對設備啟停分析診斷、故障預防等提供重要的數據保障。
2、實時性工業資料庫軟體(CreatRun Database ) 可廣泛用於工業控制自動化數據的高速採集和存儲,提供高速、海量數據存儲和基礎分析能力。
3、實時性工業資料庫軟體(CreatRun Database ) 可隨時觀察以及在線分析生產過程。長期保存的歷史數據不僅可以重現歷史生產情況,也使大規模數據挖掘成為可能。 提供企業生產信息管理解決方案,可以有效應對「從小到大」 「由近及遠」 的各種企業級數據應用。
4、CreatRun Database 可在線按照時間序列以毫秒級精度自動採集企業的各類過程自動化系統中的生產數據,高效壓縮並存儲。同時可向用戶和應用程序提供實時和歷史數據,使得用戶可隨時觀察以及在線分析生產過程。長期保存的歷史數據不僅可以重現歷史生產情況,也使大規模數據挖掘成為可能。
【工業軟體開發】實時性工業資料庫軟體(CreatRun Database )系統主要技術指標:
支持數據類型:digital、int16、int32、float16、float32、float64、String等類型
標簽容量:200,000 Tag
數據容量:TB級
客戶端並發用戶數:500 個
生產過程數據採集時間響應速度:<500 毫秒
時間戳解析度:毫秒
存儲速度:>100,000 輸入值/秒存檔數據回取事務吞吐量:>2,000,000 輸出值/秒
實時性工業資料庫軟體(CreatRun Database )系統特性——高可用性:
1、高效的數據存儲策略及壓縮演算法「死區例外+可變斜率壓縮演算法 」,精確到每個Tag的壓縮配置,有效提高了歷史數據存儲性能,節約磁碟空間.
2、高速的數據緩存機制,使並行訪問鎖域粒度精確到「Block(1KBytes)」,實現了並行訪問能力的最大化。使歷史數據訪問路由復雜度「最小化、均衡化,扁平化」,不界定「冷熱」數據,所有數據訪問時間成本一致,同時提供均衡訪問特性和最大遠程數據訪問友好度。
3、Creat RUN ......
數據挖掘工具一般都有哪些
數據挖掘工具有國外的Qlik,國內的有永洪,收費是肯定的,你可以先去找些可以免費試用的挖掘工具,國內的ETHINK平台好像可以
數據挖掘工具有哪些?
SQL Server是資料庫,但內建數據挖掘功能,若提到工具的話,大概有SAS, SPSS, Statistica(Dell), R, Revolution R...
3. 如何自學成為數據分析師
數據分析師的基本工作流程:
1.定義問題
確定需要的問題,以及想得出的結論。需要考慮的選項有很多,要根據所在業務去判斷。常見的有:變化趨勢、用戶畫像、影響因素、歷史數據等。
2.數據獲取
數據獲取的方式有很多種:
一是直接從企業資料庫調取,需要SQL技能去完成數據提取等的資料庫管理工作。
二是獲取公開數據,政府、企業、統計局等機構有。
三是通過Python編寫網頁爬蟲。
3.數據預處理
對殘缺、重復等異常數據進行清洗。
4.數據分析與建模
這個部分需要了解基本的統計分析方法、數據挖掘演算法,了解不同統計方法適用的場景和適合的問題。
5.數據可視化和分析報告撰寫
學習一款可視化工具,將數據通過可視化最直觀的展現出來。
數據分析入門需要掌握的技能有:
1. SQL(資料庫):
怎麼從資料庫取數據?怎麼取到自己想要的特定的數據?等這些問題就是你首要考慮的問題,而這些問題都是通過SQL解決的,所以SQL是數據分析的最基礎的技能。
2. excel
分析師更多的時候是在分析數據,分析數據時需要把數據放到一個文件里,就是excel。
熟練excel常用公式,學會做數據透視表,什麼數據畫什麼圖等。
3.Python或者R的基礎:
必備項,也是加分項,在數據挖掘方向是必備項,語言相比較工具更加靈活也更加實用。
4.學習一個可視化工具
如果你想往更高層次發展,上面的東西頂多隻佔20%,剩下的80%則是業務理解能力,目標拆解能力,根據數據需求更多新技能的學習能力。
4. 計算機專業數據挖掘或是資料庫方向考研都是有哪些好的研究所或是學校
計算機專業數據挖掘或是資料庫方向考研應該是大連理工大學計算機軟體與理論專業,國家一級重點學科,學科評級A。具體如下。
5. 想搞數據挖掘 需要學習哪些東東
1、數據挖掘、模式識別、統計學習
2、概率統計:多元統計、時間序列、隨機過程
運籌優化:運籌學
3、資料庫(SQL語言/資料庫理論/Oracle與SQLServer)、數據倉庫
4、SAS / SPSS / KXEN / BusinessObject / Matlab / Excel VBA等工具
5、行業知識:比如金融銀行計量經濟(做金融建模)、市場營銷與調查(做市場建模)
6. 數據挖掘從入門到進階 要看什麼書
數據挖掘從入門到進階 要看什麼書
做數據挖掘也有些年頭了,寫這篇文一方面是讓我寫篇文,朋友作為數據挖掘方面的參考,另一方面也是有拋磚引玉之意,希望能夠和一些大牛交流,相互促進,讓大家見笑了。
Q&A:
Q:學習,最近在看集體智慧編程,樓主可否推薦下數學基礎的書?
A:我數學本身也不好 自己也在偷偷補 因為看的不多也不能給出個提綱式的建議 只能給您列下我近期看過和在看的覺得不錯的書 您看做參考吧
矩陣方面 Kaare Brandt Petersen的《The Matrix Cookbook》 網易公開課中的《麻省理工公開課:線性代數》
2.概率論與數理統計方面 JohnA.Rice 的《數理統計與數據分析》《統計建模與R軟體》
3.微積分方面 網易公開課中的《麻省理工學院公開課:單變數微積分》
其實您只要有了
1、概率論與數理統計以及其他統計學基礎
2、扎實的線性代數功底
3、微積分(如果能學習下實變函數和泛函分析就更好了)
這幾方面的基礎 基本上機器學習的大部分演算法您都具有了其數學基礎
如果您覺得我說的太泛 可以先看看《模式分類》這本書的附錄中的數學基礎 這樣您就大體有個印象了
入門:
數據挖掘入門的書籍,中文的大體有這些:
Jiawei Han的《數據挖掘概念與技術》
Ian H. Witten / Eibe Frank的《數據挖掘 實用機器學習技術》
Tom Mitchell的《機器學習》
TOBY SEGARAN的《集體智慧編程》
Anand Rajaraman的《大數據》
Pang-Ning Tan的《數據挖掘導論》
Matthew A. Russell的《社交網站的數據挖掘與分析》
很多人的第一本數據挖掘書都是Jiawei Han的《數據挖掘概念與技術》,這本書也是我們組老闆推薦的入門書(我個人覺得他之所以推薦是因為Han是他的老師)。其實我個人來說並不是很推薦把這本書。這本書什麼都講了,甚至很多書少有涉及的一些點比如OLAP的方面都有涉獵。但是其實這本書對於初學者不是那麼友好的,給人一種教科書的感覺,如果你有大毅力讀完這本書,也只能獲得一些零碎的概念的認識,很難上手實際的項目。
我個人推薦的入門書是這兩本:TOBY SEGARAN的《集體智慧編程》和Ian H. Witten / Eibe Frank的《數據挖掘 實用機器學習技術》
《集體智慧編程》很適合希望了解數據挖掘技術的程序員,這本書講述了數據挖掘裡面的很多實用的演算法,而且最重要的是其講述的方式不是像Han那種大牛掉書袋的講法,而是從實際的例子入手,輔以python的代碼,讓你很快的就能理解到這種演算法能夠應用在哪個實際問題上,並且還能自己上手寫寫代碼。唯一的缺點是不夠深入,基本沒有數學推導,而且不夠全面,內容不夠翔實。不過作為一本入門書這些缺點反而是幫助理解和入門的優點。
推薦的另一本《數據挖掘 實用機器學習技術》則相對上一本書要稍微難一點,不過在容易理解的程度上依然甩Han老師的書幾條街,其作者就是著名的Weka的編寫者。整本書的思想脈絡也是盡可能的由易到難,從簡單的模型入手擴展到現實生活中實際的演算法問題,最難能可貴的是書的最後還稍微講了下如何使用weka,這樣大家就能在學習演算法之餘能夠用weka做做小的實驗,有直觀的認識。
看完上述兩本書後,我覺得大體數據挖掘就算有個初步的了解了。往後再怎麼繼續入門,就看個人需求了。
如果是只是想要稍微了解下相關的技術,或者作為業余愛好,則可隨便再看看Anand Rajaraman的《大數據》以及Matthew A. Russell的《社交網站的數據挖掘與分析》。前者是斯坦福的」Web挖掘」這門課程的材料基礎上總結而成。選取了很多數據挖掘里的小點作為展開的,不夠系統,但講的挺好,所以適合有個初步的了解後再看。後者則亦是如此,要注意的是裡面很多api因為GFS的緣故不能直接實驗,也是個遺憾
如果是繼續相關的研究學習,我認為則還需要先過一遍Tom Mitchell的《機器學習》。這本書可以看做是對於十多年前的機器學習的一個綜述,作者簡單明了的講述了很多流行的演算法(十年前的),並且對於各個演算法的適用點和特點都有詳細的解說,輕快地在一本薄薄的小書里給了大家一個機器學習之旅。
進階:
進階這個話題就難說了,畢竟大家對於進階的理解各有不同,是個仁者見仁的問題。就我個人來說,則建議如下展開:
視頻學習方面:
可以看看斯坦福的《機器學習》這門課程的視頻,最近聽說網易公開課已經全部翻譯了,而且給出了雙語字幕,更加容易學習了^_^
書籍學習方面:
我個人推薦的是這樣:可以先看看李航的《統計學習方法》,這本書著重於數學推導,能讓我們很快的對於一些演算法的理解更加深入。有了上面這本書的基礎,就可以開始啃一些經典名著了。
這些名著看的順序可以不分先後,也可以同時學習:
Richard O. Duda的《模式分類》這本書是力薦,很多高校的數據挖掘導論課程的教科書便是這本(也是我的數據挖掘入門書,很有感情的)。如果你不通讀這本書,你會發現在你研究很多問題的時候,甚至一些相對簡單的問題(比如貝葉斯在高斯假設下為什麼退化成線性分類器)都要再重新回頭讀這本書。
Christopher M. Bishop的《Pattern Recognition And Machine Learning》這本書也是經典巨著,整本書寫的非常清爽。
The Elements of Statistical Learning》這本書豆友有句很好的吐槽「機器學習 — 從入門到精通」可以作為這本書的副標題。可以看出這本書對於機器學習進階的重要性。值得一說的是這本書雖然有中文版,但是翻譯之爛也甚是有名,聽說是學體育的翻譯的。
Hoppner, Frank的《Guide to Intelligent Data Analysis》這本書相對於上面基本經典巨著並不出名,但是寫的甚好,是knime官網上推薦的,標榜的是解決實際生活中的數據挖掘問題,講述了CRISP-DM標准化流程,每章後面給出了R和knime的應用例子。
項目方面:
事實上,我覺得從進階起就應該上手一些簡單的項目了。如果不實踐只是看書和研究演算法,我覺得是無法真正理解數據挖掘的精髓所在的。打個簡單的比方,就算你看完了C Primer、effective C 等等書籍,如果自己不寫C ,那麼自己也就會停留在hello world的級別。實踐出真知非常切合數據挖掘這門學科,實際上手項目後才會發現什麼叫」80%的准備,20%的建模」,real world的問題我認為並不是僅僅靠modeling就能很好的解決的。詳細的可以看看《Guide to Intelligent Data Analysis》就能略知一二。如果上手做推薦或者一些簡單的項目,也可以考慮用用mahout,推薦的入門手冊是《mahout in action》。項目問題說來話長,有時間會以CRISP流程為引單獨作文,這里也就不詳談了。
軟體方面:
我常用而且推薦的軟體有如下,這里只是簡單的列出,以後有時間再詳細分析和寫出入門:
Weka Java的軟體,可以集成到自己的項目中
Orange 一個用python寫的數據挖掘開源軟體,界面做的很漂亮,可以做圖形化實驗,也可以用python調用編程。
Knime 和Orange類似,特點是可以集成weka和R等開源軟體
SAS的EM模塊以及R 還有最最經典的matlab大大
這里有篇文有簡要的介紹http://www.oschina.net/question/12_14026
再往後:
再往後的其實就是我就是覺得是學數學了,然後就是深入讀一些你感興趣的topic的書籍和paper,接項目,做項目了。發展有數據分析師或者去專門的企業做數據研究員,當然混學術界的我就不清楚了。
初略寫完發現成一篇長文了,最近也是在做一個用眼底照片預測stroke的項目,比較忙,等閑下來以後也會寫些演算法或者軟體或者實際項目的心得的文。當然也只是我個人粗淺的想法,也希望能和大家有所交流,相互促進,我個人的郵箱是[email protected],有什麼問題可以再帖子里討論,也可郵件交流^_^
7. Python大數據好學嗎
本人學習大數據時間不久,2年左右吧,只能從個人經驗給你一點建議,希望你少走一點彎路。
首先,你說到你剛接觸大數據,你要明白大數據范圍超級廣,你具體想要學習哪個方向呢?數據挖掘?還是機器學習深度學習?亦或nlp(自然語言處理)?(我主要學數據挖掘,嗚啦啦啦)
我給所有問我大數據該怎麼入門的人都會有如下建議:學好數學!學好數學!學好數學!重要的事說三遍,不然你怎麼理解各種模型的構建?所以從理解演算法開始,什麼svn啦,knn啦,k means啦,總之各種聚類分類的演算法,把它搞懂,絕對有用。
扯遠了,不好意思…言歸正傳,回到語言的選擇問題。java和python這兩個語言,我給你從這幾個方面解釋一下:
1. python是腳本語言,無需編譯,java則是需要編譯的語言
2. 我在letitcode(大概是這么拼)上測試過好多次,同一個功能的程序竟然是java性能好很多
3. 平時我們做項目,都是用python寫個demo去測試,真正發行的版本,是用java寫的
4. 許多大數據平台(如spark),都提供多種語言的介面,所以你不用擔心學一種語言沒處用的問題
看到了吧?python和java的地位差別在企業中就是一個低一個高,氮素!以我個人的觀點來看,我還是建議你先學python。
為啥膩?我可不是要坑你,而是因為:
1. 很多java中幾行的代碼,python中一行就搞定,學會了python,還怕學不會java?
2. python上手快,簡潔事兒少
3. (個人經驗)我學數據挖掘入門是用的scikit-learn(一個python庫),當時用的超爽的好吧!幾分鍾搞個模型出來。當然現在看來那不算什麼啦,可當時真的體驗很好,特有成就感。相反拿java寫程序我就各種別扭,總覺得啰嗦得很
4. 其實,我覺得scala更適合大數據…linkedin後台好像就是它寫的,但是我覺得scala難,再加上種種原因,一直沒來得及學
以上就是我的看法。
最後給你推薦個小工具:jupyter notebook,一個在線互動式編譯器,不但支持python在線編譯,還支持matplotlib及各種繪圖庫哦!在你前期做數據清洗和特徵提取的時候很有用。
8. 大學的哪個專業是研究數據挖掘的
研究數據挖掘的大學專業一般是人工智慧專業,或者也可以叫作應用數學,然後研究大數據方向,總之和數學、人工智慧分不開,下面將開始介紹。
所以,想學數據挖掘,就選數學專業。