導航:首頁 > 編程大全 > 數據挖掘資料庫

數據挖掘資料庫

發布時間:2023-12-02 10:35:17

大數據挖掘是什麼

數據挖掘(DataMining)是從大量的、不完全的、有雜訊的、模糊的、隨機的數據中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。

數據挖掘對象

根據信息存儲格式,北大青鳥昌平計算機學院認為用於挖掘的對象有關系資料庫、面向對象資料庫、數據倉庫、文本數據源、多媒體資料庫、空間資料庫、時態資料庫、異質資料庫以及Internet等。

數據挖掘流程

定義問題:清晰地定義出業務問題,確定數據挖掘的目的。

數據准備:數據准備包括:選擇數據_在大型資料庫和數據倉庫目標中提取數據挖掘的目標數據集;數據預處理_進行數據再加工,包括檢查數據的完整性及數據的一致性、去雜訊,填補丟失的域,刪除無效數據等。

數據挖掘:根據數據功能的類則明型和和數據的特點選擇相應的演算法,在凈化和轉換過的數據集上進行數據挖掘。

結果分析:對數據挖掘的結果進行解釋和評價,轉換成為能夠最終被用戶理解的知識。

數據挖掘分類

直接數據挖掘:目標是利用可用的數據建立一個模型,這個模型對剩餘的數據,對一個特定的變數(可以理解成資料庫中表的屬性,即列)進行描述。

間接數據挖掘:目標中沒有選出某一具體的變數,用模型進行描述;而是在所有的變數中建立起某種關系。

數據挖掘的方法

神經網路方法

神經網路由於本身良好的魯棒性、自組織自適應性、並行處理、分布存儲和高度容錯等特性非常適合解決數據挖掘的問題,因此近年來越來越受到人們的關注。

遺傳演算法

遺傳演算法是一種基於生物自然選擇與遺傳機理的隨機搜索演算法,是一種仿生全局優化方法。遺傳演算法具有的隱含並行性孫褲告、易於和其它模型結合等性質使得它純扮在數據挖掘中被加以應用。

決策樹方法

決策樹是一種常用於預測模型的演算法,它通過將大量數據有目的分類,從中找到一些有價值的,潛在的信息。它的主要優點是描述簡單,分類速度快,特別適合大規模的數據處理。


閱讀全文

與數據挖掘資料庫相關的資料

熱點內容
蘋果7怎麼沒有4g網路設置 瀏覽:924
小米文件夾重命名 瀏覽:404
win10錄屏關閉快捷鍵 瀏覽:250
wav格式如何修改文件後綴 瀏覽:672
一個文件夾下的圖片如何依次觀看 瀏覽:859
htcm8win10mobile 瀏覽:477
蘋果沒qq聲音怎麼回事啊 瀏覽:410
網路共享顯示器 瀏覽:343
什麼是數字圖像的數據量 瀏覽:763
使用什麼軟體可以對plc進行編程 瀏覽:131
廣電網路綠色繳費通道 瀏覽:247
iphone4s麥克風 瀏覽:845
怎麼用cmd運行java路徑 瀏覽:318
2014年日歷下載word 瀏覽:198
微信個人轉發量統計 瀏覽:196
怎麼樣將app里按鈕變大 瀏覽:769
狼蛛鼠找不到配置文件 瀏覽:845
土豪金編程器軟體打不開什麼原因 瀏覽:957
備分數據換SD片是什麼意思 瀏覽:666
jmp數據分析時主要看哪些參數 瀏覽:59

友情鏈接