『壹』 數據分析師用哪個資料庫比較好
作為一個數據分析師來回答一下:
我做這行兩年多了,剛開始的時候用的多是MySQL資料庫,當然,Oracle資料庫也會用到,尤其是在金融行業或者國企都用Oracle,一般的公司使用MySQL資料庫,可能是因為MySQL資料庫免費吧。另外,在一家互數沖聯網公司,我遇到了mongodb,目前一些新興燃畢備的互聯網公司使用nosql的也比較多,這個當時是現學現賣的。作為一個數據分析師,可能對資料庫的使用一般是存取數據,至於更高級別的優化、事務之類的,一般是使用不到的,有專門的資料庫人員,我們只要用好資料庫就好。
說道數據分析或者數據挖掘,除了資料庫來存取數據,我們還需要處理數據的工具,最趁手的當然是Python了。Python結合資料庫是日常的code,Python也提供了齊備的工具,針對MySQL的有pymysql庫,和oracle結合有cx_Oracle庫,和mongodb結合有pymongo庫,另外當然少不了我們的數據分析利器pandas庫了,提供了read_sql函數,支持各種資料庫,直接讀取成DataFrame的數據格式,十分的方便。
總結一下就是:其實遇到的大多數都是MySQL,oracle也有,這兩種都是sql語句,差別不大,只要掌握sql語句,這兩個資料庫問題都不大,mongodb是新興的非關系資料庫,語句也不是很復雜,之間上手工作也是無壓力的。結合Python中的pandas使用,讓你很溜的處理數據,數據分析也就得心應手了,小case了。皮毀
『貳』 哪個外文資料庫比較好
外兆激鄭文資料庫有很多個,我將分享3個我經常用的外文資料庫。
1、Wiley InterScience(英文文獻期刊)
Wiley InterScience收錄了360多種科學、工程技術、醫療領域及相關專業期刊、30多種大型專業參考書、13種實驗室手冊的全文和500多個題目的Wiley學術圖書的全文。其中被SCI收錄的核心期刊近200種。
『叄』 簡單易用的資料庫哪個比較好
1.數據量太大,比如上億,就用oracle,優點上億數據對Oracle來說輕飄飄的,也不用太多優化配置,缺點安臘皮裝比較麻煩,上手比較慢。
2.數據量較大,比如千萬級,用postgresql,它號稱對標Oracle,處理千萬級數據還是可以的,也是易學易用。
3.數據量一般,比如百萬級,橋局拍用mysql,這個級別的數據量mysql處理還是比較快的。
4.數據量較小,比如十萬以下敏羨,sqlite、access都可以。
上面是基於單表操作的數據量,你看著選。
『肆』 該選擇哪個開源資料庫哪一個更好(哪個資料庫好用)
如果打算為項目選擇一款免費、開源的資料庫,那麼你可能會在MySQL與PostgreSQL之間猶豫不定。MySQL與PostgreSQL都是免費、開源、強大、且功能豐富的資料庫。你主要的問題可能是:哪一個才是最好的開源資料庫,MySQL還是PostgreSQL呢?該選擇哪一個開源資料庫呢?
在選擇資料庫時,你所做的是個長期的決策,因為後面如果再改變決定將是非常困難且代價高昂的。你希望一開始就選擇正確。兩個流行的開源資料庫MySQL與PostgreSQL常常成為最後要選擇的產品。對這兩個開源資料庫的高層次概覽將會有助於你選擇最適合自己需要的。
MySQL
MySQL相對來說比較年輕,首度出現在1994年。它聲稱自己是最流行的開源資料庫。MySQL就是LAMP(用於Web開發的軟體包,包括Linux、Apache及Perl/PHP/Python)中的M。構建在LAMP棧之上的大多數應用都會使用MySQL,包括那些知名的應用,如WordPress、Drupal、Zend及phpBB等。
一開始,MySQL的設計目標是成為一個快速的Web伺服器後端,使用快速的索引序列訪問方法(ISAM),不支持ACID。經過早期快速的發展之後,MySQL開始支持更多的存儲引擎,並通過InnoDB引擎實現了ACID。MySQL還支持其他存儲引擎,提供了臨時表的功能(使用MEMORY存儲引擎),通過MyISAM引擎實現了高速讀的資料庫,此外還有其他的核心存儲引擎與第三方引擎。
MySQL的文檔非常豐富,有很多質量不錯的免費參考手冊、圖書與在線文檔,還有來自於Oracle和第三方廠商的培訓與支持。
MySQL近幾年經歷了輪帆所有權的變更和一些頗具戲劇性的事件。它最初是由MySQLAB開發的,然後在2008年以10億腔桐手美金的價格賣給了Sun公司,Sun公司又在2010年被Oracle收購。Oracle支持MySQL的多個版本:Standard、Enterprise、Classic、Cluster、Embedded與Community。其中有一些是免費下載的,另外一些則是收費的。其核心代碼基於GPL許可,對於那些不想使用GPL許可的開發者與廠商來說還有商業許可可供使用。
現在,基於最初的MySQL代碼還有更多的資料庫可供選擇,因為幾個核心的MySQL開發者已經發布了MySQL分支。最初的MySQL創建者之一Michael"Monty"Widenius貌似後悔將MySQL賣給了Sun公司,於是又開發了他自己的MySQL分支MariaDB,它是免費的,基於GPL許可。知名的MySQL開發者BrianAker所創建的分支Drizzle對其進行了大量的改寫,特別針對多CPU、雲、網路應用與高並發進行了優化。
PostgreSQL
PostgreSQL標榜自己是世界上最先進的開源資料庫。PostgreSQL的一些粉絲說它能與Oracle相媲美,而且沒有那麼昂貴的價格和傲慢的客服。它擁有很長的歷史,最初是伍嫌1985年在加利福尼亞大學伯克利分校開發的,作為Ingres資料庫的後繼。
PostgreSQL是完全由社區驅動的開源項目,由全世界超過1000名貢獻者所維護。它提供了單個完整功能的版本,而不像MySQL那樣提供了多個不同的社區版、商業版與企業版。PostgreSQL基於自由的BSD/MIT許可,組織可以使用、復制、修改和重新分發代碼,只需要提供一個版權聲明即可。
可靠性是PostgreSQL的最高優先順序。它以堅如磐石的品質和良好的工程化而聞名,支持高事務、任務關鍵型應用。PostgreSQL的文檔非常精良,提供了大量免費的在線手冊,還針對舊版本提供了歸檔的參考手冊。PostgreSQL的社區支持是非常棒的,還有來自於獨立廠商的商業支持。
數據一致性與完整性也是PostgreSQL的高優先順序特性。PostgreSQL是完全支持ACID特性的,它對於資料庫訪問提供了強大的安全性保證,充分利用了企業安全工具,如Kerberos與OpenSSL等。你可以定義自己的檢查,根據自己的業務規則確保數據質量。在眾多的管理特性中,point-in-timerecovery(PITR)是非常棒的特性,這是個靈活的高可用特性,提供了諸如針對失敗恢復創建熱備份以及快照與恢復的能力。但這並不是PostgreSQL的全部,項目還提供了幾個方法來管理PostgreSQL以實現高可用、負載均衡與復制等,這樣你就可以使用適合自己特定需求的功能了。