1. sap hana模塊有前途嗎大數據時代來了,學hana好嗎,待遇怎麼樣
sap erp
一般內部顧問月薪在17k左右,外部在25k左右,自由顧問日薪在2500~4500之間,其實主要還是個人能力,個人能力強,工資就高。
SAP HANA是集結了SAP與IBM、惠普、思科、富士通、英特爾等硬體商一起合作的結晶,優化的軟硬體合成產品將基於內存的計算植入到了業務應用的核心。51sap
軟體方面,HANA的內存資料庫(SAP In-Memory Database, IMDB)是其重要組成部分,包括資料庫伺服器(In-Memory DatabaseServer)、建模工具(Studio)和客戶端工具(ODBO、JDBC、ODBC、SQLDBC等)。HANA的計算引擎(Computing Engine)是其核心,負責解析並處理對大量數據的各類CRUDQ操作,支持SQL和MDX語句、SAP和non-SAP數據。比較顯而易見的一點是,HANA計算引擎要快速處理用戶復雜的查詢請求,快速返回查詢結果。
SAP內存資料庫的數據並不是只在內存里,也會不停寫到硬碟里,這就用到復制伺服器Replication Server,包括Log-based,Trigger-based和ETL-based。這些復制伺服器需要用到Sybase Replication Server、Sybase ReplicationServer Agent、Sybase Adaptive Server EntERPrise (AES,適用性伺服器)等,以及HANA Load Controller和BO Data Services。
硬體方面,SAP和多個硬體廠商合作生產支持HANA的高性能伺服器,包括Dell R910、Fujitsu、HPDL580、IBM x3850等,以及和Cisco(Cisco Unified Computing System. UCS)等公司的合作。直觀地說,這些機器的硬碟可能是數個600GB、轉速10k rpm的硬碟組成RAID,內存可能有1T,文件系統可能是ext3或GPFS(IBM通用串列文件系統,General Parallel File System)。51sap
HANA的快在於用大內存提供內存資料庫,並在內存資料庫里採用列式存儲從而可以將更多的數據裝進內存(列式存儲更適合數據壓縮)。
SAPHANA的誕生,主要是應對當前企業里不同來源的海量數據,並將這些不同結構的數據進行整合,進一步實時進行數據挖掘和分析。51sap
在選擇學習SAP模塊時候,一定要遵循自己的想法,興趣是首先考慮的因素,再者就是背景,這些都是可以幫助學習SAP模塊的。也可以在培訓機構由授課老師的指導和建議。
hana前景還是很好的,在大數據時代背景下,現在學就好。
2. 如何快速同步HANA數據到其它資料庫
兩條途徑
1)免費,但不是很靠譜。
github 開源代碼自己搜一下,有HANA 到 mysql的代碼。仔細調試下,秒級估計很懸,但分鍾級別的數據量不大的情況下還是有希望的。
2)收費,但功能很強大。
有第三方的工具專門干這個事情的,而且是log base的CDC,不需要在SAP和Hana 上安裝任何agent。 同步速度基本都在1秒以內。
同步目標可以是常見的資料庫(Oracle ,DB2,SQL server , PostgreSql) 數據倉庫,數據湖,kafka,各種雲平台(AWS,Google,Azure)阿里等各種數據中台。
3. hana資料庫與數據倉庫區別
hana資料庫與數據倉庫區別分別是:
資料庫(Database)是:
1、相對復雜的表格結構,存儲結構相對緊致,少冗餘數據。
2、讀和寫都有優化。
3、相對簡單的read/write query,單次作用於相對的少量數據。
數據倉庫(Datawarehouse)是:
1、相對簡單的(Denormalized)表格結構,存儲結構相對鬆散,多冗餘數據。
2、一般只是讀優化。
3、相對復雜的read query,單次作用於相對大量的數據(歷史數據)。
並且資料庫 Database (Oracle, Mysql, PostgreSQL)主要用於事務處理,數據倉庫 Datawarehouse (Amazon Redshift, Hive)主要用於數據分析。
數據倉庫的弱勢之處是:
並不是所有的讀操作,數據倉庫一直都有優勢。比如在如下兩種情況時,數據倉庫的讀表現並不如資料庫:
1、在對小量數據進行讀取操作的時候,由於數據倉庫要進行找Node的location之類的預運算,整體效率上反倒不如資料庫。
2、如果讀取操作的目標不是主鍵(PrimaryKey)或者分配鍵(PartitionKey),那麼數據倉庫的查詢也需要進行全局掃描,效率上就不好說是否勝過資料庫了。