1. sap hana模块有前途吗大数据时代来了,学hana好吗,待遇怎么样
sap erp
一般内部顾问月薪在17k左右,外部在25k左右,自由顾问日薪在2500~4500之间,其实主要还是个人能力,个人能力强,工资就高。
SAP HANA是集结了SAP与IBM、惠普、思科、富士通、英特尔等硬件商一起合作的结晶,优化的软硬件合成产品将基于内存的计算植入到了业务应用的核心。51sap
软件方面,HANA的内存数据库(SAP In-Memory Database, IMDB)是其重要组成部分,包括数据库服务器(In-Memory DatabaseServer)、建模工具(Studio)和客户端工具(ODBO、JDBC、ODBC、SQLDBC等)。HANA的计算引擎(Computing Engine)是其核心,负责解析并处理对大量数据的各类CRUDQ操作,支持SQL和MDX语句、SAP和non-SAP数据。比较显而易见的一点是,HANA计算引擎要快速处理用户复杂的查询请求,快速返回查询结果。
SAP内存数据库的数据并不是只在内存里,也会不停写到硬盘里,这就用到复制服务器Replication Server,包括Log-based,Trigger-based和ETL-based。这些复制服务器需要用到Sybase Replication Server、Sybase ReplicationServer Agent、Sybase Adaptive Server EntERPrise (AES,适用性服务器)等,以及HANA Load Controller和BO Data Services。
硬件方面,SAP和多个硬件厂商合作生产支持HANA的高性能服务器,包括Dell R910、Fujitsu、HPDL580、IBM x3850等,以及和Cisco(Cisco Unified Computing System. UCS)等公司的合作。直观地说,这些机器的硬盘可能是数个600GB、转速10k rpm的硬盘组成RAID,内存可能有1T,文件系统可能是ext3或GPFS(IBM通用串行文件系统,General Parallel File System)。51sap
HANA的快在于用大内存提供内存数据库,并在内存数据库里采用列式存储从而可以将更多的数据装进内存(列式存储更适合数据压缩)。
SAPHANA的诞生,主要是应对当前企业里不同来源的海量数据,并将这些不同结构的数据进行整合,进一步实时进行数据挖掘和分析。51sap
在选择学习SAP模块时候,一定要遵循自己的想法,兴趣是首先考虑的因素,再者就是背景,这些都是可以帮助学习SAP模块的。也可以在培训机构由授课老师的指导和建议。
hana前景还是很好的,在大数据时代背景下,现在学就好。
2. 如何快速同步HANA数据到其它数据库
两条途径
1)免费,但不是很靠谱。
github 开源代码自己搜一下,有HANA 到 mysql的代码。仔细调试下,秒级估计很悬,但分钟级别的数据量不大的情况下还是有希望的。
2)收费,但功能很强大。
有第三方的工具专门干这个事情的,而且是log base的CDC,不需要在SAP和Hana 上安装任何agent。 同步速度基本都在1秒以内。
同步目标可以是常见的数据库(Oracle ,DB2,SQL server , PostgreSql) 数据仓库,数据湖,kafka,各种云平台(AWS,Google,Azure)阿里等各种数据中台。
3. hana数据库与数据仓库区别
hana数据库与数据仓库区别分别是:
数据库(Database)是:
1、相对复杂的表格结构,存储结构相对紧致,少冗余数据。
2、读和写都有优化。
3、相对简单的read/write query,单次作用于相对的少量数据。
数据仓库(Datawarehouse)是:
1、相对简单的(Denormalized)表格结构,存储结构相对松散,多冗余数据。
2、一般只是读优化。
3、相对复杂的read query,单次作用于相对大量的数据(历史数据)。
并且数据库 Database (Oracle, Mysql, PostgreSQL)主要用于事务处理,数据仓库 Datawarehouse (Amazon Redshift, Hive)主要用于数据分析。
数据仓库的弱势之处是:
并不是所有的读操作,数据仓库一直都有优势。比如在如下两种情况时,数据仓库的读表现并不如数据库:
1、在对小量数据进行读取操作的时候,由于数据仓库要进行找Node的location之类的预运算,整体效率上反倒不如数据库。
2、如果读取操作的目标不是主键(PrimaryKey)或者分配键(PartitionKey),那么数据仓库的查询也需要进行全局扫描,效率上就不好说是否胜过数据库了。