① 大数据工程技术人员是做什么的 工作内容有哪些
近日,人社部发布通知,正式公布了十三个新职业信息,其中大数据工程技术人员就是其中之一。
大数据工程技术人员的工作内容
大数据工程技术人员是指从事大数据采集、清洗、分析、治理、挖掘等技术研究,并加以利用、管理、维护和服务的工程技术人员。
主要工作任务:
大数据采集(爬虫)、大数据清洗(ETl工程师)、大数据建模(算法工程师)与大数据分析(数据分析员);
管理、分析展现及应用等技术(大数据开发工程师);
研究、应用大数据平台体系架构、技术和标准;
设计、开发、集成、测试大数据软硬件系统;
管理、维护并保障大数据系统稳定运行;
监控、管理和保障大数据安全;
提供大数据的技术咨询和技术服务。
我推荐: 中国13个新职业公布
大数据工程技术人员就业前景如何在企业中,大数据工程师的发展分为四个阶段:从软件技术员到助理软件工程师,再到软件工程师,最后成为高级软件工程师。据IDC的统计数字,在所有软件开发类人才的需求中,对大数据工程师的需求达到全部需求量的60%—70%。同时,大数据软件工程师的工资待遇相对较高。
大数据软件工程师的一般起步月薪在6k-1w之间,远远超过应届毕业生的两三千的薪资。有一两年的工作经验之后,薪资待遇还会提升,比如有一年工作经验的大数据高级工程师的薪资待遇差不多在年薪10w-15w之间。
在未来的几年内,大数据人才的缺口只会越来越大,企业对人才的需求远远大于供给。大数据工程师是目前国内高端计算机领域,就业薪资非常高的一类职业。
② 大数据工程师要掌握什么
已经身处这个行业的专家给出了一些人才需求的大体框架,包括要有计算版机编码能力、数学权及统计学相关背景;学历并不是最主要的因素,能有大规模处理数据的经验并且有喜欢在数据海洋中寻宝的好奇心会更适合这个工作。
此外,一个优秀的大数据工程师要具备一定的逻辑分析能力,并能迅速定位某个商业问题的关键属性和决定因素。
大数据必备技能:
③ 大数据工程师到底是什么
用阿里巴巴集团研究员薛贵荣的话来说,大数据工程师就是一群“玩数据”的人,内玩出数据容的商业价值,让数据变成生产力。大数据和传统数据的最大区别在于,它是在线的、实时的,规模海量且形式不规整,无章法可循,因此“会玩”这些数据的人就很重要。
沈志勇认为如果把大数据想象成一座不停累积的矿山,那么大数据工程师的工作就是,“第一步,定位并抽取信息所在的数据集,相当于探矿和采矿。第二步,把它变成直接可以做判断的信息,相当于冶炼。最后是应用,把数据可视化等。”
因此分析历史、预测未来、优化选择,这是大数据工程师在“玩数据”时最重要的三大任务。通过这三个工作方向,他们帮助企业做出更好的商业决策。
④ 大数据工程师是做什么的
总结一句话就是 写 SQL (很多入职一两年的大数据工程师主要的工作就是写 SQL )
还有其他的
2 为集群搭大数据环境(一般公司招大数据工程师环境都已经搭好了,公司内部会有现成的大数据平台,但我这边会私下搞一套测试环境,毕竟公司内部的大数据系统权限限制很多,严重影响开发效率)
3 维护大数据平台(这个应该是每个大数据工程师都做过的工作,或多或少会承担“运维”的工作)
4 数据迁移(有部分公司需要把数据从传统的数据库 Oracle、MySQL 等数据迁移到大数据集群中,这个是比较繁琐的工作,吃力不讨好)
5 应用迁移(有部分公司需要把应用从传统的数据库 Oracle、MySQL 等数据库的存储过程程序或者SQL脚本迁移到大数据平台上,这个过程也是非常繁琐的工作,无聊,高度重复且麻烦,吃力不讨好)
6 数据采集(采集日志数据、文件数据、接口数据,这个涉及到各种格式的转换,一般用得比较多的是 Flume 和 Logstash)
7 数据处理
7.1 离线数据处理(这个一般就是写写 SQL 然后扔到 Hive 中跑,其实和第一点有点重复了)
7.2 实时数据处理(这个涉及到消息队列,Kafka,Spark,Flink 这些,组件,一般就是 Flume 采集到数据发给 Kafka 然后 Spark 消费 Kafka 的数据进行处理)
8 数据可视化(这个我司是用 Spring Boot 连接后台数据与前端,前端用自己魔改的 echarts)
9 大数据平台开发(偏java方向的,大概就是把开源的组件整合起来整成一个可用的大数据平台这样,常见的是各种难用的 PaaS 平台)
10 数据中台开发(中台需要支持接入各种数据源,把各种数据源清洗转换为可用的数据,然后再基于原始数据搭建起宽表层,一般为了节省开发成本和服务器资源,都是基于宽表层查询出业务数据)
11 搭建数据仓库(这里的数据仓库的搭建不是指 Hive ,Hive 是搭建数仓的工具,数仓搭建一般会分为三层 ODS、DW、DM 层,其中DW是最重要的,它又可以分为DWD,DWM,DWS,这个层级只是逻辑上的概念,类似于把表名按照层级区分开来的操作,分层的目的是防止开发数据应用的时候直接访问底层数据,可以减少资源,注意,减少资源开销是减少 内存 和 CPU 的开销,分层后磁盘占用会大大增加,磁盘不值钱所以没什么关系,分层可以使数据表的逻辑更加清晰,方便进一步的开发操作,如果分层没有做好会导致逻辑混乱,新来的员工难以接手业务,提高公司的运营成本,还有这个建数仓也分为建离线和实时的)
总之就是离不开写 SQL ...
⑤ 大数据工程师和大数据开发工程师的职能有何区别
大数据工程师和大数据开发工程师两者之间没有区别。大数据工程师指的就是大数据开发工程师。大数据工程师(即大数据开发工程师)从事大数据采集、清洗、分析、治理、挖掘等技术研究,并加以利用、管理、维护和服务。
4、设计、开发、集成、测试大数据软硬件系统。
5、管理、维护并保障大数据系统稳定运行。
6、监控、管理和保障大数据安全。
7、提供大数据的技术咨询和技术服务。
(5)大数据建模工程师扩展阅读:
大数据工程师(即大数据开发工程师)的技能要求:
1、精通Java技术知识,熟悉Spark、kafka、Hive、HBase、zookeeper、HDFS、MR等应用设计及开发。
2、了解python/shell等脚本语言。
3、熟悉大数据平台架构,对ETL、数据仓库等有一定了解。
4、有数据可视化、数据分析、数学模型建立相关经验者优先考虑。
5、有爬虫系统开发经验者优先。
⑥ 想成为大数据开发工程师有哪些要求
想要成为大数据开发工程师的要求,首先我觉得你必须数学要学得相当的好,有一定的知识,不然的话,我们小数据都无法开发,还算是什么大数据开发工程师?
⑦ 大数据工程师一定要对应专业吗
是的,自学除了天才可行,大数据开发工程师是做什么的?岗位要求高吗?大数据开发工程师要负责数据仓库建设、ETL开发、数据分析、数据指标统计、大数据实时计算平台及业务开发、平台建设及维护等工作内容。熟练掌握数据仓库、hadoop生态体系、计算及二次开发、大数据平台工具的开发:开发平台、调度系统、元数据平台等工具,该岗位对于技术要求较高。
大数据开发工程师的岗位要求有哪些:
1、本科以上学历,计算机相关专业,对数据处理、数据建模、数据分析等有深刻认识和实战经验
2、熟悉HiveSQL语言,熟悉shell, python等脚本语言
3、有hadoop、spark、flink等大数据平台的使用经验
4、有数据仓库建设、商业数据分析、增长项目经验
5、java/scala至少熟练使用一种
6、熟练掌握Hadoop及Map-Rece应用开发,熟练掌握HBase、Hive、Storm、spark等大数据开发工具
7、熟悉至少一种实时计算引擎 Storm,SparkStreaming, Flink, 对hadoop生态其他组件有一定了解,比如 HBase, hadoop, Hive, Druid等
熟悉Hadoop/Spark/Hive/HBase等大数据工具,主导过大型数据平台建设者优先;
9、精通SQL,熟悉常用的关系型数据库、非关系性数据库和数据仓库,具有SQL性能优化经验;
9、了解微服务开发理念、实现技术,熟悉常见设计模式,熟练掌握SSH开发框架,熟练进行Java、Python代码编写,熟悉多线程编程
10、有Hadoop/Hive/Spark/Storm/Zookeeper 等相关开发经验或从事分布式相关系统的开发工作
11、熟悉linux/Unix系统和丰富的Java开发经验
12、3年以上企业级数据仓库开发经验,有大规模集群应用开发经验优先
13、熟悉数据仓库理论,具备复杂业务需求梳理能力
14、熟练SQL开发,精通Mysql等关系型数据库
15、熟悉Linux系统,具备shell、python等脚本开发能力者优先
16、学习能力强,喜欢研究开源新技术,有团队观念,具备独立解决问题的能力,具备扎实的计算机理论基础, 对数据结构及算法有较强的功底
看到这些要求是不是吓一跳?别慌,小编综合了多家大型互联网公司的招聘要求进行一个罗列,供大家参考了解,不同的公司对于技术的侧重点不尽相同
大数据开发工程师岗位核心职责(需要做什么):
1、大数据基础平台、大数据能力开放平台、大数据交易平台的搭建与优化;
2、基于大数据平台(Hadoop)的数据仓库工具Hive/Spark/HBase, ETL调度工具,数据同步工具的开发、使用、集成和自动化运维,以及多租户与权限控制策略的实现;
3、研发基于大数据平台的数据仓库平台产品;
4、参与大数据平台的容量规划、持续交付、业务监控、应急响应,保证平台正常运行。
5、利用大数据相关技术实现对数据的加工、分析、挖掘、处理、及数据可视化等相关工作。
6、推动团队内成员技术经验分享,关注相关前沿技术研究,通过新技术服务团队和业务。
大数据开发工程师需要具备大数据基础知识、大数据平台知识和大数据场景知识三方面的知识结构。大数据基础知识:数学基础、统计学基础和计算机基础。数学基础是大数据从业者重要的基础,因为大数据的核心是算法设计,而数学是算法设计的基础。统计学基础知识也是大数据从业者必须掌握的内容,包括基本的统计方法、绘制方法、统计算法等内容。计算机基础则包括操作系统(Linux)、计算机网络、数据结构、算法设计、数据库等内容。
大数据工程师负责创建和维护分析基础架构,该基础架构几乎可以支持数据世界中的所有其他功能。他们负责大数据架构的开发、构建、维护和测试,例如数据库和大数据处理系统。大数据工程师还负责创建用于建模,挖掘,获取和验证数据集合等流程。基本上成为数据“构建者”是一个激动人心的时刻,如果你喜欢使用新工具并且可以跳出关系数据库的框框思考,那么你将处于帮助公司适应该行业需求的主要位置。
随着国家战略支持和大数据技术的快速发展,大数据的应用场景在不断的深入,产生的影响也在不断的加大。未来几十年将由大数据驱动,大数据在促进各个领域发展的同时,也将需要更多的相关性人才。0基础学习大数据的难度是有的,但并不代表你无法实现快速的转型,选择一个合适的学习路线图学习也是可以的~
⑧ 大数据开发工程师是做什么
大数据开发工程师做的是:
1、参与大数据平台的数据架构设计,完成从业务模型到数据模型的设计;
2、基于海量数据的数据仓库,为业务搭建通用的查询和分析解决方案;
3、根据工作安排高效、高质地完成代码编写,确保符合前端代码规范。以上是大数据开发工程师目前在行业或公司中负责的工作内容。
⑨ 大数据工程师是做什么的
大数据工程师抄主要是,分析历史、预测未来、优化选择,这是大数据工程师在“玩数据”时最重要的三大任务:
找出过去事件的特征:大数据工程师一个很重要的工作,就是通过分析数据来找出过去事件的特征。找出过去事件的特征,最大的作用是可以帮助企业更好地认识消费者。通过分析用户以往的行为轨迹,就能够了解这个人,并预测他的行为。
预测未来可能发生的事情:通过引入关键因素,大数据工程师可以预测未来的消费趋势。
找出最优化的结果:根据不同企业的业务性质,大数据工程师可以通过数据分析来达到不同的目的。
(9)大数据建模工程师扩展阅读
大数据工程师需要学习的知识
1、linux
大数据集群主要建立在linux操作系统上,Linux是一套免费使用和自由传播的类Unix操作系统。而这部分的内容是大家在学习大数据中必须要学习的,只有学好Linux才能在工作中更加的得心应手。
2、Hadoop
我觉的大家听过大数据就一定会听过hadoop。Hadoop是一个能够对大量数据进行离线分布式处理的软件框架,运算时利用maprece对数据进行处理。
⑩ 大数据工程师是干什么的
据统计,我国电子商务企业已达到1000多万家,其中大中型企业就有10万多家,初步估计,未来我国对电子商务人才的需求每年约80万人,而我国目前包括高校和各类培训机构每年输出的人才数量不到10万人。人才缺口巨大已成为制约我国电商行业发展的一大瓶颈。
选择江西新华电脑学院云电商工程师专业,你将学习:
电子商务概论与政策法规、Photoshop图像处理、电子商务物流管理、HTML5+CSS3、WEB和移动界面商业案例、Windows Server2003服务器操作系统、动态网页设计PHPMYSQL、网络数据库基础(SQLServer)、JavaScript、电子商务安全与网上支付、网络SEM、SEO优化与推广、网络营销及综合实践等。