❶ 大数据培训到底是培训什么
大数据培训,目前主要有两种:
1、大数据开发
数据工程师建设和优化系统。学内习hadoop、spark、storm、超大集群容调优、机器学习、Docker容器引擎、ElasticSearch、并发编程等;
2、数据分析与挖掘
一般工作包括数据清洗,执行分析和数据可视化。学习Python、数据库、网络爬虫、数据分析与处理等。
大数据培训一般是指大数据开发培训。
大数据技术庞大复杂,基础的技术包含数据的采集、数据预处理、分布式存储、数据库、数据仓库、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面。
❷ 大数据人工智能培训
How:出于兴趣而非需求,自学人工智能的方法论
人们可以对自己从哪儿来、到哪儿去感兴趣,去了解柏拉图、维特根斯坦和齐泽克,了解朴素唯物与机械主义,但并不需要成为哲学家。
如果你并非为了成为研究者,只是出于兴趣学习人工智能,完全不必被铺天盖地的代码困住手脚,只需遵循以下原则:
1、明确内涵和现实
每个人都知道人工智能的目标是「实现与人类相似的智能」,当下的我们处在哪个阶段?已经取得了哪些成果?
人工智能早已进入我们的生活,搜索引擎的排序、美颜相机的美化效果、今日头条等信息流推荐类内容产品,全部都是当下的人工智能应用。
虽然与思考和智能相去甚远、被称作「弱人工智能」,它依然能比人类更高效的完成特定任务。除了这些互联网领域的应用,人脸识别验票闸机、医院的叫号系统这类行业应用,甚至港口管理、油田预测、新药研发,通通都有弱人工智能的身影。
如果提起人工智能,出现在你脑中的是 Samantha、Wall-E 或是终结者这些机器人形象,恐怕需要更近一步了解现实。
这些应用如何实现?为什么能实现?
没有任何学科建立在空谈的基础上,人工智能也不例外。
接下来,我们需要——
2、理解「黑话」
机器学习、深度学习、监督学习、计算机视觉、神经网络、RNN……它们是什么?和人工智能有什么关系?
如果你听说过或是了解以上名词的含义,恭喜你,你已经踏入了人工智能的大门。
这些名词就像是历史教科书上的事件名,或是数学中的定理,了解它们的内涵、探寻它们之间的关系,能帮助你找到这门学科的层次和边界。
比如:
「机器学习」、「深度学习」、「监督学习」是人工智能得以实现的方式,其中「深度学习」属于「机器学习」的分支,是以超过 8 层的「神经网络」为标志的模型训练方法;
「监督学习」则是从输入数据是否带有标签的角度对「机器学习」进行划分,除此之外还有「无监督学习」和「半监督学习」;
RNN 则是「神经网络」的分支,即「循环神经网络」……
那,模型、数据、标签又是什么?
顺着这些「黑话」和它们关联的「黑话」,你会渐渐理解人工智能的能做什么、不能做什么,为什么会出现某些现象(如 AlphaGo),以及接下来会发生什么。
还有很重要的一点——
3、抛弃想象
想象宇宙中的其他文明,想象一个由机器控制的社会,想象一个为爱落泪的机器人。想象给了我们无限可能,是人类最宝贵的能力之一,不过我们的世界依然建立在「真实」之上。把「想象」留给艺术,把「真实」留给科学。
What:我们该怎么做?
有了方法论,接下来当然是……获取优质的信息。
1、课程类
经典的系统课程有很多,例如 Andrew Ng 的斯坦福机器学习课程等等,答案里也有很多推荐质量相当高,在此不多做赘述。
除了学院派系统课程,很多媒体或内容平台上也有工业界人工智能专家的「公开课」。这些「公开课」更类似于讲座,有时是对现状的思考、总结,有时会针对人工智能的某一现实痛点展开。如果上一节的「黑话」过关,可以相当轻松的学到不少书本上没有的知识,以及他人的思考沉淀(这部分相当宝贵),很适合对某一领域感兴趣的人研读。
2、机构、学术会议及论文
人工智能领域是高度依赖学术界,并保留有非常强学术传统的领域。
如面向 CV 领域的视觉与学习青年学者研讨会(Valse),面向NLP领域的中文人工智能学会等,这些学会机构除了定期举办公开讲座,同时会会不定期的发布相关内容。
以及这些学会机构往往也会举办暑期学校等培训课程,质量较高,对细分领域感兴趣不妨了解课程构成后报名学习。
论文也是一个不错的学习途径,知网可以搜索论文购买阅读。
以及人工智能领域是一个高度信息流通的学科,如果英文过关,不妨前往 arXiv.org阅读英文论文。
3、媒体及社交媒体
除了学术熏陶,新鲜新闻资讯可以帮助我们了解当下、提供启发。
目前中文领域有不少细分媒体专注人工智能领域,一些科技媒体的人工智能子版块质量也相当不错。
以及不少研究者在微博、微信等社交媒体上也相当活跃,同时知乎也有不少人工智能大 V 正在活跃,可以根据自己感兴趣的方向进行关注。
4、书籍
「西瓜书」《机器学习》,李航老师的《统计学习方法》,「三驾马车」巨著《深度学习》,都是相当经典的入门书。
太难了看不懂?《图解深度学习》、《科学的极致|漫谈人工智能》、《Python神经网络编程》这些向科普方向倾斜的书籍也不错哦。
Why:真正的知识都是免费的
说了这么多、推荐了这么多,点赞、收藏对于一个人的自学旅程来说,连开始都算不上。
重要的是去看、去思考、去实践,远比做出一个「我想要」的姿态重要得多。
寻求知识的道路异常艰辛,在此引用汪丁丁教授的一段话作为结尾:
「一流的知识只能免费,这是因为它只吸引少数能够理解它的人。这些人是最可宝贵的……他们投入的理解力和伴随着理解一流知识的艰辛,价值远远超过任何付费知识的市场价格。」
愿我们都有与一流知识相配的美德。
❸ 大数据需要培训多长时间都学什么
如果要学抄习大数据,不管你是零袭基础,还是有一定的基础,都是要懂至少一种计算机编程语言,因为大数据的开发离不开编程语言,不仅要懂,还要精通!但这门编程语言不一定是java。
比如说,如果你主攻Hadoop开发方向,是一定要学习java的,因为Hadoop是由java来开发的。
如果你想要主攻spark方向,是要学习Scala语言的,每个方向要求的编程语言是不同的。
如果你是想要走数据分析方向,那你就要从python编程语言下手,这个也是看自己未来的需求的。
大数据是需要一定的编程基础的,但具体学习哪一门编程,自己可以选择的。其实只要学会了一门编程语言,其他编程语言也是不在话下的。