大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP

摘要：

大数据有助于取得非凡成就。目前，Hadoop平台是大数据的首选分析工具。在Hadoop生态系统中，Cloudera是最大和最知名的公司。2014年3月，英特尔宣布将向Cloudera投入大量资金。总投资增至7.4亿美元，持股比例达到18%，估值接近50亿美元。案例教学+计算机实践课时：4天学习Hadoop分布式文件系统和MapReduce框架的基础知识，如何使用其API编写程序，并讨论更大工作流的设计技术。了解Apache Pig、Apache Hive和ClouderaImpala如何通过过滤连接和其他用户定义函数支持数据转换和分析。

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第1张

大数据助力成就非凡。大数据正在改变着商业游戏规则，为企业解决传统业务问题带来变革的机遇。毫无疑问，当未来企业尝试分析现有海量信息以推动业务价值增值时，必定会采用大数据技术。

目前对大数据的分析工具，首选的是Hadoop平台。由于Hadoop深受客户欢迎，许多公司都推出了各自版本的Hadoop，也有一些公司则围绕Hadoop开发产品。在Hadoop生态系统中，规模最大、知名度最高的公司则是Cloudera。

Cloudera由来自Facebook、谷歌和雅虎的前工程师杰夫•哈默巴切(Jeff Hammerbacher)、克里斯托弗•比塞格利亚(Christophe Bisciglia)、埃姆•阿瓦达拉(Amr Awadallah)以及现任CEO甲骨文前高管迈克•奥尔森(Mike Olson)在2008年创建。Intel在2014年3月宣布向Cloudera投入大笔资金，总投资额增至7.4亿美元，持股比例达到18%，估值近50亿美元。

课程简介

本课程将为你提供操作和维护Hadoop 集群必要步骤的全面理解与宝贵的实践经验。从安装配置到负载平衡优化，本课程都是Hadoop管理员面对真实环境中所有挑战的最佳能力提升手段。

本课程的授课讲师有着多年在一线从事Hadoop大数据项目的资深讲师，采用原理技术剖析和实战案例相结合的方式开展互动教学、强化以建立大数据项目解决方案为主体的技术讨论与咨询，在学习的同时促进讲师学员之间的交流，让每个学员都能在课程培训过程中学到实实在在的大数据技术知识，具备实际项目动手实践能力。

课程对象

系统管理员、运维经理、开发人员
涉及到大数据处理的数据中心运行、规划、设计等相关人员

========================================================================

4月上海开班时间：

管理员（4月1-4日）Cloudera Certified Administrator For Apache Hadoop；

开发者（4月23-26日）Cloudera Certifed Developer For Spark And Hadoop；

【其他课程安排请咨询】15601685012(小工老师)

QQ群：Cloudera大数据培训 308453209

课程内容：

【Cloudera Certified Administrator For Apache Hadoop 管理员课程】

课时：4天

学习系统管理的概念和Apache Hadoop的最佳实践；

从安装和配置到负载均衡和调优；

这个4天的的课程通过动手时间来赋予你部署的经验；

以及更多的安全方面的经验和故障排除；

课程结束后，学员被鼓励去参加Cloudera和Apache Hadoop管理员（CCAH）考试，可以代理报名；

【课程内容】

1、Hadoop分布式文件系统（HDFS）

2、YARN/MapReduce的工作原理

3、如何优化Hadoop机群所需要的硬件配置

4、搭建Hadoop机群所需要考虑的网络因素

5、Hadoop机群维护和控制

6、如何利用Hadoop配置选项进行系统性能调优

7、如何利用FairScheduler为多用户提供服务级别保障

8、Hadoop机群维护和监控

9、如何使用Flume从动态生成的文件加载到Hadoop

10、如何使用Sqoop从关系型数据加载数据

11、Hadoop生态系统工具（如Hive、Impala、Pig和Base）

【学员基础】

具备基本Linux系统管理经验。不需要事先掌握Hadoop相关知识。

【授课形式】

案例教学+上机实践

【Cloudera Certifed Developer For Spark And Hadoop 开发者课程】

课时：4天

学习Hadoop分布式文件系统（HDFS）基础和MapReduce框架以及如何利用其API来编写程序，

讨论为更大型的工作流程而设计技术。

这门4天的课程涵盖了为MapReduce程序修复漏洞和优化性能所需的高级技巧。

程序员课程也引入了Apache生态项目比如Hive、Pig、HBase、Flume和Oozie。

【课程内容】

1、MapReduce与HDFS内核知识以及如何编写MapReduce程序

2、Hadoop开发的最佳实践，调试、实现工作流及通用算法

3、如何利用Hive、Pig、Sqoop、Flume、Oozie及其他Hadoop的组件

4、按需定制WritableComparables与InputFormats处理复杂的数据类型

5、利用MapReduce编写、执行连接操作以整合不同数据集合

6、用于现实世界数据分析所需的高级HadoopAPI主题

7、用Java写MapReduce程序，用Streaming写MapReduce程序

8、调试MapReduce代码的策略，利用localjobrunner在本地测试MapReduce代码

9、Partitioners和Reducers如何一起工作,定制化Partitioners

10、定制Writable和WritableComparable

11、用SequenceFile和Avro数据文件存储二进制数据

【学员基础】

该课程适合具有一定编程经验的程序开发人员。由于课程中需要完成Hadoop相关编程练习，熟悉Java者优先

【授课形式】

案例教学+上机实践

【Cloudera 数据分析课程】

课时：4天

针对任何需要在Hadoop上实时地通过SQL和熟悉的脚本来管理、操纵和查询大型复杂数据的人。

学习Apache Pig、Apache Hive和Cloudera Impala如何通过过滤联接和其他用户自定义的功能

来支持数据的转型和分析。

【课程内容】

1、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据

2、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程

3、pig处理复杂数据，复杂/nested嵌套的数据类型、用pig分析广告战役的数据

4、pig的多数据组操作，pig链接多数据组、用pig分析离散的数据组

5、用流处理和UDFs扩展pig，Macros和Imports、contributed functions，用其他语言和pig一起处理数据

6、pig故障排查和优化，用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能

7、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例

8、hive的关系数据分析、数据管理、文本处理、优化及扩展，在shell、脚本和hue上运行hive查询

9、impala和hive、pig、关系数据库的不同、使用impala shell

10、采样impala分析数据，过滤、排序and limiting results，提升impala性能，impala的交互式分析

11、对比map reduce、pig、hive、impala和关系数据库

【学员基础】

该课程适合有SQL经验和基本UNIX和Linux命令的数据分析师、业务分析师和管理员

事先无需Java和Apache Hadoop的经验

【授课形式】

案例教学+上机实践

==============================================================

授课名师龚少成（cloudera公司原厂资深讲师）

Cloudera公司系统工程师
Cloudera管理员认证讲师
清华大学硕士，在加入Cloudera之前为Intel中国大数据部门解决方案部技术负责人，带领过Intel大数据团队成功实施过国内最早的一批大数据平台建设项目，包括中国农业银行，太平洋保险和上海电信大数据平台，有着非常丰富的项目实战经验。在加入Intel之前，龚少成是eBay的高级软件工程师，负责eBay电子商务网站的计费和支付系统建设。
【授课风格】实践分享、善于启发引导、课程形式多样、风趣幽默、互动性强。

==================授课现场图=====================

北京大数据管理员CCAH培训

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第2张

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第3张

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第4张

证书样本

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第5张

===================================================================

上海开发人员CCDH(Developer For Spark And Hadoop)培训

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第6张

证书样本

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第7张

===================================================================

欢迎有兴趣参加cloudera大数据认证的小伙伴联系咨询！

【其他课程安排请咨询】手机：15601685012 QQ：358650622（助教）

QQ群：Cloudera大数据培训 308453209

培训费：7000元/人考试费：2200元/人
包含培训费、资料、茶歇、结业证书等费用

======================我是分割线=========================

如有企业需要购买CDH企业版，或相关服务，也可以联系我！！！

=======================================================

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP

相关文章

云小课｜DGC数据开发之基础入门篇

HiveSQL 数据定义语言（DDL）

使用 elementUI 树形控件Tree 编辑数据

单表千亿电信大数据场景，使用Spark+CarbonData替换Impala案例

mysql设置数据库默认编码和表名不区分大小写

软件架构自学笔记----分享“去哪儿 Hadoop 集群 Federation 数据拷贝优化”

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表