大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP

摘要:
大数据有助于取得非凡成就。目前,Hadoop平台是大数据的首选分析工具。在Hadoop生态系统中,Cloudera是最大和最知名的公司。2014年3月,英特尔宣布将向Cloudera投入大量资金。总投资增至7.4亿美元,持股比例达到18%,估值接近50亿美元。案例教学+计算机实践课时:4天学习Hadoop分布式文件系统和MapReduce框架的基础知识,如何使用其API编写程序,并讨论更大工作流的设计技术。了解Apache Pig、Apache Hive和ClouderaImpala如何通过过滤连接和其他用户定义函数支持数据转换和分析。
大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第1张
大数据助力成就非凡。大数据正在改变着商业游戏规则,为企业解决传统业务问题带来变革的机遇。毫无疑问,当未来企业尝试分析现有海量信息以推动业务价值增值时,必定会采用大数据技术。
目前对大数据的分析工具,首选的是Hadoop平台。由于Hadoop深受客户欢迎,许多公司都推出了各自版本的Hadoop,也有一些公司则围绕Hadoop开发产品。在Hadoop生态系统中,规模最大、知名度最高的公司则是Cloudera。
Cloudera由来自Facebook、谷歌和雅虎的前工程师杰夫•哈默巴切(Jeff Hammerbacher)、克里斯托弗•比塞格利亚(Christophe Bisciglia)、埃姆•阿瓦达拉(Amr Awadallah)以及现任CEO甲骨文前高管迈克•奥尔森(Mike Olson)在2008年创建。Intel在2014年3月宣布向Cloudera投入大笔资金,总投资额增至7.4亿美元,持股比例达到18%,估值近50亿美元。
课程简介
本课程将为你提供操作和维护Hadoop 集群必要步骤的全面理解与宝贵的实践经验。从安装配置到负载平衡优化,本课程都是Hadoop管理员面对真实环境中所有挑战的最佳能力提升手段。
本课程的授课讲师有着多年在一线从事Hadoop大数据项目的资深讲师,采用原理技术剖析和实战案例相结合的方式开展互动教学、强化以建立大数据项目解决方案为主体的技术讨论与咨询,在学习的同时促进讲师学员之间的交流,让每个学员都能在课程培训过程中学到实实在在的大数据技术知识,具备实际项目动手实践能力。
 
课程对象
  • 系统管理员、运维经理、开发人员
  • 涉及到大数据处理的数据中心运行、规划、设计等相关人员

========================================================================

4月上海开班时间:

管理员(4月1-4日)Cloudera Certified Administrator For Apache Hadoop;

开发者(4月23-26日)Cloudera Certifed Developer For Spark And Hadoop;

【其他课程安排请咨询】15601685012(小工老师)

QQ群:Cloudera大数据培训 308453209

课程内容:

【Cloudera Certified Administrator For Apache Hadoop 管理员课程】

    课时:4天

    学习系统管理的概念和Apache Hadoop的最佳实践;

    从安装和配置到负载均衡和调优;

    这个4天的的课程通过动手时间来赋予你部署的经验;

    以及更多的安全方面的经验和故障排除;

    课程结束后,学员被鼓励去参加Cloudera和Apache Hadoop管理员(CCAH)考试,可以代理报名;

 

    【课程内容】

    1、Hadoop分布式文件系统(HDFS)

    2、YARN/MapReduce的工作原理

    3、如何优化Hadoop机群所需要的硬件配置

    4、搭建Hadoop机群所需要考虑的网络因素

    5、Hadoop机群维护和控制

    6、如何利用Hadoop配置选项进行系统性能调优

    7、如何利用FairScheduler为多用户提供服务级别保障

    8、Hadoop机群维护和监控

    9、如何使用Flume从动态生成的文件加载到Hadoop

    10、如何使用Sqoop从关系型数据加载数据

    11、Hadoop生态系统工具(如Hive、Impala、Pig和Base)

 

    【学员基础】

    具备基本Linux系统管理经验。不需要事先掌握Hadoop相关知识。

 

    【授课形式】

    案例教学+上机实践

 

   【Cloudera Certifed Developer For Spark And Hadoop 开发者课程】

    课时:4天

    学习Hadoop分布式文件系统(HDFS)基础和MapReduce框架以及如何利用其API来编写程序,

    讨论为更大型的工作流程而设计技术。

    这门4天的课程涵盖了为MapReduce程序修复漏洞和优化性能所需的高级技巧。

    程序员课程也引入了Apache生态项目比如Hive、Pig、HBase、Flume和Oozie。

   

    【课程内容】

    1、MapReduce与HDFS内核知识以及如何编写MapReduce程序

    2、Hadoop开发的最佳实践,调试、实现工作流及通用算法

    3、如何利用Hive、Pig、Sqoop、Flume、Oozie及其他Hadoop的组件

    4、按需定制WritableComparables与InputFormats处理复杂的数据类型

    5、利用MapReduce编写、执行连接操作以整合不同数据集合

    6、用于现实世界数据分析所需的高级HadoopAPI主题

    7、用Java写MapReduce程序,用Streaming写MapReduce程序

    8、调试MapReduce代码的策略,利用localjobrunner在本地测试MapReduce代码

    9、Partitioners和Reducers如何一起工作,定制化Partitioners

    10、定制Writable和WritableComparable

    11、用SequenceFile和Avro数据文件存储二进制数据

 

    【学员基础】

    该课程适合具有一定编程经验的程序开发人员。由于课程中需要完成Hadoop相关编程练习,熟悉Java者优先

 

    【授课形式】

    案例教学+上机实践

 

 

    【Cloudera 数据分析课程】

    课时:4天

    针对任何需要在Hadoop上实时地通过SQL和熟悉的脚本来管理、操纵和查询大型复杂数据的人。

    学习Apache Pig、Apache Hive和Cloudera Impala如何通过过滤联接和其他用户自定义的功能

    来支持数据的转型和分析。

   

    【课程内容】

    1、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据

    2、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程

    3、pig处理复杂数据,复杂/nested嵌套的数据类型、用pig分析广告战役的数据

    4、pig的多数据组操作,pig链接多数据组、用pig分析离散的数据组

    5、用流处理和UDFs扩展pig,Macros和Imports、contributed functions,用其他语言和pig一起处理数据

    6、pig故障排查和优化,用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能

    7、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例

    8、hive的关系数据分析、数据管理、文本处理、优化及扩展,在shell、脚本和hue上运行hive查询

    9、impala和hive、pig、关系数据库的不同、使用impala shell

    10、采样impala分析数据,过滤、排序and limiting results,提升impala性能,impala的交互式分析

    11、对比map reduce、pig、hive、impala和关系数据库

 

    【学员基础】

    该课程适合有SQL经验和基本UNIX和Linux命令的数据分析师、业务分析师和管理员

    事先无需Java和Apache Hadoop的经验

 

    【授课形式】

    案例教学+上机实践

 

==============================================================

授课名师 龚少成  (cloudera公司原厂资深讲师)
  • Cloudera公司系统工程师
  • Cloudera管理员认证讲师
  • 清华大学硕士,在加入Cloudera之前为Intel中国大数据部门解决方案部技术负责人,带领过Intel大数据团队成功实施过国内最早的一批大数据平台建设项目,包括中国农业银行,太平洋保险和上海电信大数据平台,有着非常丰富的项目实战经验。在加入Intel之前,龚少成是eBay的高级软件工程师,负责eBay电子商务网站的计费和支付系统建设。
  • 【授课风格】实践分享、善于启发引导、课程形式多样、风趣幽默、互动性强。

==================授课现场图=====================

北京大数据管理员CCAH培训

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第2张

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第3张

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第4张

证书样本

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第5张

===================================================================

上海开发人员CCDH(Developer For Spark And Hadoop)培训

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第6张

 证书样本

大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP第7张

===================================================================

欢迎有兴趣参加cloudera大数据认证的小伙伴联系咨询!

【其他课程安排请咨询】手机:15601685012 QQ:358650622(助教)

QQ群:Cloudera大数据培训 308453209

  • 培训费:7000元/人 考试费:2200元/人
  • 包含培训费、资料、茶歇、结业证书等费用

======================我是分割线=========================

如有企业需要购买CDH企业版,或相关服务,也可以联系我!!!

=======================================================

免责声明:文章转载自《大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇VMware虚拟机不能启动后管理员删除了vmdk文件GUI学习之二十八—QMessageBox下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

云小课|DGC数据开发之基础入门篇

阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说)、深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云。更多精彩内容请单击此处。 摘要:欢迎来到DGC数据开发的世界,花十分钟跟着云小课一起学习云数据开发。本文主要介绍DGC数据开发的基本概念、优势、应用场景及数据开发的示例,帮助您快速掌握智能数据开发。 本文...

HiveSQL 数据定义语言(DDL)

第一章、数据定义语言(DDL)概述 1.1 DDL语法的作用 数据定义语言 (Data Definition Language, DDL),是SQL语言集中对数据库内部的对象结构进行创建,删除,修改等的操作语言,这些数据库对象包括database(schema)、table、view、index等。核心语法由CREATE、ALTER与DROP三个所组成。D...

使用 elementUI 树形控件Tree 编辑数据

操作新增/编辑功能时初始化数据: 应用属性 default-checked-keys 给Tree节点赋默认值(赋值数据为节点数组Arr)前,应先清空数组Arr,并且配合使用this.$refs.tree.setCheckedKeys([])。...

单表千亿电信大数据场景,使用Spark+CarbonData替换Impala案例

【背景介绍】 国内某移动局点使用Impala组件处理电信业务详单,每天处理约100TB左右详单,详单表记录每天大于百亿级别,在使用impala过程中存在以下问题: 详单采用Parquet格式存储,数据表使用时间+MSISDN号码做分区,使用Impala查询,利用不上分区的查询场景,则查询性能比较差。 在使用Impala过程中,遇到很多性能问题(比如ca...

mysql设置数据库默认编码和表名不区分大小写

环境:mysql7.5 1、设置mysql的默认字符编码 只需在my.ini中的[mysqld]组名的末尾添加: character-set-server=utf8 重启mysql mysql> show variables like 'character%' character_set_client utf8 character_...

软件架构自学笔记----分享“去哪儿 Hadoop 集群 Federation 数据拷贝优化”

去哪儿 Hadoop 集群 Federation 数据拷贝优化 背景 去哪儿 Hadoop 集群随着去哪儿网的发展一直在优化改进,基本保证了业务数据存储量和计算量爆发式增长下的存储服务质量。然而,随着集群规模的发展,单组 NameNode 组成的集群也到达了新的瓶颈:因为 NameNode 内存使用和元数据量正相关,在 180GB 堆内存配置下,元数据量...