学习如何将数据导入到Apache Hadoop机群并使用Spark、Hive、Flume、Sqoop、Impala及其他Hadoop生态系统工具对数据进行各种操作和处理分析。
在为期四天的培训中,学员将学习关键概念和掌握使用最新技术和工具将数据采集到Hadoop机群并进行处理。通过学习掌握诸如Spark、Hive、Flume、Sqoop和Impala这样的Hadoop生态系统工具和技术,Hadoop开发员将具备解决实际大数据问题和挑战的能力。本课程包含了大量的实操及编程练习来帮助学员熟悉并掌握各种工具,并最终获得在实际工作中针对特定的问题或场景来选取最佳解决工具或技术的能力。Spark及Hadoop开发员培训报名就上活动家。
培训内容
通过讲师在课堂上的讲解,以及实操练习,学员将学习Apache Spark及如何将其集成到整个Hadoop生态系统中去,包括以下内容:
数据是如何在Hadoop机群里进行分布式存储及处理的
如何使用Sqoop和Flume导入数据
如何使用Apache Spark处理分布式数据
如何使用Impala及Hive将结构化数据建模成表并进行分析查询
如何根据数据使用场景来确定最佳存储格式
数据存储最佳实践
培训对象及学员基础
本课程适合准备报考CCA Spark及Hadoop开发员认证考试的技术人员。虽然通过该认证考试,考生仍然需要做进一步的学习和准备,但是本课程涵盖了在该认证考试中考核的很多主题和知识点。
在参加完本培训后,我们建议学员参加此课程的一个后继课程:“设计和创建大数据应用”
课程介绍
Hadoop及生态系统介绍
Hadoop体系结构及HDFS
使用Apache Sqoop导入关系数据
Impala及Hive介绍
使用Impala及Hive管理数据及建模
数据格式
数据分区
Apache Flume实时数据采集
Spark基础
编写和部署Spark应用
Spark的并行处理
Spark缓存和持久化
Spark数据处理的常见模式
预览:SparkSQL
总结
Spark及Hadoop开发员培训地址:https://www.huodongjia.com/event-661863863.html
在线联系QQ:2098529914手机/微信:18117219833
欢迎使用活动家APP查询报名《Spark及Hadoop开发员培训》,官方APP:appstore及各大应用市场搜索:活动家
精彩评论