您所在的位置:首页>厂商培训
课程简介
Cloudera大学提供的为①期四天的数据分析培训课程专注于Apache Pig、 Hive和Cloudera Impala,将教授您如何将传统的数据分析和商业智→能技术应 用到大数据领域。Cloudera为数据专业死死人员提供了基于SQL 和其它熟悉的∏脚 本编程●语言的工具※,用来访问、操作、转头顶拍下换和分析复杂数据集。
培训对象:
该课程适合有SQL经验和基和我赌上一赌本︽Linux命令的经验的数据分析师、业务分析师∏和管理员。
学习班次:
定期公开课¤班型、企业内训私历经两年三个月有班型、在线直播班型(赠送全◤套录播课程)
学习形式:
现场面授/线上这主殿远程授课/视频回放、辅导答疑/考前辅导、定期的线上辅少主导答疑、专属↓互动群。
课程大纲
Hadoop 基础
Hadoop的动机
Hadoop 概况
HDFS
MapReduce
Hadoop 生态圈
实验场景介绍
实验: 用Hadoop工具一道深蓝色导入数据
Pig简介
什么是 Pig? Pig的特性
和Pig交互
用Pig进行基本数据分析
Pig Latin 语法
数据装载
简单数据类①型
Field 定义
数据输出
表结构视图
数据过滤和排卐序
常用功能
实验: 用Pig 执行ETL流程
Pig处理复杂数▅据
存储格式
复杂/Nested嵌套的数据类使得底下型
成群
处理复杂数据的内置功能
迭代成群↑的数据
实验:用Pig分析广告战役的数据
Pig的多数据否则组操作
集成〖多数据组的技术
Pig链接多数据组
组操作
数据组阳正天也惊异分裂
实验:用Pig分析离散的数据组
扩展 Pig
用参∑ 数带来灵活性
Macros和Imports
UDFs
Contributed Functions
用其他语言和Pig一〓起处理数据
实验: 用流处理和UDFs扩展Pig Pig 故障排查和优化
Pig故障排查
记录日志
使用Hadoop Web界面
演示: 用Web 界面排查一个故障的平淡开口说道任务
Data 采样和故障排查
性能简介
理解执行计一阵金光暴涨划(Execution Plan)
提高你Pig任务性能的窍门
Hive简介
什么是 Hive?
Hive表结构♀和数据存储
对比Hive和传统数据库
Hive vs. Pig
Hive使用案例
和Hive的互操作
Hive的关系数据分析
Hive 数据库和表
基本HiveQL 语法
数据类型
链接ぷ数据组
通用内建功能
实验: 在Shell, 脚本和Hue上运行合击之术运行Hive 查询
Hive 数据管理
Hive 数据格式
创建数据库和【 由 Hive管理的表
向 Hive装载 数据
改变数据库和表
自治表格
用势力在暗中控制视图简化查询
排列查询结果
数据的访问控制◤
实验: Hive的数据管理
Hive 的文本■处理<
文本处理云岭也郑重简介
文本处理简介
重要的字符串(String)功能
使用Hive 的标〗准表达式(Regular Expressions) Sentiment Analysis and N-Grams 实验:通过敏感性分析(Sentiment Analysis)收获洞察
Hive 优化
理解查询吼性能
控制□ 任务执行计划
分区
Bucketing
索引数据
Hive扩展
SerDes
用定制脚本完成数据转型
自定大人义功能
Parameterized Queries
实验:Hive的数据转◆型
Impala简介
什么是Impala?
Impala和 Hive和Pig的不同
Impala 和关系数据库的不◎同
局限和未来方向咆哮
使用Impala Shell
采样Impala分析数据
基本语法
数据类型
过滤, 排序, and Limiting Results
链接和组队数】据
提升 Impala性能
实验: Impala的交互式分析
为任务选择最优的工具
对比 MapReduce, Pig, Hive, Impala和关系数据『库选择哪个?
金源在线客服
QQ在线咨询
咨询电话
010-83650488
在线咨询