大数据技术入门
课程组成:本课程包总共分为12大章节,共59课时
课程简介:我们想要学习大数据首先我们需要对大数据有一定的了解,从小白到高级工程师,我们都要需要具备哪些条件和因素,通过本套课程的学习让你对大数据有一个全方位的了解,在大数据这条路上不在迷茫。
课程大纲:
第一章:linux
第1节:课程介绍
第2节:linux安装和网络配置
第3节:linux基础操作
第4节:linux用户管理和系统管理
第5节:linux网络配置和软件安装
第6节:linux虚拟机克隆和无密登录
第二章:hadoop
第1节:hadoop简介
第2节:hadoop standalone安装
第3节:hadoop pseudo安装(一)
第4节:hadoop pseudo安装(二)
第5节:hadoop cluster安装
第三章:hdfs
第1节:hdfs基本原理、读写删流程
第2节:namenode和datanode工作机制
第3节:hdfs api
第四章:mapreduce
第1节:mapreduce介绍、第一个mr-wordcount
第2节:mapreduce执行流程 shuffle流程
第3节:mapreduce编程
第五章:yarn
第1节:yarn介绍
第2节:ha介绍(一)
第3节:ha介绍(二)
第4节:mr reduce join
第5节:mr map join
第六章:hbase
第1节:hbase简介、时间同步
第2节:habse安装部署、hbase架构简介
第3节:hbase读写流程
第4节:hbase shell
第5节:hbase api
第6节:python基本操作
第七章:hive
第1节:hbase filter
第2节:hbase phienix
第3节:hive简介
第4节:hive的安装
第5节:hive 数据类型 ddl
第6节:hive的dml查询
第7节:hive分区分桶
第8节:hive udf
第9节:hive server2 dbvis
第八章:sqoop scala
第1节:scala简介 基本语法
第2节:scala集合
第3节:sqoop import export
第九章:scala flume
第1节:scala函数
第2节:scala面向对象
第3节:flume简介 第一个agent配置
第4节:flume的常用配置
第十章:kafka spark core
第1节:kafka简介
第2节:kafka的安装部署
第3节:生产者消费者api简介
第4节:flume和kafka整合
第5节:spark简介 local模式部署
第6节:spark standalone模式部署
第7节:spark idea编写和测试运行
第8节:rdd简介
第十一章:spark sql
第1节:spark core rdd(一)
第2节:spark core rdd(二)
第3节:spark sql简介 shell操作
第4节:spark sql(一)
第5节:spark sql(二)
第十二章:spark streaming
第1节:spark streaming简介、基本操作
第2节:spark streaming 整合kafka