各有關(guān)單位:
互聯(lián)網(wǎng)企業(yè)和云計(jì)算服務(wù)企業(yè)每天都會(huì)產(chǎn)生大量的數(shù)據(jù)并面臨高并發(fā)的嚴(yán)峻考驗(yàn),傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)已經(jīng)無(wú)法滿足大數(shù)據(jù)量高并發(fā)的要求,何以解憂?Hadoop!我中心針對(duì)目前企事業(yè)單位信息技術(shù)研發(fā)人員對(duì)Hadoop大數(shù)據(jù)處理技術(shù)的緊迫需求,設(shè)計(jì)推出了Hadoop大型應(yīng)用開發(fā)實(shí)戰(zhàn)課程。
具體課程事宜如下:
一、課程目標(biāo)
全面掌握Hadoop的架構(gòu)原理和使用場(chǎng)景;
全程項(xiàng)目實(shí)戰(zhàn)訓(xùn)練;
徹底掌握使用Hadoop進(jìn)行MapReduce程序開發(fā);
熟悉分布式計(jì)算領(lǐng)域的常用算法。
二、學(xué)習(xí)對(duì)象
軟件工程師、數(shù)據(jù)庫(kù)開發(fā)人員、網(wǎng)絡(luò)后臺(tái)開發(fā)人員、運(yùn)維人員等。學(xué)員要求有一定的Java編程基礎(chǔ)。
三、授課師資
王老師 國(guó)內(nèi)早從事于Hadoop框架應(yīng)用程序軟件開發(fā)以及Hadoop解決方案專家。業(yè)界知名IT技術(shù)培訓(xùn)講師、多家公司的技術(shù)顧問(wèn)。
四、培訓(xùn)證書
本課程頒發(fā)雙證,證書查詢:www.ncie.gov.cn;www.zpedu.org
1、工業(yè)和信息化部人才交流中心頒發(fā)的《Hadoop架構(gòu)師》證書。
2、中國(guó)信息化培訓(xùn)中心頒發(fā)的《Hadoop架構(gòu)師》證書。
證書可作為專業(yè)技術(shù)人員職業(yè)能力考核的證明,以及專業(yè)技術(shù)人員崗位聘用、任職、定級(jí)和晉升職務(wù)的重要依據(jù)。
五、培訓(xùn)費(fèi)用
4500 元/人(含培訓(xùn)費(fèi)、考試費(fèi)、證書費(fèi)、資料費(fèi)、午餐) 食宿統(tǒng)一安排,費(fèi)用自理。(請(qǐng)學(xué)員帶二寸彩照2張—背面注明姓名,身份證復(fù)印件一張)。
六、具體課程安排
日程
|
模塊單元
|
模塊單元
|
第 一 天
|
第1個(gè)主題:Hadoop MapReduce 1. Hadoop JobTracker 剖析 2.Hadoop TaskTracker 剖析 3.Hadoop 任務(wù)提交流程剖析 第2個(gè)主題: Hadoop MapReduce Streaming編程 1. Hadoop Streaming 和 Java MapReduce Api 差異 2. 使用 MapReduce 實(shí)現(xiàn)數(shù)據(jù)庫(kù)功能 第3個(gè)主題:MapReduce分布式程序 1. MapReduce流程 2.剖析一個(gè)MapReduce程序 3.基本MapReduceAPI 概念 4.驅(qū)動(dòng)代碼
|
5.Mapper 6.Reducer 7.API 使用Eclipse進(jìn)行快速開發(fā) 8.新MapReduce API 第4個(gè)主題:Hadoop 核心代碼剖析 1. Hadoop Mapper 類核心代碼剖析 2. Hadoop Reducer 類核心代碼剖析 第5個(gè)主題:HDFS分布式文件系統(tǒng)編程 1. Hadoop HDFS 剖析 2. Hadoop NameNode 剖析 3. Hadoop DataNode 剖析 4. hadoop I/O 操作 5. 使用Hadoop HDFS API對(duì)HDFS編程
|
第 二 天
|
第1個(gè)主題:Hadoop Mapreduce編程 1.ToolRunner介紹 2.使用MRUnit進(jìn)行測(cè)試 3.利用Combiners來(lái)減少中間數(shù)據(jù) 4.使用Configure和Close方法來(lái)進(jìn)行Map/Reduce設(shè)置和關(guān)閉 5.編寫Partitioner來(lái)優(yōu)化負(fù)載平衡 6.直接訪問(wèn)Hadoop分布式文件系統(tǒng)(HDFS) 7.使用分布式緩存(Distributed Cache) 第2個(gè)主題:MapReduce的優(yōu)化 1. map優(yōu)化 2. reduce優(yōu)化 3. 小文件優(yōu)化
|
第3個(gè)主題:MapReduce的任務(wù)調(diào)度 1. Queue調(diào)度的使用 2. 公平調(diào)度的使用 3. 能力調(diào)度的使用 第4個(gè)主題:MapReduce編程實(shí)戰(zhàn) 1. Hadoop的join操作 2. Hadoop的二次排序 3. Hadoop的海量日志分析 第5個(gè)主題:flume+hadoop日志收集實(shí)戰(zhàn) 1. flume介紹 2. flume核心組件講解 3. flume自帶的組件分析 4. flume二次開發(fā)實(shí)戰(zhàn)
|
第 三 天
|
第1個(gè)主題:Hadoop的來(lái)源和動(dòng)機(jī) 1.傳統(tǒng)大規(guī)模系統(tǒng)存在的問(wèn)題 2.對(duì)一種新的解決方案的需求 第2個(gè)主題:Hadoop安裝和部署準(zhǔn)備 Hadoop系統(tǒng)模塊組件概述 Hadoop試驗(yàn)集群的部署結(jié)構(gòu) Hadoop 安裝依賴關(guān)系 Hadoop 生產(chǎn)環(huán)境的部署結(jié)構(gòu) 第3個(gè)主題:Hadoop集群安裝和部署 Red hat Linux基礎(chǔ)環(huán)境搭建 上機(jī)實(shí)驗(yàn) Hadoop 單機(jī)系統(tǒng)版本 安裝配置 上機(jī)實(shí)驗(yàn) Hadoop 集群系統(tǒng)版本 安裝和啟動(dòng)配置 上機(jī)實(shí)驗(yàn) Hadoop 集群異常Debug 方法 Hadoop 集群簡(jiǎn)單測(cè)試方法 使用 Hadoop MapReduce Streaming 快速測(cè)試系統(tǒng) 第4個(gè)主題:Hadoop組件詳解 Hadoop HDFS 基本結(jié)構(gòu) Hadoop HDFS 副本存放策略 Hadoop NameNode 詳解 Hadoop SecondaryNameNode 詳解 Hadoop DataNode 詳解 Hadoop JobTracker 詳解 Hadoop TaskTracker 詳解 第5個(gè)主題:Hadoop集群配置詳解 Hadoop core-site,hdfs-site,mapred-site 配置詳解 Hadoop 高可用配置方法
|
第1個(gè)主題:Hadoop集群配置:機(jī)架感知,開啟壓縮和任務(wù)均衡 Hadoop 集群安裝和開啟LZO壓縮 Hadoop 配置集群具備機(jī)架感知 Hadoop 集群開啟公平任務(wù)調(diào)度器 Hadoop 集群開啟能力任務(wù)調(diào)度器 第2個(gè)主題:Hadoop 集群維護(hù)與管理 查看集群狀態(tài) HDFS數(shù)據(jù)管理 Mapreduce 任務(wù)管理 HDFS安全模式 模擬集群Namenode,jobtrack失效 添加刪除節(jié)點(diǎn) 數(shù)據(jù)平衡 文件數(shù)據(jù)跨集群拷貝 集群升級(jí) 第3個(gè)主題:Hadoop 集群規(guī)劃和測(cè)試 集群規(guī)劃(硬件,系統(tǒng),網(wǎng)絡(luò)) 集群性能測(cè)試 第4個(gè)主題:Hadoop 集群監(jiān)控和運(yùn)維 1. 使用Ganglia 監(jiān)控Hadoop集群 2. 使用Cacti 監(jiān)控操作系統(tǒng) 第5個(gè)主題:Hadoop HDFS高可用 Hadoop 元數(shù)據(jù)NFS備份方案 Hadoop SecondaryNameNode備份方案 Hadoop CheckpointNode備份方案 Hadoop BackupNode備份方案 Hadoop Cloudera HA Namenode 方案
|