十年網(wǎng)站開發(fā)經(jīng)驗 + 多家企業(yè)客戶 + 靠譜的建站團(tuán)隊
量身定制 + 運營維護(hù)+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
基于Greenplum Hadoop分布式平臺的大數(shù)據(jù)解決方案及商業(yè)應(yīng)用案例剖析

【上集】百度網(wǎng)盤下載:鏈接:http://pan.baidu.com/s/1eQJFXZ0 密碼:kdx9
【下集】百度網(wǎng)盤下載:鏈接:http://pan.baidu.com/s/1hq4cO2w 密碼:cnsq
課程內(nèi)容簡介:
本課程分兩大部分:
第一部分全面深入地介紹了Greenplum數(shù)據(jù)庫,包括架構(gòu)特性、部署、管理、開發(fā)和調(diào)優(yōu)等,由淺入深
,理論結(jié)合實戰(zhàn),讓同學(xué)全面徹底掌握這把大數(shù)據(jù)利劍。
第二部分深入闡述了Hadoop的架構(gòu)原理,Hadoop整體技術(shù)架構(gòu),包括HBase、Hive、Pig、ZooKeeper、
Chukwa等實戰(zhàn)運用。另外還介紹了云計算的基礎(chǔ)知識和Hadoop在云計算領(lǐng)域的運用,以及剖析了Hadoop在
各個互聯(lián)網(wǎng)巨頭商業(yè)環(huán)境的運用。
【上集】 Greenplum 分布式數(shù)據(jù)庫基礎(chǔ)(41課時)
1 Greenplum架構(gòu)
什么是Greenplum
Greenplum體系結(jié)構(gòu)
Greenplum高可用性架構(gòu)
2 安裝Greenplum
配置環(huán)境
安裝并初始化GPDB系統(tǒng)
啟停數(shù)據(jù)庫
配置GP系統(tǒng)
3 分布式數(shù)據(jù)庫存儲
數(shù)據(jù)是如何存儲的
分布策略
4 GBDB查詢處理
查詢命令的執(zhí)行
SQL查詢處理機制
并行查詢計劃
5 角色權(quán)限及客戶端認(rèn)證管理
客戶端認(rèn)證
管理用戶和組
6 客戶端接口和程序
pgAdmin III
PSQL
7 定義數(shù)據(jù)庫對象
創(chuàng)建并管理數(shù)據(jù)庫
創(chuàng)建并管理表空間
創(chuàng)建并管理模式
創(chuàng)建并管理表
分區(qū)表
數(shù)據(jù)分布與分區(qū)
壓縮存儲與行列存儲
序列、索引與視圖
8 管理數(shù)據(jù)
插入、更新、刪除記錄
事務(wù)管理
空間回收和統(tǒng)計
9 查詢數(shù)據(jù)
定義查詢
使用函數(shù)和運算符
查詢分析
10 工作負(fù)載及資源管理
GP工作負(fù)載管理概述
配置工作負(fù)載管理
創(chuàng)建資源隊列
分配資源隊列
檢查資源隊列狀態(tài)
11 裝載和卸載數(shù)據(jù)
GP裝載命令概述
裝載數(shù)據(jù)到GP
從GP卸載數(shù)據(jù)
格式化數(shù)據(jù)文件
12 備份恢復(fù)
串行備份和恢復(fù)
并行恢復(fù)和恢復(fù)
13 性能調(diào)優(yōu)
如何進(jìn)行調(diào)優(yōu)
常見的性能問題
14 GP系統(tǒng)配置參數(shù)
關(guān)于GP的Master參數(shù)與本地化參數(shù)
設(shè)置配置參數(shù)
配置參數(shù)種類
15 開啟高可用性
GP高可用概述
開啟GP的Mirror
獲知Segment何時失敗
恢復(fù)失敗的Segment
恢復(fù)失敗的Master
16 GP MapReduce
MapReduce基礎(chǔ)
GP MapReduce編程
MapReduce作業(yè)執(zhí)行和故障診斷
【下集】 Hadoop分布式平臺(55課時)
1 Hadoop的起源和體系
Hadoop思想起源:Google
Hadoop子項目家族
Hadoop的架構(gòu)
2 Hadoop的安裝與配置
準(zhǔn)備和配置環(huán)境
三種運行模式
完全分布式模式安裝
3 HDFS-大數(shù)據(jù)存儲
HDFS概念與體系結(jié)構(gòu)
HDFS的可靠性
HDFS文件操作
HDFS API
4 關(guān)于MapReduce
MapReduce編程模型
MapReduce的集群行為
MapReduce任務(wù)的優(yōu)化
MapReduce工作機制
錯誤處理及作業(yè)調(diào)度機制
5 MapReduce應(yīng)用開發(fā)
Hadoop Eclipse插件開發(fā)
數(shù)據(jù)篩選程序開發(fā)
倒排索引程序開發(fā)
6 Hadoop監(jiān)控與管理
頁面監(jiān)控
hadoop備份
7 HBase數(shù)據(jù)庫
Hbase體系結(jié)構(gòu)
HBase shell
HBase API應(yīng)用實例
HBase場景應(yīng)用
HBase模式設(shè)計
8 Hive數(shù)據(jù)倉庫
Hive組件與體系架構(gòu)
Hive安裝配置
Hive的服務(wù)接口
HiveQL常用操作
Hive的優(yōu)化
Hive UDF編程
Hive綜合實戰(zhàn)
9 Pig數(shù)據(jù)分析平臺
Pig框架
Pig安裝配置
Pig的使用
Pig的數(shù)據(jù)模型
常用Pig Latin操作
Pig UDF編程
Pig數(shù)據(jù)分析實戰(zhàn)
10 ZooKeeper分布式服務(wù)框架
ZooKeeper工作原理
ZooKeeper設(shè)計目標(biāo)
ZooKeeper的數(shù)據(jù)結(jié)構(gòu)和組成
ZooKeeper的安裝配置
ZooKeeper命令行工具
ZooKeeper API
ZooKeeper實戰(zhàn):Hadoop任務(wù)調(diào)度
11 Chukwa集群監(jiān)控系統(tǒng)
Chukwa的組成
Chukwa架構(gòu)和設(shè)計
Chukwa安裝與配置
常用Chukwa命令
實現(xiàn)自定義數(shù)據(jù)處理
12 Hadoop商業(yè)應(yīng)用案例
云計算概念和特征
云計算服務(wù)模式和形態(tài)
Hadoop在云計算的運用
京東商城
百度
阿里巴巴
騰訊
13 Greenplum Hadoop集群
集成架構(gòu)的特征
集成架構(gòu)的優(yōu)勢
配置gphdfs協(xié)議使用環(huán)境
使用HDFS外部表
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。