數(shù)據(jù)庫工程師

免費試聽 快速找課

tel:15830143330

您當前的位置: 首頁 > 北京培訓網(wǎng) > 北京中培IT培訓 > 北京數(shù)據(jù)庫工程師培訓 > 大數(shù)據(jù)平臺搭建與高性能計算實戰(zhàn)班

北京大數(shù)據(jù)分析師培訓哪個好

5800.00元

市場價:¥詳詢

開課學校 北京中培IT培訓

班制:周末班

上課(咨詢)地址:

豐臺區(qū)夏家胡同育芳園

課程介紹Course Introduction

關于舉辦大數(shù)據(jù)平臺搭建與高性能計算更佳實戰(zhàn)

培訓班的通知


培訓地點

深圳

北京

廣州

杭州

北京

重慶

青島

大連

上海

福州

培訓時間

1月19-22

2月5-8

330-4月2

4月20-23

5月25-28

622-25

727-30

8月16-19

9月14-17

11月16-19



一、培訓收益

經過此次課程培訓,可使學習者獲得如下收益:

1.深刻理解在“互聯(lián)網(wǎng) ”時代下大數(shù)據(jù)的產生背景、發(fā)展歷程和演化趨勢;

2.了解業(yè)界市場需求和國內外新的大數(shù)據(jù)技術潮流,洞察大數(shù)據(jù)的潛在價值;

3.理解大數(shù)據(jù)項目解決方案及業(yè)界大數(shù)據(jù)應用案例,從而為企業(yè)在大數(shù)據(jù)項目中的技術選型及技術架構設計提供決策參考;

4.掌握業(yè)界流行的Hadoop與Spark大數(shù)據(jù)技術體系;

5.掌握大數(shù)據(jù)采集技術;

6.掌握大數(shù)據(jù)分布式存儲技術;

7.掌握NoSQL與NewSQL分布式數(shù)據(jù)庫技術;

8.掌握大數(shù)據(jù)倉庫與統(tǒng)計機器學習技術;
9.掌握大數(shù)據(jù)分析挖掘與商業(yè)智能(BI)技術;

10.掌握大數(shù)據(jù)離線處理技術;

11.掌握Storm流式大數(shù)據(jù)處理技術;

12.掌握基于內存計算的大數(shù)據(jù)實時處理技術;

13.掌握大數(shù)據(jù)管理技術的原理知識和應用實戰(zhàn);

14.深入理解大數(shù)據(jù)平臺技術架構和使用場景;

15.嫻熟運用Hadoop與Spark大數(shù)據(jù)技術體系規(guī)劃解決方案滿足實際項目需求;

16.熟練地掌握基于Hadoop與Spark大數(shù)據(jù)平臺進行應用程序開發(fā)、集群運維管理和性能調優(yōu)技巧。


二、培訓特色

1.課程培訓業(yè)界流行、應用廣泛的Hadoop與Spark大數(shù)據(jù)技術體系。強化大數(shù)據(jù)平臺的分布式集群架構和核心關鍵技術實現(xiàn)、大數(shù)據(jù)應用項目開發(fā)和大數(shù)據(jù)集群運維實踐、以及Hadoop與Spark大數(shù)據(jù)項目應用開發(fā)與調優(yōu)的全過程沙盤模擬實戰(zhàn)。

2.經過一個完整的大數(shù)據(jù)開發(fā)項目及一組實際項目訓練案例,完全覆蓋Hadoop與Spark生態(tài)系統(tǒng)平臺的應用開發(fā)與運維實踐。課堂實踐項目以項目小組的形式進行沙盤實操練習,重點強化理解Hadoop與Spark大數(shù)據(jù)項目各個階段的工作重點,同時掌握作為大數(shù)據(jù)項目管理者的基本技術與業(yè)務素養(yǎng)。

3.本課程的授課師資都是有著多年在一線從事Hadoop與Spark大數(shù)據(jù)項目的資深講師,采用原理技術剖析和實戰(zhàn)案例相結合的方式開展互動教學、強化以建立大數(shù)據(jù)項目解決方案為主體的應用開發(fā)、技術討論與交流咨詢,在學習的同時促進講師學員之間的交流,讓每個學員都能在課程培訓過程中學到實實在在的大數(shù)據(jù)技術知識體系,以及大數(shù)據(jù)技術應用實戰(zhàn)技能,具備實際大數(shù)據(jù)應用項目的動手開發(fā)實踐與運維管理部署能力。授課過程中,根據(jù)學員需求,增設交流環(huán)節(jié),可將具體工作中遇到的實際問題展開討論,講師會根據(jù)學員的實際情況微調授課內容,由講師帶著全部學員積極討論,并給出一定的時間讓學員上臺發(fā)言,現(xiàn)場剖析問題的癥結,規(guī)劃出可行的解決方案。

在線申請報名


三、日程安排

日程

培訓模塊

培訓內容

第 一天

上午

大數(shù)據(jù)技術基礎

1. 大數(shù)據(jù)的產生背景與發(fā)展歷程

2. 大數(shù)據(jù)的4V特征,以及與云計算的關系

3. 大數(shù)據(jù)應用需求以及潛在價值分析

4. 業(yè)界新的大數(shù)據(jù)技術發(fā)展態(tài)勢與應用趨勢

5. 大數(shù)據(jù)思維的轉變

6. 大數(shù)據(jù)項目的系統(tǒng)與技術選型,及落地實施的挑戰(zhàn)

7. “互聯(lián)網(wǎng) ”時代下的電子商務、制造業(yè)、交通行業(yè)、電信運營商、銀行金融業(yè)、電子政務、移動互聯(lián)網(wǎng)、教育信息化等行業(yè)應用實踐與應用案例介紹

業(yè)界主流的大數(shù)據(jù)技術方案

1. 大數(shù)據(jù)軟硬件系統(tǒng)全棧與關鍵技術介紹

2. 大數(shù)據(jù)生態(tài)系統(tǒng)全景圖

3. 主流的大數(shù)據(jù)解決方案介紹

4. Apache大數(shù)據(jù)平臺方案剖析

5. CDH大數(shù)據(jù)平臺方案剖析

6. HDP大數(shù)據(jù)平臺方案剖析

7. 基于云的大數(shù)據(jù)平臺方案剖析

8. 大數(shù)據(jù)解決方案與傳統(tǒng)數(shù)據(jù)庫方案比較

9. 國內外大數(shù)據(jù)平臺方案與廠商對比

大數(shù)據(jù)計算模型(一)——批處理MapReduce

1. MapReduce產生背景與適用場景

2. MapReduce計算模型的基本原理

3. MapReduce作業(yè)執(zhí)行流程

4. MapReduce基本組件,JobTrackerTaskTracker

5. MapReduce高級編程應用,CombinerPartitioner

6. MapReduce性能優(yōu)化技巧

7. MapReduce案例分析與開發(fā)實踐操作

第 一天

下午

大數(shù)據(jù)存儲系統(tǒng)與應用實踐

1. 分布式文件系統(tǒng)HDFS產生背景與適用場景

2. HDFS master-slave系統(tǒng)架構與讀寫工作原理

3. HDFS核心組件技術講解,NameNode與fsimage、editslog,DataNode與數(shù)據(jù)塊

4. HDFS Federation機制,viewfs機制,使用場景講解

5. HDFS高可用保證機制,SecondaryNameNode,NFS冷備份,基于zookeeper的HA方案

大數(shù)據(jù)實戰(zhàn)練習一

1. Hadoop平臺搭建、部署與應用實踐,包含HDFS分布式文件系統(tǒng),YARN資源管理軟件,MapReduce計算框架軟件

2. HDFS shell命令操作

3. MapReduce程序在YARN上運行

第二天

上午

Hadoop框架與生態(tài)發(fā)展,以及應用實踐操作

1. Hadoop的發(fā)展歷程

2. Hadoop 1.0的核心組件JobTracker,TaskTracker,以及適用范圍

3. Hadoop 2.0的核心組件YARN工作原理,以及與Hadoop 1.0的聯(lián)系與區(qū)別

4. Hadoop YARN的資源管理與作業(yè)調度機制

5. Hadoop 常用性能優(yōu)化技術

大數(shù)據(jù)計算模型(二)——實時處理/內存計算 Spark

1. MapReduce計算模型的瓶頸

2. Spark產生動機、基本概念與適用場景

3. Spark編程模型與RDD彈性分布式數(shù)據(jù)集的工作原理與機制

4. Spark實時處理平臺運行架構與核心組件

5. Spark寬、窄依賴關系與DAG圖分析

6. Spark容錯機制

7. Spark作業(yè)調度機制

8. Spark standardalone,Spark on YARN運行模式

9. Scala開發(fā)介紹與Spark常用Transformation函數(shù)介紹

第二天

下午

大數(shù)據(jù)倉庫查詢技術HiveSparkSQL、Impala,以及應用實踐

1. 基于MapReduce的大型分布式數(shù)據(jù)倉庫Hive基礎知識與應用場景

2. Hive數(shù)據(jù)倉庫的平臺架構與核心技術剖析

3. Hive metastore的工作機制與應用

4. Hive 分區(qū)、分桶機制,Hive行、列存儲格式

5. 基于Spark的大型分布式數(shù)據(jù)倉庫SparkSQL基礎知識與應用場景

6. Spark SQL實時數(shù)據(jù)倉庫的實現(xiàn)原理與工作機制

7. SparkSQL程序開發(fā)與DataFrame機制介紹

8. 基于MPP的大型分布式數(shù)據(jù)倉庫Impala基礎知識與應用場景

9. Impala實時查詢系統(tǒng)平臺架構、關鍵技術介紹,以及與Hive,SparkSQL的對比

Hadoop集群運維監(jiān)控工具

1. Hadoop運維管理監(jiān)控系統(tǒng)Ambari工具介紹

2. 第三方運維系統(tǒng)與工具Ganglia, Nagios

大數(shù)據(jù)實戰(zhàn)練習二

1.基于 Hadoop平臺搭建、部署與配置Spark集群,Spark shell環(huán)境實踐,Spark案例程序分析,Spark程序開發(fā)與運行

2. 基于MapReduce的Hive數(shù)據(jù)倉庫實踐,Hive集群安裝部署,基于文件的Hive數(shù)據(jù)倉庫表導入導出與分區(qū)操作,Hive SQL操作,Hive客戶端操作

3. 基于Hive的SparkSQL shell實踐操作

第三天

上午

大數(shù)據(jù)計算模型(三)——流處理Storm, SparkStreaming

1. 流數(shù)據(jù)處理應用場景與流數(shù)據(jù)處理的特點

2. 流數(shù)據(jù)處理工具Storm的平臺架構與集群工作原理

3. Storm關鍵技術與并發(fā)機制

4. Storm編程模型與基本開發(fā)模式

5. Storm數(shù)據(jù)流分組

6. Storm可靠性保證與Acker機制

7. Storm應用案例分析

8. 流數(shù)據(jù)處理工具Spark Streaming基本概念與數(shù)據(jù)模型

9. SparkStreaming工作機制

10. SparkStreaming程序開發(fā)介紹

11. Storm與SparkStreaming的對比

第三天

下午

大數(shù)據(jù)ETL操作工具,與大數(shù)據(jù)分布式采集系統(tǒng)

1. HadoopDBMS之間數(shù)據(jù)交互工具的應用

2. Sqoop導入導出數(shù)據(jù)的工作原理

3. Flume-NG數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù)流模型與系統(tǒng)架構

4. Kafka分布式消息訂閱系統(tǒng)的應用介紹與平臺架構,及其使用模式

面向OLTP型應用的NoSQL數(shù)據(jù)庫及應用實踐

1. 關系型數(shù)據(jù)庫瓶頸,以及NoSQL數(shù)據(jù)庫的發(fā)展,概念,分類,及其在半結構化和非結構化數(shù)據(jù)場景下的適用范圍

2. 列存儲NoSQL數(shù)據(jù)庫HBase簡介與數(shù)據(jù)模型剖析

3. HBase分布式集群系統(tǒng)架構與讀寫機制,ZooKeeper分布式協(xié)調服務系統(tǒng)的工作原理與應用

4. HBase表設計模式與primary key設計規(guī)范

5. 文檔NoSQL數(shù)據(jù)庫MongoDB簡介與數(shù)據(jù)模型剖析

6. MongoDB集群模式、讀寫機制與常用API操作

8.鍵值型NoSQL數(shù)據(jù)庫Redis簡介與數(shù)據(jù)模型剖析

9.Redis多實例集群架構與關鍵技術

10.NewSQL數(shù)據(jù)庫技術簡介及其適用場景

大數(shù)據(jù)實戰(zhàn)練習三

1.Sqoop安裝、部署與配置,基于Sqoop、MySQL與Hive操作MySQL數(shù)據(jù)庫與Hive數(shù)據(jù)倉庫數(shù)據(jù)導入導出

2.Kafka安裝、部署與配置,基于Kafka創(chuàng)建和消費topic實踐操作

3.Flume HDFS MapReduce/Spark大數(shù)據(jù)采集、存儲與分析實踐操作

大數(shù)據(jù)項目選型、實施、優(yōu)化等問題交流討論

大數(shù)據(jù)項目的需求分析、應用實施、系統(tǒng)優(yōu)化,以及解決方案等咨詢與交流討論

第四天

學習考核與業(yè)內經驗交流


在線申請報名


四、授課專家

蔣老師  清華大學博士,云計算專家 熟悉主流的云計算平臺,并有商業(yè)與開源云計算平臺的實踐經驗,對云計算關鍵技術有深刻了解和實踐經驗,如分布式系統(tǒng)、虛擬化、分布式文件系統(tǒng)、云存儲等,參與并領導多個大型云計算項目。對大數(shù)據(jù)關鍵技術有深刻了解和實踐經驗,如NoSQL數(shù)據(jù)庫、大數(shù)據(jù)處理、Hadoop、Hive、HBase、Spark等。

趙老師  清華大學計算機雙學士,甲骨文(中國)軟件系統(tǒng)有限公司高級技術顧問,大數(shù)據(jù)、數(shù)據(jù)庫、中間件技術和Java專家。15年IT行業(yè)從業(yè)經歷,10年培訓授課經驗。具有豐富的大數(shù)據(jù)方法論、數(shù)據(jù)科學、大數(shù)據(jù)生態(tài)圈技術知識和大數(shù)據(jù)規(guī)劃建設、應用實施和客戶培訓經驗。


五、培訓費用

培訓費5800元/人(含培訓費、場地費、資料費、學習期間午餐),食宿可統(tǒng)一安排,費用自理。請學員帶二寸彩照1張(背面注明姓名),身份證復印件一張。

本課程由中國信息化培訓中心頒發(fā)《大數(shù)據(jù)平臺搭建與高性能計算高級工程師》證書,證書可作為專業(yè)技術人員職業(yè)能力考核的證明,以及專業(yè)技術人員崗位聘用、任職、定級和晉升職務的重要依據(jù)。

我們是非常專業(yè)在線教育平臺,為學員提供海量、優(yōu)質的課程,專業(yè)的課程顧問課為您量身定制課程,課程結構嚴謹,用戶可以根據(jù)自身的學習程度,自主安排學習進度。歡迎點擊訪問:北京數(shù)據(jù)庫工程師培訓課程匯總!


課程熱線 15830143330

客服時間:早上9點~下午6點,其他時間請在線預約報名或留言,謝謝!

申請免費試聽

學校介紹University Profile

北京中培偉業(yè)管理咨詢有限公司(以下簡稱“中培”)成立于2006年,其主營業(yè)務面向大中型企業(yè)的IT規(guī)劃咨詢業(yè)務和面向高端IT人才的培訓類業(yè)務,其中咨詢業(yè)務涉及大型集團化企業(yè)的IT戰(zhàn)略規(guī)劃、IT架構規(guī)劃、IT綜合管控等領域,培訓業(yè)務涉及線上線下各種高級IT技術和管理類課程體系。


與此同時,中培以“為國家培養(yǎng)高階信息化管理人才”的價值觀為使命,以“專業(yè)、真誠、執(zhí)著、創(chuàng)新”的服務理念為指引,不斷朝著促進中國企業(yè)的信息化綜合競爭力與國際影響力提升的目標而前行。


借助于其優(yōu)質的專家資源池和互聯(lián)網(wǎng)平臺,中培已經為眾多的世界500強企業(yè)、國有大中型集團化企業(yè)、國際知名互聯(lián)網(wǎng)企業(yè)提供過高質量的信息化戰(zhàn)略規(guī)劃、組織架構規(guī)劃、科技人才管理、信息技術架構規(guī)劃、信息系統(tǒng)開發(fā)和運維管理、信息化能力評測的相關咨詢與培訓服務。


企業(yè)內訓與咨詢:針對不同的企業(yè)需求,每年至少100次以上。

中培使命——助力中國CIO與培訓IT精英群體

中培宗旨——以需求為導向、以質量促發(fā)展

中培目標——打造中國權 威的IT咨詢與培訓機構

中培優(yōu)勢——權 威的專家團隊;專業(yè)的服務理念;領 先的行業(yè)優(yōu)勢;前沿的技術;強大的政府支撐。

上一個課程:

云計算與超融合架構建設實踐培訓班

下一個課程:

云計算與超融合架構建設實踐培訓班

申請試聽名額

已有10254人申請免費試聽

01電話咨詢 | 15830143330

QQ:
加盟合作:0755-83654572