Spark 及 Hadoop開(kāi)發(fā)員培訓將學(xué)習如何將數據導入到 Apache Hadoop 機群并使用 Spark、Hive、Flume、Sqoop、Impala 及其他 Hadoop 生態(tài)系統工具對數據進(jìn)行各種操作和處理分析。Spark 及 Hadoop 開(kāi)發(fā)員培訓將于2017-03-16召開(kāi),期間活動(dòng)家將為您帶來(lái)更多的Spark 及 Hadoop 開(kāi)發(fā)員培訓資訊和最安全的報名通道:
大數據問(wèn)題和挑戰的能力。本課程包含了大量的實(shí)操及編程練習來(lái)幫助學(xué)員熟悉并掌握各種工具,并最終獲得在實(shí)際工作中針對特定的問(wèn)題或場(chǎng)景來(lái)選取最佳解決工具或技術(shù)的能力。
培訓內容
通過(guò)講師在課堂上的講解,以及實(shí)操練習,學(xué)員將學(xué)習 Apache Spark 及如何將其集成到整個(gè) Hadoop 生態(tài)系統中去,包括以下內容:
數據是如何在 Hadoop 機群里進(jìn)行分布式存儲及處理的
如何使用 Sqoop 和 Flume 導入數據
如何使用 Apache Spark 處理分布式數據
如何使用 Impala 及 Hive 將結構化數據建模成表并進(jìn)行分析查詢(xún)
如何根據數據使用場(chǎng)景來(lái)確定最佳存儲格式
數據存儲最佳實(shí)踐
培訓對象及學(xué)員基礎
本課程適合準備報考 CCA Spark 及 Hadoop 開(kāi)發(fā)員認證考試的技術(shù)人員。雖然通過(guò)該認證考試,考生仍然需要做進(jìn)一步的學(xué)習和準備,但是本課程涵蓋了在該認證考試中考核的很多主題和知識點(diǎn)。
在參加完本培訓后,我們建議學(xué)員參加此課程的一個(gè)后繼課程:“設計和創(chuàng )建大數據應用”
課程介紹
Hadoop 及生態(tài)系統介紹
傳統大規模系統的問(wèn)題
Hadoop !
Hadoop 生態(tài)系統
Hadoop 體系結構及 HDFS
機群環(huán)境下的分布式處理
存儲:HDFS 體系結構
存儲:使用 HDFS
資源管理:YARN 體系結構
資源管理:使用 YARN
使用 Apache Sqoop 導入關(guān)系數據
Sqoop 簡(jiǎn)介
數據的基本導入導出
減少傳輸的數據量
改善 Sqoop 性能
Sqoop 2
……
為了簡(jiǎn)化報名流程,Spark 及 Hadoop 開(kāi)發(fā)員培訓已開(kāi)通網(wǎng)上購票系統,您可登陸活動(dòng)家網(wǎng)站進(jìn)行峰會(huì )報名!
快捷報名地址:https://www.huodongjia.com/event-661863863.html
相關(guān)閱讀:
Cloudera Apache Hadoop 管理員培訓(上海站) 2017-03-23
Cloudera Apache Hadoop 管理員培訓(北京站)2017-03-09
Spark 及 Hadoop 開(kāi)發(fā)員培訓 2017-03-16 上海