本套視頻教程是基于Hive on Spark版本的離線數(shù)倉調(diào)優(yōu)指南,通過對Yarn配置、Spark配置、Hive SQL中聚合優(yōu)化、分組優(yōu)化和并行度優(yōu)化等方式,結(jié)合代碼和具體參數(shù)詳細介紹如何進行離線數(shù)倉的調(diào)優(yōu)。
教程特色:
一、真實,采用阿里云服務(wù)器,配置拉滿;
二、數(shù)據(jù)體量大,以電商表為模板,單表數(shù)據(jù)量達160G;
三、調(diào)優(yōu)手段多,從聚合、Join等多方面著手,調(diào)優(yōu)效果明顯。
學(xué)習前置知識:Hive、Spark、離線數(shù)倉。