渴望技術(shù)轉(zhuǎn)型
轉(zhuǎn)換行業(yè)的IT小白
有一定技術(shù)基礎(chǔ)
希望增長經(jīng)驗(yàn)
接觸更廣技術(shù)面
從事一定年限技術(shù)開發(fā)
目標(biāo)突破自我
學(xué)習(xí)大數(shù)據(jù)技術(shù)
突破職業(yè)瓶頸
Linux、Hadoop
Java、Hive
Flume、Kafka
等基礎(chǔ)框架
能全面了解數(shù)據(jù)倉庫建模理論充分熟悉電商行業(yè)數(shù)據(jù)分析指標(biāo)體系快速掌握多種大數(shù)據(jù)技術(shù)框架
數(shù)據(jù)分析建模理論數(shù)據(jù)清洗數(shù)據(jù)采集了解認(rèn)識(shí)多種數(shù)據(jù)倉庫技術(shù)模塊
定時(shí)調(diào)度郵件報(bào)警可視化圖表數(shù)據(jù)質(zhì)量監(jiān)控性能調(diào)優(yōu)集群運(yùn)維
項(xiàng)目涵蓋40多個(gè)Shell腳本,5大類用戶行為日志數(shù)據(jù),34張業(yè)務(wù)數(shù)據(jù)原始表格,100多張電商大數(shù)據(jù)表格,100多個(gè)電商統(tǒng)計(jì)指標(biāo);
充分調(diào)研各大廠數(shù)倉建模體系,以阿里巴巴的數(shù)據(jù)倉庫建模理論為最終藍(lán)本,搭建實(shí)用且貼近生產(chǎn)實(shí)際的數(shù)倉建模體系;
應(yīng)用建模理論,提出可實(shí)踐性強(qiáng)的數(shù)倉搭建理論過程,數(shù)據(jù)調(diào)研 → 明確數(shù)據(jù)域 → 構(gòu)建業(yè)務(wù)總線矩陣 → 維度模型設(shè)計(jì) → 明確統(tǒng)計(jì)指標(biāo) → 匯總模型設(shè)計(jì) → 分層構(gòu)建數(shù)倉;
多方參考大廠數(shù)倉分層體系,合理數(shù)據(jù)分層,降低數(shù)據(jù)耦合度,提高數(shù)據(jù)分析效率,降低數(shù)據(jù)計(jì)算成本;
基于五大主題指標(biāo),分析統(tǒng)計(jì)100余個(gè)指標(biāo),構(gòu)建ADS層;
采用Flume采集用戶行為日志數(shù)據(jù),適配組件廣泛調(diào)研,給出詳細(xì)貼近實(shí)戰(zhàn)的配置文件,自定義采集組件,解決時(shí)間戳零點(diǎn)漂移,優(yōu)化小文件存儲(chǔ)帶來問題,提供更多實(shí)戰(zhàn)經(jīng)驗(yàn);
采用流行數(shù)據(jù)采集框架DataX采集業(yè)務(wù)數(shù)據(jù),提供詳細(xì)配置文件及腳本解讀,掌握更多腳本編寫技巧;
安裝部署受各大廠歡迎的DolphinScheduler工作流調(diào)度系統(tǒng),實(shí)現(xiàn)數(shù)據(jù)倉庫搭建全流程定時(shí)自動(dòng)化調(diào)度以及故障自動(dòng)郵件告警;
基于業(yè)務(wù)總線矩陣構(gòu)建數(shù)據(jù)倉庫DIM層,針對緩慢變化維度,構(gòu)建拉鏈表;
基于指標(biāo)體系分析構(gòu)建DWS層,將相同粒度、統(tǒng)計(jì)周期的派生指標(biāo)整合統(tǒng)計(jì)為寬表,提高計(jì)算結(jié)果復(fù)用性;
基于業(yè)務(wù)總線矩陣構(gòu)建數(shù)據(jù)倉庫DWD層,完成事務(wù)型事實(shí)表、周期型事實(shí)表、累積快照事實(shí)表搭建和數(shù)據(jù)裝載;
真實(shí)數(shù)據(jù)ETL實(shí)操,掌握如何對原始數(shù)據(jù)進(jìn)行清洗、脫敏、數(shù)據(jù)分類、整合;
采用SuperSet對調(diào)度采集至RDBMS數(shù)據(jù)庫中的結(jié)果數(shù)據(jù)進(jìn)行多圖表、儀表盤可視化展示;
采用Echart,結(jié)合SpringBoot對結(jié)果數(shù)據(jù)進(jìn)行可視化展示,充分掌握數(shù)據(jù)展示接口編寫流程;
基于企業(yè)級數(shù)據(jù)倉庫的海量數(shù)據(jù)計(jì)算業(yè)務(wù),對CPU配置、內(nèi)存分配、任務(wù)提交、任務(wù)執(zhí)行計(jì)劃等方面進(jìn)行廣泛性能調(diào)優(yōu);
分析總結(jié)項(xiàng)目搭建過程中遇到的問題,增加開發(fā)經(jīng)驗(yàn),提升實(shí)戰(zhàn)問題解決能力;
采用Maxwell監(jiān)控業(yè)務(wù)數(shù)據(jù)變動(dòng)情況,做到更實(shí)時(shí)更準(zhǔn)確的變動(dòng)數(shù)據(jù)采集,靈活使用Maxwell框架,掌握使用技巧。