渴望技術轉型
轉換行業(yè)的IT小白
增長經驗
搭建完善的項目
接觸廣泛技術面
渴望了解新技術、新行業(yè)
有興趣了解數(shù)據(jù)分析
學習前沿技術
突破職業(yè)瓶頸
掌握核心技能
Linux、Hadoop
Java、Hive
Flume、Kafka
等基礎框架
全面了解廣告行業(yè)運營流程
充分熟悉廣告行業(yè)指標體系
熟練掌握異常流量清洗過程
熟悉掌握數(shù)據(jù)倉庫技術框架
充分掌握FineBI數(shù)據(jù)分析工具
充分調研各大廠數(shù)倉建模體系,以阿里巴巴的數(shù)據(jù)倉庫建模理論為最終藍本,搭建實用且貼近生產實際的數(shù)倉建模體系;
應用建模理論,提出可實踐性強的數(shù)倉搭建理論過程,數(shù)據(jù)調研→明確數(shù)據(jù)域→構建業(yè)務總線矩陣→維度模型設計→明確統(tǒng)計指標→匯總模型設計→分層構建數(shù)倉;
多方參考大廠數(shù)倉分層體系,合理數(shù)據(jù)分層,降低數(shù)據(jù)耦合度,提高數(shù)據(jù)分析效率,降低數(shù)據(jù)計算成本;
實戰(zhàn)式數(shù)據(jù)模擬策略,真實廣告流量監(jiān)測業(yè)務場景,模擬生成全面的原始數(shù)據(jù),針對真實數(shù)據(jù)進行分析統(tǒng)計;
采用Flume采集廣告監(jiān)測日志,適配組件全面調研,給出詳細貼近實戰(zhàn)的配置文件,自定義采集組件,解決時間戳零點漂移,優(yōu)化小文件存儲帶來問題,提供更多實戰(zhàn)經驗;
采用流行數(shù)據(jù)采集框架DataX采集業(yè)務數(shù)據(jù),提供詳細配置文件及腳本解讀,掌握更多腳本編寫技巧;
真實數(shù)據(jù)ETL實操,結合Hive自定義函數(shù),涵蓋對原始廣告日志數(shù)據(jù)的清洗、轉換以及遺產廣告流量的識別;
使用高性能OLAP數(shù)據(jù)庫ClickHouse實現(xiàn)低延時即席查詢;
使用FineBI工具實現(xiàn)自助報表分析,具備鉆取、聯(lián)動、篩選等交互功能。
安裝部署受各大廠歡迎的DolphinScheduler工作流調度系統(tǒng),實現(xiàn)數(shù)據(jù)倉庫搭建全流程定時自動化調度以及故障自動郵件告警;