數(shù)據(jù)開發(fā)資深專家
2.5-4萬元/月1.負責基于DataWorksEMR集群構建企業(yè)級數(shù)據(jù)開發(fā)平臺架構,結(jié)合實際業(yè)務場景設計分層數(shù)據(jù)模型(ODS、DW、DM層),確保數(shù)據(jù)鏈路的穩(wěn)定性、可擴展性與高效運行,支持業(yè)務數(shù)據(jù)需求的快速實現(xiàn)。
2.主導大規(guī)模ETL任務的開發(fā)與性能優(yōu)化,利用DataWorks調(diào)度系統(tǒng)配置復雜任務依賴關系,通過Hive、Spark、Flink等計算引擎處理TB至PB級數(shù)據(jù)規(guī)模,解決數(shù)據(jù)傾斜、任務延遲等性能瓶頸,提升整體數(shù)據(jù)處理效率超30%。
3.參與建設數(shù)據(jù)質(zhì)量管理體系,依托DataWorks數(shù)據(jù)質(zhì)量模塊設定監(jiān)控規(guī)則(如空值檢測、一致性核驗、業(yè)務邏輯校驗),定期生成數(shù)據(jù)質(zhì)量報告,推動問題追溯與閉環(huán)整改,保障數(shù)據(jù)準確率穩(wěn)定在99.9%以上。
4.負責DataWorksEMR集群與周邊系統(tǒng)的集成對接工作,包括從業(yè)務數(shù)據(jù)庫(MySQL、Oracle等)通過DataX、Sqoop等工具完成數(shù)據(jù)同步,以及開發(fā)數(shù)據(jù)服務接口并對接API網(wǎng)關,確保數(shù)據(jù)流轉(zhuǎn)完整且具備實時性。
5.牽頭攻克數(shù)據(jù)開發(fā)中的關鍵技術難題,例如流批一體架構在實時場景下的落地實踐、DataWorks權限精細化管理方案實施、EMR集群資源動態(tài)調(diào)度優(yōu)化等,沉淀可復用的技術方案與標準化流程。
6.參與制定并推廣數(shù)據(jù)開發(fā)相關規(guī)范,涵蓋SQL編碼標準、ETL開發(fā)流程、DataWorks項目管理機制等內(nèi)容,組織技術培訓和代碼評審,提升團隊整體開發(fā)水平與協(xié)作效率。
7.支持各業(yè)務部門的數(shù)據(jù)訴求,深入理解業(yè)務邏輯(如電商交易流程、用戶行為路徑、風控建模等),提供定制化數(shù)據(jù)解決方案,輸出報表、接口等成果,助力業(yè)務決策與產(chǎn)品迭代優(yōu)化。
8.承擔數(shù)據(jù)開發(fā)系統(tǒng)的日常運維與應急響應職責,監(jiān)控DataWorks任務執(zhí)行狀態(tài)及EMR集群資源使用情況,制定應急預案,及時處理任務失敗、集群異常等問題,保障數(shù)據(jù)服務可用性達到99.99%。
1.本科及以上學歷,計算機、大數(shù)據(jù)、統(tǒng)計學等相關專業(yè)背景,具備5年以上數(shù)據(jù)開發(fā)工作經(jīng)驗,其中至少3年熟練使用阿里云DataWorks+EMR集群的實際項目經(jīng)驗,有大型互聯(lián)網(wǎng)、金融或零售行業(yè)數(shù)據(jù)平臺建設經(jīng)歷者優(yōu)先考慮。
2.精通DataWorks各核心模塊操作,涵蓋數(shù)據(jù)集成、開發(fā)、調(diào)度、質(zhì)量管控與服務發(fā)布,能夠獨立主導復雜數(shù)據(jù)項目從架構設計到上線交付的全生命周期管理。
3.熟練掌握EMR集群常用組件(Hadoop、Hive、Spark、Flink、Hologres等)的工作原理與應用方式,能根據(jù)業(yè)務需求合理選擇計算引擎,具備組件性能調(diào)優(yōu)及故障排查能力。
4.精通SQL編寫(含復雜查詢、窗口函數(shù)、存儲過程),熟練運用Python/Scala開發(fā)數(shù)據(jù)處理腳本,具有基于Flink或SparkStreaming構建實時數(shù)據(jù)流水線的經(jīng)驗,可應對高并發(fā)、低延遲的數(shù)據(jù)處理場景。
5.深入掌握數(shù)據(jù)倉庫理論體系(如星型模型、雪花模型、緩慢變化維度處理),擁有從零開始搭建企業(yè)級數(shù)倉的實戰(zhàn)經(jīng)驗,能依據(jù)業(yè)務特征設計科學的數(shù)據(jù)分層結(jié)構與模型架構,保障數(shù)據(jù)資產(chǎn)的易用性與可維護性。
6.具備扎實的技術方案設計與問題定位能力,能獨立分析并解決數(shù)據(jù)開發(fā)過程中的復雜技術挑戰(zhàn)(如數(shù)據(jù)一致性、大規(guī)模處理性能瓶頸),有成功突破技術難點案例者優(yōu)先。
7.具備良好的溝通協(xié)調(diào)與團隊協(xié)作能力,能準確理解業(yè)務需求并轉(zhuǎn)化為可行的技術路徑,主動推進跨團隊協(xié)作(如與業(yè)務、運維等部門聯(lián)動),同時具備指導初級工程師的能力。
8.對數(shù)據(jù)安全與合規(guī)要求有深刻理解,熟悉數(shù)據(jù)脫敏、權限控制、備份恢復等相關規(guī)范,在開發(fā)過程中嚴格落實數(shù)據(jù)安全管理措施,參與過數(shù)據(jù)安全類項目或持有相關認證(如阿里云大數(shù)據(jù)認證)者優(yōu)先。