運維主管/經理
2-3.5萬元/月崗位職責:
1、規(guī)劃并持續(xù)優(yōu)化運維管理機制,推進自動化與標準化流程實施,建立可衡量的效率與質量考核體系;
2、統(tǒng)籌算力資源(含GPU集群)調度方案,提升資源使用效率;主導網絡與安全架構建設,打造多層次防御體系;
3、牽頭搭建并迭代公司統(tǒng)一運維平臺,保障各產品線系統(tǒng)的穩(wěn)定高效運行;
4、主導混合云與云原生環(huán)境下的技術選型,優(yōu)化CI/CD流程、容災備份機制及監(jiān)控系統(tǒng),推動高可用架構不斷升級;
5、建立重大故障應急響應機制,牽頭開展根因分析與整改閉環(huán);制定合規(guī)標準,落實數(shù)據安全與審計規(guī)范;
6、牽頭構建并持續(xù)完善運維知識管理體系,沉淀實踐經驗并推動復用優(yōu)化,提升整體運維效能;
7、負責運維團隊的人才梯隊搭建與能力建設,確保團隊運作高效且可持續(xù)發(fā)展。
崗位要求:
1、本科及以上學歷,計算機或相關專業(yè)背景,具備5-10年開發(fā)與運維工作經驗;
2、熟練掌握Kubernetes生態(tài)及ServiceMesh落地實踐,具有億級流量系統(tǒng)性能調優(yōu)經歷;熟悉DPDK、RDMA等高性能網絡技術者優(yōu)先考慮;
3、深刻理解網絡安全防護體系,持有CISSP/CISP認證;具備多云多活架構設計實際案例;
4、主導過DevOps轉型項目落地,擁有中大型集群系統(tǒng)運維經驗,具備機房網絡設備、服務器及防火墻維護能力;
5、了解GPU算力調度機制及算力中心相關運維工作內容;
6、具備良好的總結與分享習慣,保持持續(xù)學習態(tài)度,有技術輸出經驗者優(yōu)先(如博客、wiki等可證明材料)。