IT運(yùn)維工程師
1.2-1.8萬元/月一、崗位職責(zé)
1.基礎(chǔ)設(shè)施全生命周期管理
負(fù)責(zé)數(shù)據(jù)中心IT設(shè)備(服務(wù)器/網(wǎng)絡(luò)/存儲)的規(guī)劃、部署、監(jiān)控、優(yōu)化及全周期運(yùn)維管理。
主導(dǎo)AI算力服務(wù)器集群(如GPU/NPU架構(gòu))的運(yùn)行維護(hù)與性能提升,支撐人工智能及高性能計(jì)算業(yè)務(wù)場景。
2.算力網(wǎng)絡(luò)與組網(wǎng)技術(shù)
設(shè)計(jì)并持續(xù)優(yōu)化算力網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),掌握高速互聯(lián)協(xié)議(如InfiniBand/RoCE)、分布式計(jì)算環(huán)境(如Hadoop/Spark/Kubernetes)。
保障算力資源靈活調(diào)度與低時延數(shù)據(jù)交互,滿足業(yè)務(wù)規(guī)模動態(tài)擴(kuò)展需求。
3.運(yùn)維體系與安全保障
依據(jù)ITIL標(biāo)準(zhǔn)構(gòu)建運(yùn)維管理體系(事件/變更/問題處理流程),確保服務(wù)可用性不低于99.9%。
制定災(zāi)備恢復(fù)策略與突發(fā)事件應(yīng)對方案,牽頭落實(shí)信息安全合規(guī)要求(ISO27001/等保)。
4.團(tuán)隊(duì)與技術(shù)管理
帶領(lǐng)5-10人技術(shù)團(tuán)隊(duì),組織實(shí)施技能培養(yǎng)計(jì)劃與人才梯隊(duì)搭建。
推進(jìn)自動化運(yùn)維工具(Ansible/Prometheus)和智能監(jiān)控系統(tǒng)應(yīng)用,提升運(yùn)維效率并控制運(yùn)營成本。
二、任職要求
1.學(xué)歷與經(jīng)驗(yàn)
全日制本科及以上學(xué)歷,計(jì)算機(jī)、通信、自動化等相關(guān)專業(yè)背景。
具備5年以上數(shù)據(jù)中心IT基礎(chǔ)設(shè)施運(yùn)維實(shí)戰(zhàn)經(jīng)驗(yàn),其中包含至少2年團(tuán)隊(duì)管理經(jīng)歷。
2.技術(shù)能力
2.1硬件與系統(tǒng)
熟悉主流品牌服務(wù)器(如Dell/HP/Huawei)、網(wǎng)絡(luò)設(shè)備(Cisco/H3C)及存儲解決方案。
熟練操作Linux/Windows操作系統(tǒng),具備系統(tǒng)內(nèi)核調(diào)優(yōu)與故障排查能力。
2.2算力專項(xiàng)
了解AI算力服務(wù)器平臺(如NVIDIADGX/國產(chǎn)AI服務(wù)器)及集群調(diào)度工具(如Kubernetes/Slurm)。
擁有高速網(wǎng)絡(luò)部署經(jīng)驗(yàn)(InfiniBand/RoCEv2),可優(yōu)化多節(jié)點(diǎn)間通信性能。
2.3云與虛擬化
掌握VMware/KVM虛擬化技術(shù)及容器化方案(Docker/K8s),具有一類主流云平臺(AWS/Azure/阿里云)運(yùn)維實(shí)操經(jīng)驗(yàn)。
2.4認(rèn)證與標(biāo)準(zhǔn)
持有ITILV3/V4、PMP或CCNP/RHCE認(rèn)證者優(yōu)先考慮。
了解ISO20000/ISO27001等國際管理體系標(biāo)準(zhǔn)。