智算存儲(chǔ)高級(jí)技術(shù)專家
4-7萬(wàn)元/月職位描述:
1.負(fù)責(zé)智算場(chǎng)景下高性能存儲(chǔ)系統(tǒng)的架構(gòu)設(shè)計(jì)與開(kāi)發(fā),面向AI訓(xùn)練的并行文件系統(tǒng)核心模塊研發(fā),構(gòu)建多層元數(shù)據(jù)服務(wù)體系,支持海量小文件與高帶寬數(shù)據(jù)訪問(wèn)需求。
2.推動(dòng)軟硬件協(xié)同優(yōu)化與服務(wù)器形態(tài)設(shè)計(jì),建立存儲(chǔ)與計(jì)算高效協(xié)同機(jī)制,利用GDS(GPUDirectStorage)、KVCache/Share等技術(shù)提升推理任務(wù)中存儲(chǔ)訪問(wèn)性能與GPU利用率。
3.確保存儲(chǔ)系統(tǒng)具備高可用性與數(shù)據(jù)安全保障,采用分布式強(qiáng)一致機(jī)制及同步/異步復(fù)制策略增強(qiáng)數(shù)據(jù)可靠性,設(shè)計(jì)自動(dòng)化故障恢復(fù)能力以應(yīng)對(duì)磁盤(pán)或節(jié)點(diǎn)異常,強(qiáng)化系統(tǒng)可觀測(cè)性與運(yùn)維便捷性,并通過(guò)系統(tǒng)化測(cè)試與故障模擬驗(yàn)證方案有效性。
職位要求:
1.具備扎實(shí)的編程功底,掌握C/C++/Go等語(yǔ)言,熟悉高并發(fā)、高性能程序設(shè)計(jì)模式。
2.熟悉分布式存儲(chǔ)系統(tǒng)架構(gòu),了解分布式一致性算法與高性能存儲(chǔ)關(guān)鍵技術(shù),有文件系統(tǒng)核心組件開(kāi)發(fā)實(shí)踐經(jīng)驗(yàn)。
3.熟悉NVMe協(xié)議與SSD特性,掌握SPDK及用戶態(tài)文件系統(tǒng)相關(guān)技術(shù)。
4.了解GPU或主流AI加速器,熟悉TensorFlow、PyTorch等深度學(xué)習(xí)框架,對(duì)其底層運(yùn)行機(jī)制有一定理解。
5.具備良好的溝通協(xié)作能力和問(wèn)題分析解決能力,富有團(tuán)隊(duì)精神,思維活躍,能在復(fù)雜技術(shù)難題中提出可行方案。
6.若你對(duì)技術(shù)充滿熱情,積極學(xué)習(xí)新技術(shù),即使部分條件未完全滿足也無(wú)需顧慮,我們歡迎自信且熱愛(ài)技術(shù)的候選人加入。
工作地點(diǎn):北京、杭州、上海