算法開發(fā)工程師
2.5-5萬元/月工作職責(zé):
1、深入探索AI大模型核心能力,結(jié)合具體行業(yè)應(yīng)用場景與實(shí)際數(shù)據(jù),應(yīng)對(duì)大模型系統(tǒng)化落地過程中的關(guān)鍵技術(shù)難題,涵蓋模型微調(diào)、強(qiáng)化學(xué)習(xí)訓(xùn)練、LLM上下文工程等方面;
2、研究主流開源大模型的部署與性能優(yōu)化策略,包括行業(yè)級(jí)大模型的訓(xùn)練與推理實(shí)踐,以及面向輕量化場景的小模型蒸餾技術(shù);
3、持續(xù)追蹤大語言模型前沿進(jìn)展,推動(dòng)生成質(zhì)量不斷優(yōu)化,實(shí)現(xiàn)業(yè)務(wù)效果的持續(xù)突破與提升。
任職要求:
1、計(jì)算機(jī)科學(xué)、人工智能、機(jī)器學(xué)習(xí)或相關(guān)專業(yè)碩士學(xué)歷,具備扎實(shí)的機(jī)器學(xué)習(xí)、算法設(shè)計(jì)或AI工程化理論基礎(chǔ);
2、掌握大語言模型(LLM)核心技術(shù)原理,熟悉Transformer結(jié)構(gòu)、注意力機(jī)制及模型微調(diào)方法;了解LoRA、RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí))等主流優(yōu)化手段;具備模型推理與任務(wù)規(guī)劃能力,熟練運(yùn)用Chain-of-Thought、PromptEngineering、ContextEngineering等相關(guān)技術(shù);
3、精通Python編程,掌握LLamaFactory/ms-swift等模型微調(diào)框架;了解vLLM等模型部署工具的使用;
4、具備高度的責(zé)任意識(shí)和自我驅(qū)動(dòng)力,能獨(dú)立開展技術(shù)攻關(guān);擁有良好的溝通協(xié)調(diào)能力,可與多職能團(tuán)隊(duì)高效協(xié)同推進(jìn)項(xiàng)目。
加分項(xiàng)
大模型實(shí)踐經(jīng)驗(yàn):參與過大模型預(yù)訓(xùn)練、微調(diào)或應(yīng)用落地項(xiàng)目,具備實(shí)習(xí)或?qū)崙?zhàn)經(jīng)歷,熟悉HuggingFace、LangChain、LLamaIndex等LLM技術(shù)生態(tài);
AI基礎(chǔ)設(shè)施背景:了解GPU計(jì)算、分布式訓(xùn)練架構(gòu)、高并發(fā)數(shù)據(jù)處理流程,熟悉向量數(shù)據(jù)庫等AI底層支撐技術(shù)。