算法研發(fā)工程師
2.5-5萬元/月工作職責(zé):
1、探索AI大模型的核心能力,結(jié)合實(shí)際行業(yè)場(chǎng)景與數(shù)據(jù),應(yīng)對(duì)大模型系統(tǒng)化落地中的各類挑戰(zhàn),涵蓋模型微調(diào)、強(qiáng)化學(xué)習(xí)訓(xùn)練、LLM上下文工程等關(guān)鍵技術(shù)環(huán)節(jié);
2、研究主流開源大模型的應(yīng)用與性能優(yōu)化,包括行業(yè)級(jí)大模型的訓(xùn)練與推理實(shí)現(xiàn),以及面向特定場(chǎng)景的小模型蒸餾技術(shù);
3、緊跟大語言模型前沿發(fā)展動(dòng)態(tài),推動(dòng)生成質(zhì)量不斷優(yōu)化,持續(xù)突破業(yè)務(wù)應(yīng)用的效果邊界。
任職要求:
1、計(jì)算機(jī)科學(xué)、人工智能、機(jī)器學(xué)習(xí)或相關(guān)專業(yè)碩士學(xué)歷,具備扎實(shí)的機(jī)器學(xué)習(xí)、算法設(shè)計(jì)與AI工程理論基礎(chǔ);
2、深刻理解大語言模型(LLM)底層機(jī)制,掌握Transformer結(jié)構(gòu)、注意力機(jī)制、模型微調(diào)方法;了解常見大模型優(yōu)化手段如LoRA、RLHF等;具備模型推理與任務(wù)規(guī)劃能力,熟悉思維鏈(Chain-of-Thought)、提示工程(PromptEngineering)、上下文工程等核心技術(shù);
3、精通Python編程,掌握LLamaFactory/ms-swift等模型微調(diào)框架,熟悉vLLM等模型部署工具;
4、具有強(qiáng)烈的責(zé)任意識(shí)和自我驅(qū)動(dòng)力,能獨(dú)立開展技術(shù)攻關(guān);具備良好溝通協(xié)調(diào)能力,可與多職能團(tuán)隊(duì)高效協(xié)同推進(jìn)項(xiàng)目。
加分項(xiàng)
大模型實(shí)踐經(jīng)驗(yàn):參與過大模型預(yù)訓(xùn)練、微調(diào)或?qū)嶋H應(yīng)用項(xiàng)目,掌握HuggingFace、LangChain、LLamaIndex等LLM技術(shù)生態(tài);
AI基礎(chǔ)設(shè)施背景:了解GPU計(jì)算、分布式訓(xùn)練架構(gòu)、高并發(fā)數(shù)據(jù)處理流程及向量數(shù)據(jù)庫等AI底層支撐技術(shù)。