工作职责:
1. 大模型预训练、微调、评测、参数调优等相关算法工作,以及大模型技术在业务场景应用;
2. 参与项目的需求分析、设计评审和代码评审;
3. 跟踪和研究自然语言处理和大型语言模型领域的前沿技术和趋势,为项目提供技术支持。
任职资格:
1. 计算机科学、人工智能、CV/NLP或相关领域专业背景;
2. 熟悉深度学习、自然语言处理、机器学习等相关领域的基本概念和技术,熟练使用至少一种深度学习框架(如PyTorch等);
3. 至少2年大型语言模型(如GPT、BERT等)的研究、开发和应用经验;
4. 具备良好的编程能力,熟悉Python编程语言。具备扎实的数学基础,熟悉统计学、优化算法等相关领域知识。