Chat with Wiki - java程序员怎么转型大模型算法工程师

Answer

以下是为 Java 程序员转型大模型算法工程师提供的一些建议：

学习相关理论知识：了解大模型的基本原理，包括模型架构、预训练及微调、部署及推理等。
掌握技术工具：熟悉 LLM 相关技术，如 Transformer、Prompt Tuning、RLHF、Langchain、Agent、MOE、RAG 等。
提升编程能力：熟悉算法和数据结构，具备扎实的编程基础，尤其是 Python 开发。
积累项目经验：
- 可以参考大圣的全网最适合小白的 Llama3 部署和微调教程，该教程手把手教您下载并部署 Llama3 模型，使用甄嬛数据集微调模型，并了解微调的意义和概念。但需注意，此教程不会讲解微调的技术性原理及文中用到的 Python 代码。
- 关注招聘信息，例如序智科技和中国移动设计院的招聘需求，了解大模型算法工程师的职责和要求，针对性地提升自己的能力。
增强相关技能：
- 对至少 2 个框架具备源码级别的理解和优化能力，包括但不限于 Langchain、XAgent、ChatDev、DsPy、AutoGPT、BabyAGI、MetaGPT。
- 熟悉 GPT Function Calling 原理，熟练掌握 Prompt Engineering。
- 对预训练/微调（尤其是微调）熟练，熟练掌握 huggingface/deepspeed（或其他框架）。
- 对多模态大模型有一定了解，精通低代码平台会是加分项。

您可以根据自身情况，有针对性地进行学习和实践，逐步实现从 Java 程序员向大模型算法工程师的转型。

Content generated by AI large model, please carefully verify (powered by aily)

References

本文的核心代码全部参考如下开源项目：[GitHub-datawhalechina/self-llm:《开源大模型食用指南》基于Linux环境快速部署开源大模型，更适合中国宝宝的部署教程](https://github.com/datawhalechina/self-llm/tree/master)[heading1]一、引言[content]大家好，我是大圣，一个致力于使用AI技术将自己打造为超级个体的程序员。作为一名程序员，我对大模型技术是非常向往的，但是因为是非科班出身，一直迟迟没有动手。在Llama3出来之后，我萌生了微调的想法，我的目的很简单，不是为了学习多么高深的知识，而是让自己先入门。入门最好的方式就是直接上手实操，这是也是之前的一系列教程中所强调的理念。由于市面上没有找到专门针对我们纯小白的教程，所以这篇教程就来啦！这篇教程的亮点教你如何购买算力，不再为本地电脑的配置不够而发愁手把手教你下载并部署Llama3模型，以前都是玩别人部署的，这次咱们玩自己的！)使用甄嬛数据集微调Llama3模型，并且针对微调后的模型进行实验了解微调的意义和概念但是这篇教程不会讲解微调的技术性原理以及文中会用到的Python代码。原因很简单，因为我是一位Java开发工程师，里面的代码我都是靠GPT4.0帮我读的另外这篇教程需要你充值50块钱，不过不是给我哦，是购买算力的预充值。我不想因为50块钱把你劝退，所以这里我要多说一句，免费的才是最贵的。看完我的教程，你绝对会认为这50块钱花的很值OK，都交代清楚，大家按照决定是否要继续享用，废话不多少，我们直接开始

最近招聘信息-持续更新中

[heading4]序智科技-算法/后端/前端正式&实习职责:负责公司网站、移动应用等前端产品的开发和维护，与产品、设计、后端等团队紧密合作,实现产品需求，优化前端性能,提升用户体验要求:1.计算机相关专业本科及以上学历2.3年以上前端开发经验,有大型网站或应用开发经历者优先3.精通HTML、CSS、JavaScript等前端技术,熟悉主流前端框架如React、Vue、Angular等4.熟悉响应式设计、跨浏览器兼容性、Web性能优化等，熟练使用tailwind框架优先。5.熟练掌握常见打包工具链，如webpack、vite等6.有移动端开发经验优先三.大模型Agent算法工程师工作职责：（1）训练/微调大模型，支持Agent系统。（2）调用GPT4 API进行前沿Agent框架设计。硬性要求：（1）对至少2个框架具备源码级别的理解+优化能力，包括但不限于Langchain,XAgent,ChatDev,DsPy,AutoGPT,BabyAGI，MetaGPT（2）熟悉GPT Function Calling原理，熟练掌握Prompt Enginnering（3）对预训练/微调（尤其是微调）熟练，熟练掌握huggingface/deepspeed（或其他框架）加分项：对多模态大模型有一定了解，精通低代码平台欢迎推荐或自荐简历至tong000tong@126.com，或飞书与我@张晓桐联系发布时间：5月1日

最近招聘信息-持续更新中

中国移动设计院招聘需求（代招）：办公地点：北京海淀中关村需求一AI算法工程师：数量：1名学历：本科及以上资历：5年及以上要求：1、对系统全局调优和预测性维护有一定建模基础2、具有机器学习、深度学习相关项目实践经验，熟悉至少一种算法3、熟悉相关深度学习框架如Tensorflow，能够快速实现研究及设想4、负责AI在智能数据中心、智能网络领域应用研发移动设计院招聘需求需求二大模型开发工程师数量：1名学历：本科及以上资历：5年及以上岗位要求：1、参与大模型技术研究、大模型微调、大模型智能体研发、基于大模型的应用研发等工作；2、大模型相关的数据工程，包括预训练数据、微调数据、行业数据挖掘等；3、大模型相关的落地实现：如推理优化、部署、AI-Agent、工具学习、领域大模型等；技能要求：1、了解大模型基本原理，包括不限于模型架构、模型预训练及微调、模型部署及推理；2、熟悉LLM相关技术，如transformer,prompt tuning,RLHF,langchain,Agent,MOE,RAG等；3、熟悉算法和数据结构，熟悉常用的编程语言，有较好的Python开发经验，编程基础扎实；4、了解或掌握机器学习、深度学习基本算法原理，熟悉AI建模流程，在NLP领域有开发经验优先；5、了解熟悉大模型常用训练框架、推理架构；了解分布式计算、并行计算。[heading4]联络方式：[content]飞书与@史鹏飞联系