以下是为 Java 程序员转型大模型算法工程师提供的一些建议:
您可以根据自身情况,有针对性地进行学习和实践,逐步实现从 Java 程序员向大模型算法工程师的转型。
本文的核心代码全部参考如下开源项目:[GitHub-datawhalechina/self-llm:《开源大模型食用指南》基于Linux环境快速部署开源大模型,更适合中国宝宝的部署教程](https://github.com/datawhalechina/self-llm/tree/master)[heading1]一、引言[content]大家好,我是大圣,一个致力于使用AI技术将自己打造为超级个体的程序员。作为一名程序员,我对大模型技术是非常向往的,但是因为是非科班出身,一直迟迟没有动手。在Llama3出来之后,我萌生了微调的想法,我的目的很简单,不是为了学习多么高深的知识,而是让自己先入门。入门最好的方式就是直接上手实操,这是也是之前的一系列教程中所强调的理念。由于市面上没有找到专门针对我们纯小白的教程,所以这篇教程就来啦!这篇教程的亮点教你如何购买算力,不再为本地电脑的配置不够而发愁手把手教你下载并部署Llama3模型,以前都是玩别人部署的,这次咱们玩自己的!)使用甄嬛数据集微调Llama3模型,并且针对微调后的模型进行实验了解微调的意义和概念但是这篇教程不会讲解微调的技术性原理以及文中会用到的Python代码。原因很简单,因为我是一位Java开发工程师,里面的代码我都是靠GPT4.0帮我读的另外这篇教程需要你充值50块钱,不过不是给我哦,是购买算力的预充值。我不想因为50块钱把你劝退,所以这里我要多说一句,免费的才是最贵的。看完我的教程,你绝对会认为这50块钱花的很值OK,都交代清楚,大家按照决定是否要继续享用,废话不多少,我们直接开始
[heading4]序智科技-算法/后端/前端正式&实习职责:负责公司网站、移动应用等前端产品的开发和维护,与产品、设计、后端等团队紧密合作,实现产品需求,优化前端性能,提升用户体验要求:1.计算机相关专业本科及以上学历2.3年以上前端开发经验,有大型网站或应用开发经历者优先3.精通HTML、CSS、JavaScript等前端技术,熟悉主流前端框架如React、Vue、Angular等4.熟悉响应式设计、跨浏览器兼容性、Web性能优化等,熟练使用tailwind框架优先。5.熟练掌握常见打包工具链,如webpack、vite等6.有移动端开发经验优先三.大模型Agent算法工程师工作职责:(1)训练/微调大模型,支持Agent系统。(2)调用GPT4 API进行前沿Agent框架设计。硬性要求:(1)对至少2个框架具备源码级别的理解+优化能力,包括但不限于Langchain,XAgent,ChatDev,DsPy,AutoGPT,BabyAGI,MetaGPT(2)熟悉GPT Function Calling原理,熟练掌握Prompt Enginnering(3)对预训练/微调(尤其是微调)熟练,熟练掌握huggingface/deepspeed(或其他框架)加分项:对多模态大模型有一定了解,精通低代码平台欢迎推荐或自荐简历至tong000tong@126.com,或飞书与我@张晓桐联系发布时间:5月1日
中国移动设计院招聘需求(代招):办公地点:北京海淀中关村需求一AI算法工程师:数量:1名学历:本科及以上资历:5年及以上要求:1、对系统全局调优和预测性维护有一定建模基础2、具有机器学习、深度学习相关项目实践经验,熟悉至少一种算法3、熟悉相关深度学习框架如Tensorflow,能够快速实现研究及设想4、负责AI在智能数据中心、智能网络领域应用研发移动设计院招聘需求需求二大模型开发工程师数量:1名学历:本科及以上资历:5年及以上岗位要求:1、参与大模型技术研究、大模型微调、大模型智能体研发、基于大模型的应用研发等工作;2、大模型相关的数据工程,包括预训练数据、微调数据、行业数据挖掘等;3、大模型相关的落地实现:如推理优化、部署、AI-Agent、工具学习、领域大模型等;技能要求:1、了解大模型基本原理,包括不限于模型架构、模型预训练及微调、模型部署及推理;2、熟悉LLM相关技术,如transformer,prompt tuning,RLHF,langchain,Agent,MOE,RAG等;3、熟悉算法和数据结构,熟悉常用的编程语言,有较好的Python开发经验,编程基础扎实;4、了解或掌握机器学习、深度学习基本算法原理,熟悉AI建模流程,在NLP领域有开发经验优先;5、了解熟悉大模型常用训练框架、推理架构;了解分布式计算、并行计算。[heading4]联络方式:[content]飞书与@史鹏飞联系