Chat with Wiki - 大模型相关活动

Answer

以下是关于大模型的相关活动及信息：

2023 年度中文大模型关键进展：OpenAI 发布 GPT4、复旦开源 MOSS、元语开源 ChatYuan、清华开源 ChatGLM 、360 发布 360 智脑 1.0、科大讯飞发布星火 1.0 、阿里云发布通义千问 1.0、Meta 开源 Llama2、百川智能开源 Baichuan-7B 、OpenAI 发布多模态 GPT-4V 、GPT-4 Turbo 发布、百度升级文心一言 4.0、商汤科技发布商量 1.0、阿里云开源 Qwen-7B、华为发布盘古 3.0 、字节跳动公测大模型产品豆包、百川智能开源 Baichuan2、vivo 发布 BlueLM、清华开源 ChatGLM3 、清华&智谱 AI 开源 ChatGLM2、小米发布大模型 MiLM、西湖心辰发布西湖大模型、零一万物开源 Yi-34B 、文心一言升级 V3.5、科大讯飞升级星火 3.0、元象科技开源 XVERSE-13B、昆仑万维发布天工 1.0、云从科技发布从容大模型、出门问问发布序列猴子、上海人工智能实验室开源 InternLM-20B 、OPPO 发布 AndesGPT。
2024 年 1 月 27 日，LangGPT 社区北京第一期交流沙龙活动举行，主题是关于“大模型落地应用”。
大模型入门指南：通俗来讲，大模型输入大量语料，让计算机获得类似人类的“思考”能力，能进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”类比大模型的训练、使用过程：找有大量 GPU 的“贵族学校”训练；确定大量数据的“教材”；选择合适算法的“老师”；为胜任某一行业进行微调“就业指导”；完成指导后进行推导“搬砖”，如翻译、问答等。

Content generated by AI large model, please carefully verify (powered by aily)

References

2023年度中文大模型基准测评报告.pdf

[title]VIRTUAL中文大模型基准测评2023年度报告[heading2]2023大模型关键进展• OpenAI发布GPT4•复旦开源MOSS•元语开源ChatYuan•清华开源ChatGLM • 360发布360智脑1.0•科大讯飞发布星火1.0 •阿里云发布通义千问1.0• Meta开源Llama2•百川智能开源Baichuan-7B • OpenAI发布多模态GPT-4V • GPT-4 Turbo发布•百度升级文心一言4.0•商汤科技发布商量1.0•阿里云开源Qwen-7B•华为发布盘古3.0 •字节跳动公测大模型产品豆包•百川智能开源Baichuan2• vivo发布BlueLM•清华开源ChatGLM3 •清华&智谱AI开源ChatGLM2•小米发布大模型MiLM•西湖心辰发布西湖大模型•零一万物开源Yi-34B •文心一言升级V3.5•科大讯飞升级星火3.0•元象科技开源XVERSE-13B•昆仑万维发布天工1.0•云从科技发布从容大模型•出门问问发布序列猴子•上海人工智能实验室开源InternLM-20B• OPPO发布AndesGPT

开发：AI应用大模型商业化落地现状与思考

2024年1月27日，LangGPT()社区北京第一期交流沙龙活动跟大家见面了，抓住了年末的小尾巴，跟小伙伴们面对面地畅聊AI现状！身为LangGPT的团队成员，有幸跟江树、财猫从开始筹备，组织，到会场布置，活动安排等等，到场的小伙伴们也非常给力，精彩分享不断，最终共同完成了一次精彩的活动！活动详细回顾请看LangGPT创始人云中江树的[《线下见——记LangGPT社区北京第一期交流沙龙》](http://mp.weixin.qq.com/s?__biz=MzAxNjU5OTEwOQ==&mid=2247484176&idx=1&sn=77d4f8eddb60e55c2fcb4c08f6480c25&chksm=9bf3123aac849b2ccf2b4dc1b3e548e03aed80dde78497713cfea0df93d05a76f72d197843e2&scene=21#wechat_redirect)本次活动的主题是关于“大模型落地应用”，身为团队的一员，同时作为本次的分享嘉宾，对于目前AI的实际应用和团队实践过的一些案例进行复盘总结，形成本次分享内容《大模型商业化落地现状与思考》，期望能够给大家一些启发。

大模型入门指南

通俗来讲，大模型就是输入大量语料，来让计算机获得类似人类的“思考”能力，使之能够理解自然语言，能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习，那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程：1.找学校::训练LLM需要大量的计算，因此GPU更合适，因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大，需要的数据量特别多，几千亿序列（Token）的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容，让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后，为了让大模型能够更好胜任某一行业，需要进行微调（fine tuning）指导5.搬砖::就业指导完成后，下面就要正式干活了，比如进行一次翻译、问答等，在大模型里称之为推导（infer）