以下是关于大模型的相关活动及信息:
[title]VIRTUAL中文大模型基准测评2023年度报告[heading2]2023大模型关键进展• OpenAI发布GPT4•复旦开源MOSS•元语开源ChatYuan•清华开源ChatGLM • 360发布360智脑1.0•科大讯飞发布星火1.0 •阿里云发布通义千问1.0• Meta开源Llama2•百川智能开源Baichuan-7B • OpenAI发布多模态GPT-4V • GPT-4 Turbo发布•百度升级文心一言4.0•商汤科技发布商量1.0•阿里云开源Qwen-7B•华为发布盘古3.0 •字节跳动公测大模型产品豆包•百川智能开源Baichuan2• vivo发布BlueLM•清华开源ChatGLM3 •清华&智谱AI开源ChatGLM2•小米发布大模型MiLM•西湖心辰发布西湖大模型•零一万物开源Yi-34B •文心一言升级V3.5•科大讯飞升级星火3.0•元象科技开源XVERSE-13B•昆仑万维发布天工1.0•云从科技发布从容大模型•出门问问发布序列猴子•上海人工智能实验室开源InternLM-20B• OPPO发布AndesGPT
2024年1月27日,LangGPT()社区北京第一期交流沙龙活动跟大家见面了,抓住了年末的小尾巴,跟小伙伴们面对面地畅聊AI现状!身为LangGPT的团队成员,有幸跟江树、财猫从开始筹备,组织,到会场布置,活动安排等等,到场的小伙伴们也非常给力,精彩分享不断,最终共同完成了一次精彩的活动!活动详细回顾请看LangGPT创始人云中江树的[《线下见——记LangGPT社区北京第一期交流沙龙》](http://mp.weixin.qq.com/s?__biz=MzAxNjU5OTEwOQ==&mid=2247484176&idx=1&sn=77d4f8eddb60e55c2fcb4c08f6480c25&chksm=9bf3123aac849b2ccf2b4dc1b3e548e03aed80dde78497713cfea0df93d05a76f72d197843e2&scene=21#wechat_redirect)本次活动的主题是关于“大模型落地应用”,身为团队的一员,同时作为本次的分享嘉宾,对于目前AI的实际应用和团队实践过的一些案例进行复盘总结,形成本次分享内容《大模型商业化落地现状与思考》,期望能够给大家一些启发。
通俗来讲,大模型就是输入大量语料,来让计算机获得类似人类的“思考”能力,使之能够理解自然语言,能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习,那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程:1.找学校::训练LLM需要大量的计算,因此GPU更合适,因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大,需要的数据量特别多,几千亿序列(Token)的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容,让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导5.搬砖::就业指导完成后,下面就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)