我不是基于 ChatGPT 开发的。ChatGPT 于 2022 年 11 月横空出世,背后基于 GPT3.5,其训练包括多个阶段,如预训练(PT)阶段建立模型的能力上限,监督微调(SFT)阶段让模型学会对话形式,强化学习从人类反馈(RLHF)阶段细分为奖励模型(RM)和强化学习(RL)阶段以激发多种能力。
此外,Hugging Face 推出了自己的 ChatGPT 版本,Stability AI 发布了 DeepFloyd IF 图像生成模型,效率和效果都有提升。AudioGPT 是一个能理解和生成语音、音乐等的系统,具有多种特点和应用领域。
2022年11月,ChatGPT横空出世,背后基于GPT3.5。GPT3.5其实已经不是单纯的LLM基座模型了,据说它跟InstrcutGPT是同源技术,因此下面我们就以InstructGPT为参照介绍ChatBot是怎么炼成的。首先概览式地介绍一下训练ChatBot所需要的几个阶段,有个基本印象阶段0:PT阶段(Pre-train)。这个阶段建立模型的capacity,就是确定模型各方面能力的天花板阶段1:SFT阶段(Supervised Fine-tune)。这个阶段让模型学会conversational format,就是知道了对话应该按什么形式展开。阶段2:RLHF阶段(Reinforcement Learning from Human Feedback)。这个阶段细分为RM(Reward Model)阶段和RL(Reinforcement Learning)阶段,能激发出模型具备多种能力,包括但不限于safty、reasoning和stability我非常喜欢AK的[这张图](https://link.zhihu.com/?target=https%3A//www.youtube.com/watch%3Fv%3DbZQun8Y4L2A),简单清晰把重要信息点都罗列了出来[heading3]Pre-Train阶段[content]预训练跟GPT3的方法近似,回顾一下重要信息,decoder-only的网络架构,模型大小175B,输入窗口大小2048,单词本大小50257,见过300B的tokens,原始训练文本45T,组成如下(真实ChatGPT只会比这个多)除了最大号的175B的GPT,InstructGPT中还训练1.3B和6B的模型以备不时之需
|Role名称|作者|版本|描述|prompt|其他|案例|<br>|-|-|-|-|-|-|-|<br>|学术助理|Kevin Ivery|0.1|Professional academic assistant with a professorial touch<br>专业的学术助理与教授的触摸|You are ChatGPT,a large language model trained by OpenAI,based on the GPT-4 architecture.<br>Knowledge cutoff:2023-04<br>Current date:2023-12-09<br><br>Image input capabilities:Enabled<br><br>You are a"GPT"– a version of ChatGPT that has been customized for a specific use case.GPTs use custom instructions,capabilities,and data to optimize ChatGP
Hugging Face推出了[自己的ChatGPT版本](https://huggingface.co/spaces/huggingchat/chat-ui),里面的模型是OpenAssistant模型。试了一下他认识中文但是不支持中文输出,整个模型的效果还是不错的,以后会支持更多模型。Stability AI正式发布了DeepFloyd IF图像生成模型,这是一个有文本编码器和三个级联的diffusion模块组合的模型。这个模型的效率要比原有的satble diffusion效率要高很多。我尝试了一下,看起来效果也比SD2.0强一些。划重点,这个模型是认字的生成出来的英文非常工整。文章链接:[https://stability.ai/blog/deepfloyd-if-text-to-image-model](https://stability.ai/blog/deepfloyd-if-text-to-image-model)可以在这里体验模型:[https://huggingface.co/spaces/DeepFloyd/IF](https://huggingface.co/spaces/DeepFloyd/IF)Github:[https://github.com/deep-floyd/IF](https://github.com/deep-floyd/IF)模型网站:[https://deepfloyd.ai/if](https://deepfloyd.ai/if)[AudioGPT](https://github.com/AIGC-Audio/AudioGPT)是一个理解和生成语音、音乐、声音和说话头的系统,采用深度学习技术和人工智能,可以为音频、影视制作和语音识别等领域带来创新的应用和解决方案。该系统具有多个有趣的特点,例如可应用于多种语言,能进行多媒体生成和多样化娱乐,以及具有高质量的音频输出等。