目前常见的 AI 模型驱动情况如下:
谷歌一直在测试自己的人工智能供消费者使用,他们称之为Bard,但是由各种基础模型驱动,最近是一个名叫PaLM 2的模型。对于开发出LLM技术的公司来说,他们非常令人失望,尽管昨天宣布的改进表明他们仍在研究基础技术,所以有希望。它已经获得了运行有限代码和解释图像的能力,但我目前通常会避免它。最后一家公司Anthropic发布了Claude 2。Claude最值得注意的是有一个非常大的上下文窗口-本质上是LLM的记忆。Claude几乎可以保存一整本书或许多PDF。与其他大型语言模型相比,它不太可能恶意行事,这意味着,在实际上,它倾向于对你做一些事情进行责骂。现在,来看看一些用途:
Playground2.5模型地址https://civitai.com/models/325263/playground-ais-playground-v25-1024pxhttps://huggingface.co/playgroundai/playground-v2.5-1024px-aesthetic/tree/main该模型根据文本提示生成图像。它是一个使用两个固定的、预训练的文本编码器(OpenCLIP-ViT/G和CLIP-ViT/L)的潜在扩散模型。它遵循与Stable Diffusion XL相同的架构(底层框架是SDXL)。另外这个模型的风格化比较强,所以注意一下,CGF的权重不要给太高默认使用EDMDPMSolverMultistepScheduler调度程序,以获得更清晰的细节。这是DPM++ 2M Karras调度程序的EDM表达。对于这个调度程序,guidance_scale=3.0是一个很好的默认值。EDMEulerScheduler调度程序。这是Euler调度程序的EDM表达。对于这个调度程序,guidance_scale=5.0是一个很好的默认值
当我们现在谈论人工智能时,我们通常谈论的是大型语言模型或简称为LLMs。大多数AI应用程序都由LLM驱动,其中只有几个基础模型,由少数几个组织创建。每家公司都通过聊天机器人直接访问他们的模型:OpenAI制作了GPT-3.5和GPT-4,它们驱动了[ChatGPT](https://chat.openai.com/)和微软的[Bing](https://www.bing.com/search?q=Bing+AI&showconv=1&FORM=hpcodx&sydconv=1)(在Edge浏览器上访问)。Google在[Bard](https://bard.google.com/)的标签品牌下有各种模型。Anthropic制造了Claude和[Claude 2](https://claude.ai/)。还有其他我不会讨论的LLMs。第一个是[Pi](https://pi.ai/talk),一个由Inflection构建的聊天机器人。Pi针对对话进行了优化,真的、真的想成为你的朋友(真的,试试看我在说什么)。它不喜欢做除了聊天之外的任何事情,尝试让它为你工作是一种令人沮丧的事情。我们也不会涵盖任何人都可以使用和修改的各种开源模型。它们通常对今天的普通用户来说不是很容易使用或有用,但是有真正的希望。未来的指南可能会包括它们。因此,这是一份快速参考图表,总结了LLM的现状: