在 AI 视频领域,Stability.AI 仍将免费提供其主要检查点作为核心业务宗旨(愿景是开源)。例如,Stability AI 推出了 Stable Diffusion 1.6 的图像模型。
此外,在自然语言模型中,OpenAI 以 GPT-3/3.5 和 ChatGPT 占据主导地位,但目前基于 OpenAI 构建的杀手级应用相对较少,且其 API 定价已下调过一次。不过 OpenAI 曾因服务压力太大暂停过 Chat GPT plus 的购买。
同时,还有其他相关动态,如微软发布了 Bing 品牌升级,Bing Chat 和 Bing Chat Enterprise 将成为 Copilot;Fable 发布了利用 LCM 实时生成图片的功能;英伟达发布了 Nemotron-3 8B 的 LLM 以及 NVIDIA NeMo 端到端框架;Midjourney 动漫微调模型 Nijijourney 跟进了模型微调;Google 在多个国家推出了面向青少年的 Google Bard;Airbnb 收购了一家名为 Gameplanner AI 的人工智能初创公司。
[title]生成式AI平台,谁主沉浮?[heading1]模型提供商发明了生成式AI但尚未实现大规模商业化如果没有谷歌、OpenAI和Stability.AI等公司奠定了杰出的研究和工程基础,我们现在所说的生成式AI将无从存在。创新的模型架构和不断扩展的训练管道使我们均受益于大语言模型(LLMs)和图像生成模型的“超能力”。然而,这些公司的收入规模在其用量和热度面前似乎不值一提。在图像生成方面,得益于其用户界面、托管产品和微调方法组成的操作生态,Stable Diffusion已经见证了爆炸性的社区增长。但Stability仍将免费提供其主要检查点作为核心业务宗旨(愿景是开源)。在自然语言模型中,OpenAI以GPT-3/3.5和ChatGPT占据主导地位,但到目前为止,基于OpenAI构建的杀手级应用仍相对较少,而且其API定价已经下调过一次。这可能只是一个暂时的现象。Stability.AI仍是一家尚未专注于商业化的新兴公司,随着越来越多杀手级应用的构建——尤其当它们被顺利整合进微软的产品矩阵,OpenAI也有成长为庞然大物的潜力,届时将吃走NLP领域一块很大的蛋糕。当模型被大量使用,大规模的商业化自然水到渠成。但阻力依然存在。开源模型可以由任何人托管,包括不承担大模型训练成本(高达数千万或数亿美元)的外部公司。是否有闭源模型可以长久地保持其优势目前还是未知数。我们看见由Anthropic、Cohere和Character.ai等公司自行构建的大语言模型开始崭露头角,这些模型和OpenAI基于类似的数据集和模型架构进行训练,在性能上已经逼近OpenAI。但Stable Diffusion的例子表明,如果开源模型拥有足够高的性能水平和充分的社区支持,那么闭源的替代方案将难以与其竞争。
|标题|概要|图片|链接|日期|<br>|-|-|-|-|-|<br>| 2024年2月第三周|OpenAI发布了视频生成模型Sora,可以生成1分钟长的高质量视频。Sora支持从图像和文本生成视频,并且可以扩展和编辑视频内容。<br>谷歌发布了语言模型Gemini 1.5 Pro和Ultra 1.0,支持长达100万字的上下文理解能力。同时推出了付费会员计划Gemini Advanced。<br>Stability AI发布基于扩散模型的图片生成模型Stable Cascade,支持图像变化和生成。<br>汇总了Midjourney图片生成模型的一些新功能,如默认版本升级和区域编辑能力增强。<br>介绍了一些新的AI产品,如视频生成软件Deforum Studio,自动生成UI设计稿的工具Galileo AI,以及英伟达的本地语言模型软件Chat with RTX等。<br>收录了一些AI领域的文章,如人工智能如何改变广告业,使用AI进行3D渲染以及Stable Diffusion潜在空间的解释等。||[AIGC Weekly #59](https://waytoagi.feishu.cn/wiki/W5ejwFfqgiqzyRk9F0lcOPUdnEb)|2024/02/16|<br>|2024年2月第二周|MLblocks:可视化构建构想处理流程Reducto Al:解析文档块优化向量数据库性能ElevenLabs GPT:返回GPT输出内容的声...Parent help:获取任何育儿技巧<br>ChatGPT Prompting:简单的提示词构建工具FORA ERM:为公司高层管理者设计的人工..<br>Supadash:直接从数据库生成图表和看板<br>Daydream:为管理者和高级财务做的BI工具<br>完全开源的LLM OLMo||[AIGC Weekly #58](https://waytoagi.feishu.cn/wiki/N3B0wyHGfisDJ3kh9dRcDB5TnAg)|2024/02/08|
微软发布了[Bing品牌升级](https://copilot.microsoft.com/),Bing Chat和Bing Chat Enterprise将成为Copilot。Fable也发布了利用[LCM实时生成图片](https://x.com/fable_motion/status/1724808303400861981?s=20)的功能。英伟达发布了一个叫[Nemotron-3 8B的LLM](https://developer.nvidia.com/blog/nvidia-ai-foundation-models-build-custom-enterprise-chatbots-and-co-pilots-with-production-ready-llms),同时还有一个NVIDIA NeMo端到端框架专门用于构建、定制和部署专为企业使用而定制的LLM。Midjourney动漫微调模型Nijijourney跟进了[模型微调](https://x.com/op7418/status/1724721195113971924?s=20)的能力。由于服务压力太大Open AI在15日[暂停了Chat GPT plus的购买](https://x.com/sama/status/1724626002595471740?s=20)。Stability AI推出了一个[Stable Diffusion 1.6](https://platform.stability.ai/sandbox/text-to-image)的图像模型,从他们的演示来看这个模型在高于512px分辨率上的表现比1.5好很多。Google在多个国家推出了[面向青少年的Google Bard](https://blog.google/products/bard/google-bard-expansion-teens/)。Airbnb以不到2亿美元的价格[收购了一家名为Gameplanner AI](https://news.airbnb.com/airbnb-has-acquired-gameplanner-ai/)的人工智能初创公司,这是其作为上市公司的首次收购。