生成式 AI 是一种能够生成新内容的人工智能技术,其内容可以是多模态的,包括文本、图像、音频、视频等。
Gen AI/Generative AI 是“生成式人工智能”的正式称呼,它和 AIGC 有所不同。AIGC 指的是由人工智能生成的内容的创作方式,是 Generative AI 的应用结果。
ChatGPT 是 OpenAI 推出的,早期是一种模型,目前逐渐演变成一种可以兼容多种 GPT 模型的聊天应用(服务)。
生成式 AI 可以应用于广泛的场景,例如文档摘要、信息提取、代码生成、营销活动创建、虚拟协助、呼叫中心机器人等。
其工作方式包括训练阶段和应用阶段。训练阶段通过从大量现有内容中学习生成基础模型,应用阶段基础模型可用于生成内容和解决一般性问题,也可使用特定领域新数据集进一步训练以解决特定问题。
在工具方面,如 Google Cloud 的 Vertex AI 是端到端机器学习开发平台,Generative AI Studio 允许快速制作原型和自定义生成式 AI 模型,Model Garden 可发现和交互基础及第三方开源模型。
以 Midjourney 为代表的工具在图形领域,可根据用户提供的文本描述生成高度相关和创造性的图像,这种通过文本命令获得图像的方式叫 Prompting,是全新形态的人机交互。其背后的原理涉及数据、映射和扩散三个概念。首先是数据,包括获取各种图像存档和创建特定数据集以获得足够基础来特征化物体、风格或概念。其次是映射,AI 使用算法识别和提取图片关键视觉特征。最后是扩散,AI 能通过创造性扩散过程探索和创造新的视觉表达形式。
Gen AI/Generative AI是“生成式人工智能”正式称呼。Generative AI是一种能够生成新内容的人工智能技术,比如文本、图像、音乐等。而AIGC指的是由人工智能生成的内容的创作方式,实际上是Generative AI的应用结果。[heading1]问题四、ChatGPT是什么?[content]从OpenAI的官网中可以查询到,在2022年宣发时,OpenAI称ChatGPT是一种模型。但是同样是在官网中查询帮助页面,发现这里称ChatGPT是一种服务。而我们使用的ChatGPT目前是依赖GPT系列模型来运转的。不做任何怀疑论上的揣摩,从公开收集的资料中可以看出,早些年OpenAI推出了一个叫ChatGPT的模型,但目前我们所熟知的ChatGPT逐渐演变成了一种可以兼容多种GPT模型的聊天应用(服务)。
生成式人工智能是一种人工智能技术,它能够生成新的、未曾存在的内容。这些内容可以是多模态的,包括:文本:例如文章、报告、诗歌等图像:例如绘画、设计图、合成照片等音频:例如音乐、语音、环境声音等视频:例如电影剪辑、教程、仿真等[heading3]应用场景[content]Generative AI可以应用于广泛的场景,例如:文档摘要:将长篇文章或报告总结为简短、精准的摘要信息提取:从大量数据中识别并提取关键信息代码生成:根据用户的描述自动编写代码营销活动创建:生成广告文案、设计图像等虚拟协助:例如智能聊天机器人、虚拟客服等呼叫中心机器人:能够处理客户的电话请求[heading3]如何工作?[content]1.训练阶段:Generative AI通过从大量现有内容(文本、音频、视频等)中学习,进行训练。训练的结果是一个“基础模型”。2.应用阶段:基础模型可以用于生成内容并解决一般性问题。它还可以使用特定领域的新数据集进一步训练,以解决特定问题,这样就可以得到一个量身定制的新模型。[heading3]Google Cloud的工具[content]Vertex AI:这是Google Cloud上的端到端机器学习开发平台,旨在帮助开发人员构建、部署和管理机器学习模型。Generative AI Studio:这是一个工具,允许应用程序开发人员或数据科学家快速制作原型和自定义生成式AI模型,无需代码或代码量少。Model Garden:这是一个平台,可以让你发现Google的基础和第三方开源模型,并与之交互。它提供了一组MLOps工具,用于自动化机器学习管道。
生成式人工智能是一种全新的信息获取方式,而midjourney等工具所代表的是图形领域的信息获取通过背后的人工智能模型,可以根据用户提供的文本描述生成高度相关和创造性的图像。这种通过文本命令获得图像的方式叫做Prompting,是一种全新形态的人机交互。比如我输入:想象:安塞尔亚当斯的风光摄影,平遥,全景图,云隙光,丁达尔光,史诗的,明暗对照法就能获得以上图像。为什么能达成这样的能力。我们把复杂的计算机专业领域概念拆解成为三个简单的词汇。数据,映射和扩散。首先是数据,包括从公共数据库中获取世界上万事万物的图像存档、历史文献图片,或者创建特定的数据集以覆盖特定的风格或元素。最终,收集数据的目的是,获得足够的基础。用以特征化每一个世界上的物体、风格或概念。第二个部分是映射,在数据处理阶段,AI使用如卷积神经网络的算法,来识别和提取图片中的关键视觉特征,如颜色、形状、纹理等。这个过程涉及到从原始数据中学习到的特征的映射这些映射后的特征将用于生成新的艺术作品。核心本质是将信息进行蒸馏,抛弃干扰的部分将特征得以呈现。比如我们现在看到的这个苹果。最后一个概念是扩散(Diffusion)利用学习到的数据和视觉特征,AI能够通过创造性扩散的过程,不仅仅是复制或模仿已知的艺术风格,而是在现有数据的基础上,通过AI的内部处理机制,探索和创造新的视觉表达形式。归根结底,这样的核心机制,授予了创作者一只自己会动的笔。本雅明把摄影时代称作为机械复制时代,那也许我们这个时代就是人工智能执笔时代。不需要笔也能画画,拍电影。只需站在“画架”之前思考我们的观念,题材,实现路径。