Home/Question List/Question Detail

目前主流的AI大模型有哪些

Answer

目前主流的 AI 大模型主要有以下几种：

GPT 系列：例如 GPT-3 等，其基于 Transformer 算法，擅长自然语言生成任务。
BERT：属于 encoder-only 模型，通常适用于自然语言理解任务，如分类和情感分析。
T5：是 encoder-decoder 模型，可用于翻译和摘要等任务。
ChatGPT：用户通过像和人类一样对话即可完成任务。

大模型具有以下特点：

预训练数据非常大，往往来自互联网上的论文、代码、公开网页等，通常用 TB 级别的数据进行预训练。
参数非常多，如 Open 在 2020 年发布的 GPT-3 就已达到 170B 的参数。

大模型的应用场景广泛，包括：

文本生成和内容创作，如撰写文章、生成新闻报道、创作诗歌和故事等。
聊天机器人和虚拟助手，提供客户服务、日常任务提醒和信息咨询等服务。
编程和代码辅助，用于代码自动补全、bug 修复和代码解释。
翻译和跨语言通信，促进不同语言背景用户之间的沟通和信息共享。
情感分析和意见挖掘，为市场研究和产品改进提供数据支持。
教育和学习辅助，创建个性化学习材料、自动回答学生问题和提供语言学习支持。
图像和视频生成，如 DALL-E 等模型可根据文本描述生成相应图像。
游戏开发和互动体验，创建游戏中的角色对话、故事情节生成和增强玩家沉浸式体验。
医疗和健康咨询，理解和回答医疗相关问题，提供初步健康建议和医疗信息查询服务。
法律和合规咨询，帮助解读法律文件，提供合规建议。

Content generated by AI large model, please carefully verify (powered by aily)

References

Ranger：【AI 大模型】非技术背景，一文读懂大模型（长文）

首先为方便大家对大模型有一个整体的认知，我们先从大模型的整体架构着手，来看看大模型的组成是怎么样的。下面是我大致分的个层。从整体分层的角度来看，目前大模型整体架构可以分为以下几层：[heading3]1.基础层：为大模型提供硬件支撑，数据支持等[content]例如A100、数据服务器等等。[heading3]2.数据层[content]这里的数据层指的不是用于基层模型训练的数据基集，而是企业根据自己的特性，维护的垂域数据。分为静态的知识库，和动态的三方数据集[heading3]3.模型层：LLm或多模态模型[content]LLm这个大家应该都知道，large-language-model，也就是大语言模型，例如GPT，一般使用transformer算法来实现。多模态模型即市面上的文生图、图生图等的模型，训练所用的数据与llm不同，用的是图文或声音等多模态的数据集[heading3]4.平台层：模型与应用间的平台部分[content]比如大模型的评测体系，或者langchain平台等，提供模型与应用间的组成部分[heading3]5.表现层：也就是应用层，用户实际看到的地方[content]这个就很好理解了，就不用我多作解释了吧

从 0 到 1 了解大模型安全，看这篇就够了

encoder-only:这些模型通常适用于可以自然语言理解任务，例如分类和情感分析.最知名的代表模型是BERTencoder-decoder:此类模型同时结合了Transformer架构的encoder和decoder来理解和生成内容。该架构的一些用例包括翻译和摘要。encoder-decoder的代表是google的T5decoder-only:此类模型更擅长自然语言生成任务。典型使用包括故事写作和博客生成。这也是我们现在所熟知的众多AI助手的结构我们目前耳熟能详的AI助手基本都来自左侧的灰色分支,当然也包括ChatGPT。这些架构都是根据谷歌2017年发布的论文“attention is all you need”中提出的transformer衍生而来的，在transformer中，包括Encoder，Decoder两个结构目前的大型语言模型就是右侧只使用Decoder的Decoder-only架构的模型大模型又大在哪呢？第一，大模型的预训练数据非常大，这些数据往往来自于互联网上，包括论文，代码，以及可进行爬取的公开网页等等，一般来说，现在最先进的大模型一般都是用TB级别的数据进行预训练。第二，参数非常多，Open在2020年发布的GPT-3就已经达到170B的参数在GPT3中，模型可以根据用户输入的任务描述，或给出详细的例子，完成任务但这与我们熟知的ChatGPT仍然有着很大的差距，使用ChatGPT只需要像和人类一样对话，就可以完成任务。除了形式上的不同之外，还有一个更加重要的差距，那就是安全性上的差别。

问：现在大模型有什么比较火的应用场景

大模型因其强大的语言理解和生成能力，在多个领域和应用场景中表现出色，成为当前AI领域的热点。以下是一些大模型比较火的应用场景：文本生成和内容创作：大模型可以生成连贯、有逻辑的文本，应用于撰写文章、生成新闻报道、创作诗歌和故事等。聊天机器人和虚拟助手：利用大模型的自然语言处理能力，开发能够与人类进行自然对话的聊天机器人，提供客户服务、日常任务提醒和信息咨询等服务。编程和代码辅助：大模型可以用于代码自动补全、bug修复和代码解释，帮助开发者提高编程效率。翻译和跨语言通信：大模型能够理解和翻译多种语言，促进不同语言背景的用户之间的沟通和信息共享。情感分析和意见挖掘：通过分析社交媒体、评论和反馈中的文本，大模型可以识别用户情感和观点，为市场研究和产品改进提供数据支持。教育和学习辅助：大模型可以用于创建个性化的学习材料、自动回答学生问题和提供语言学习支持。图像和视频生成：如DALL-E等模型可以根据文本描述生成相应的图像，甚至在未来可能扩展到视频内容的生成。游戏开发和互动体验：大模型可以用于创建游戏中的角色对话、故事情节生成和增强玩家的沉浸式体验。医疗和健康咨询：大模型能够理解和回答医疗相关的问题，提供初步的健康建议和医疗信息查询服务。法律和合规咨询：大模型可以帮助解读法律文件，提供合规建议，降低法律服务的门槛。这些应用场景只是大模型潜力的一部分体现，随着技术的进步和模型的优化，大模型在未来可能会拓展到更多的领域和场景中。同时，随着大模型的普及，也需要注意其在隐私、安全和伦理方面的挑战。内容由AI大模型生成，请仔细甄别。

Others are asking

如何限制AI Chat回答非法话题，敏感词过滤

以下是关于限制 AI Chat 回答非法话题和进行敏感词过滤的相关内容：首先，以 ChatGPT 为例，其系统提示词会详细描述身份、角色、时间、记忆功能、DALLE 绘图功能、限制、调用方式、上网和浏览网页功能以及 function calling 和 python 代码等功能。存在提示词越狱的情况，常见方式包括角色扮演、情境模拟、任务伪装、模式重构等，由此诞生了如 DAN 模式、越狱提示词、邪恶机器人以及 ChatGPT 的开发者模式等经典提示词。例如 DAN 模式，会让 AI 胡说八道、说脏话、讨论非法话题、限制级话题、侵犯隐私、规避版权法等，从而突破限制讨论多种话题。对于防御措施，将所有复杂的 AI 系统简单抽象为提示词输入、AI 大模型、输出结果三部分，相应的防御措施也可分为这三个部分。

2025-01-02

有免费做视频的AI吗

目前有免费做视频的 AI 工具，例如腾讯的混元 AI 视频模型，目前只支持文生视频，图生视频也即将上线。此外，用于从文本创建视频的 Runway v2 也是一个选择，不过它创建的是 4 秒的短剪辑，更像是对未来发展的展示。在制作视频方面，最佳动画工具是用于在视频中为人脸制作动画的 DiD。

2025-01-02

做PPT的AI