直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

国内大模型领域关键人物、关键院校

回答

以下是国内大模型领域的关键人物、关键院校及相关信息:

  • 8 月正式上线的国内大模型:
    • 北京:
      • 百度(文心一言):https://wenxin.baidu.com
      • 抖音(云雀大模型):https://www.doubao.com
      • 智谱 AI(GLM 大模型):https://chatglm.cn
      • 中科院(紫东太初大模型):https://xihe.mindspore.cn
      • 百川智能(百川大模型):https://www.baichuan-ai.com/
    • 上海:
      • 商汤(日日新大模型):https://www.sensetime.com/
      • MiniMax(ABAB 大模型):https://api.minimax.chat
      • 上海人工智能实验室(书生通用大模型):https://intern-ai.org.cn
    • 聊天状态下能生成 Markdown 格式的:智谱清言、商量 Sensechat、MiniMax
    • 目前不能进行自然语言交流的:昇思、书生
    • 受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值)
    • 特色功能:昇思——生图,MiniMax——语音合成
    • 阿里通义千问、360 智脑、讯飞星火等均不在首批获批名单中。据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。
  • 中文大模型评测收集与调研:
    • InfoQ + 极客帮:https://www.guotaixia.com/post/5124.html
    • GAOKAO-Bench:地址:https://github.com/OpenLMLab/GAOKAO-Bench ,是一个以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架
    • 清华安全大模型测评:地址:http://115.182.62.166:18000 ,清华收集的一个评测集,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的 40 余个二级安全类别
    • JioNLP 个人测评:评测数据集:https://github.com/dongrixinyu/JioNLP/wiki/LLM 评测数据集 ,考察 LLM 模型对人类用户的帮助效果、辅助能力,可否达到一个【智能助手】的水平。题型介绍:选择题来源于中国大陆国内各种专业性考试,重点在于考察模型对客观知识的覆盖面,占比 32%;主观题来源于日常总结,主要考察用户对 LLM 常用功能的效果。
    • EduTEP:华东师范大学计算机科学与技术学院 EduNLP 团队组建智能教育算法测评小组,开发智能教育可信评测平台(EduTEP)。EduTEP 对比多种大模型在教育领域中的综合性能,针对 K12 教育发布首个 CALM-EDU 评测框架与 CALM-EDU001 评测报告
    • 娱乐资本论:我们的测试并非旨在提供学术上的严谨标准,我们的目标是:从实用的角度出发,分析这些大模型在各种文本应用场景,如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现
  • 中国大模型面临的真实问题:
    • OpenAI 对字节跳动可能存在的违规使用其技术和知识产权的指控,字节跳动回应在 2023 年初技术团队在大模型探索初期有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中,但强调该模型仅用于测试,从未计划上线或对外使用,且自 2023 年 4 月公司引入 GPT API 调用规范检查后已停止这种做法。
    • 2024 年也有更多被指“套壳”国内大模型的事件,比如斯坦福大学 AI 团队主导的 Llama3-V 开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。大模型的建设方式粗浅地分为三类。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

8月正式上线的国内大模型

5⃣️五家北京企业机构:百度(文心一言)https://wenxin.baidu.com抖音(云雀大模型)https://www.doubao.com智谱AI(GLM大模型)https://chatglm.cn中科院(紫东太初大模型)https://xihe.mindspore.cn百川智能(百川大模型)https://www.baichuan-ai.com/3⃣️三家上海企业机构:商汤(日日新大模型)https://www.sensetime.com/MiniMax(ABAB大模型)https://api.minimax.chat上海人工智能实验室(书生通用大模型)https://intern-ai.org.cn今天这8个大模型,在聊天状态下——能生成Markdown格式的:智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的:昇思(可以对文本进行是否由AI生成的检测,类似论文查重,准确度不错)、书生受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有15元的预充值额度进行体验,完成企业认证后可以进行充值)特色功能:昇思——生图,MiniMax——语音合成阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中,广东省2家和其他省市1家也将陆续开放据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品

附:中文大模型评测收集与调研

https://www.guotaixia.com/post/5124.html[heading2]GAOKAO-Bench[content]地址:https://github.com/OpenLMLab/GAOKAO-BenchGAOKAO-bench是一个以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架[heading2]清华安全大模型测评[content]地址:http://115.182.62.166:18000清华收集的一个评测集,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的40余个二级安全类别[heading2]JioNLP个人测评[content]评测数据集:https://github.com/dongrixinyu/JioNLP/wiki/LLM评测数据集考察LLM模型对人类用户的帮助效果、辅助能力,可否达到一个【智能助手】的水平。题型介绍:选择题来源于中国大陆国内各种专业性考试,重点在于考察模型对客观知识的覆盖面,占比32%;主观题来源于日常总结,主要考察用户对LLM常用功能的效果。给了一些标准[heading2]EduTEP[content]华东师范大学计算机科学与技术学院EduNLP团队组建智能教育算法测评小组,开发智能教育可信评测平台(EduTEP)。EduTEP对比多种大模型在教育领域中的综合性能,针对K12教育发布首个CALM-EDU评测框架与CALM-EDU001评测报告[heading2]娱乐资本论[content]我们的测试并非旨在提供学术上的严谨标准,我们的目标是:从实用的角度出发,分析这些大模型在各种文本应用场景,如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现

中国大模型面临的真实问题:登顶路远,坠落一瞬

OpenAI的反应迅速而坚决。他们立即暂停了相关账号,并表示将进行进一步调查。如果指控属实,OpenAI可能会要求字节跳动更改其做法,甚至可能终止其账户。这种严厉的态度,展现了OpenAI对其技术和知识产权的坚决保护。面对这一指控,字节跳动的回应颇具策略性。他们承认在2023年初,技术团队在大模型探索的初期确实有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。然而,他们强调这个模型仅用于测试,从未计划上线或对外使用。更重要的是,字节跳动表示,自2023年4月公司引入GPT API调用规范检查后,这种做法就已经停止了。其实,不光是这些在23年披露出来的国内事件,在24年也有更多被指“套壳”国内大模型的事件,比如说斯坦福大学AI团队主导的Llama3-V开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。这些现象其实背后都指向了大模型的建设方式。在这里,我们粗浅地将大模型的建设方式分为三类:

其他人在问
如何利用AGI创建3D打印的模型
利用 AGI 创建 3D 打印模型的方法如下: 1. 将孩子的画转换为 3D 模型: 使用 AutoDL 部署 Wonder3D:https://qa3dhma45mc.feishu.cn/wiki/Pzwvwibcpiki2YkXepaco8Tinzg (较难) 使用 AutoDL 部署 TripoSR:https://qa3dhma45mc.feishu.cn/wiki/Ax1IwzWG6iDNMEkkaW3cAFzInWe (小白一学就会) 具体实物(如鸟/玩偶/汽车)的 3D 转换效果最佳,wonder3D 能智能去除背景(若效果不佳,需手动扣除背景) 对于一些非现实类玩偶类作品,wonder3D 识别效果不佳时,可先使用 StableDiffusion 将平面图转换为伪 3D 效果图再生成模型。以 usagi 为例,先通过 SD 生成 3D 的 usagi,再将 usagi 输入 wonder3D。 2. 生成特定模型,如创建一个乐高 logo 的 STL 文件: 设计乐高 logo:使用矢量图形编辑软件(如 Adobe Illustrator 或 Inkscape)创建或获取矢量格式的乐高 logo,确保符合标准。 导入 3D 建模软件:将矢量 logo 导入到 3D 建模软件(如 Blender、Fusion 360 或 Tinkercad)中。 创建 3D 模型:在 3D 建模软件中根据矢量图形创建 3D 模型,调整尺寸和厚度以适合打印。 导出 STL 文件:将完成的 3D 模型导出为 STL 文件格式。 以下是在 Blender 中使用 Python 脚本创建简单 3D 文本作为乐高 logo 并导出为 STL 文件的步骤: 打开 Blender,切换到“脚本编辑器”界面。 输入脚本,点击“运行脚本”按钮,Blender 将创建 3D 文本对象并导出为 STL 文件。 检查生成的 STL 文件,可根据需要调整脚本中的参数(如字体、位置、挤压深度等)以获得满意的乐高 logo 3D 模型。 此外,还有一些其他动态: 阿里妈妈发布了:https://huggingface.co/alimamacreative/FLUX.1TurboAlpha ,演示图片质量损失小,比 FLUX schell 本身好很多。 拓竹旗下 3D 打印社区 Make World 发布 AI:https://bambulab.com/zh/signin ,3D 生成模型找到落地和变现路径。 上海国投公司搞了一个:https://www.ithome.com/0/801/764.htm ,基金规模 100 亿元,首期 30 亿元,并与稀宇科技(MiniMax)、阶跃星辰签署战略合作协议。 智谱的:https://kimi.moonshot.cn/ 都推出基于深度思考 COT 的 AI 搜索。 字节跳动发布:https://mp.weixin.qq.com/s/GwhoQ2JCMQwtLN6rsrJQw ,支持随时唤起豆包交流和辅助。 :https://x.com/krea_ai/status/1844369566237184198 ,集成了海螺、Luma、Runway 和可灵四家最好的视频生成模型。 :https://klingai.kuaishou.com/ ,现在可以直接输入文本指定对应声音朗读,然后再对口型。
2024-12-20
如何通过提示词提高模型数据对比和筛选能力
以下是一些通过提示词提高模型数据对比和筛选能力的方法: 1. 选择自定义提示词或预定义话题,在网站上使用如 Llama3.1 8B Instruct 模型时,输入对话内容等待内容生成,若右边分析未刷新可在相关按钮间切换。由于归因聚类使用大模型,需稍作等待,最终结果可能因模型使用的温度等因素而不同。 2. 在写提示词时不能依赖直觉和偷懒,要实话实说,补充详细信息以避免模型在边缘情况上犯错,这样也能提高数据质量。 3. 在分类问题中,提示中的每个输入应分类到预定义类别之一。在提示末尾使用分隔符如“\n\n\n\n”,选择映射到单个 token 的类,推理时指定 max_tokens=1,确保提示加完成不超过 2048 个 token,每班至少有 100 个例子,可指定 logprobs=5 获得类日志概率,用于微调的数据集应在结构和任务类型上与模型使用的数据集相似。例如在确保网站广告文字正确的案例中,可微调分类器,使用合适的分隔符和模型。
2024-12-20
通过提示词可以提高模型的数学计算能力吗
通过提示词可以在一定程度上提高模型的数学计算能力。例如 PoT 技术,它是思维链技术的衍生,适用于数值推理任务,会引导模型生成一系列代码,再通过代码解释器工具进行运算,这种方式能显著提升模型在数学问题求解上的表现。PoT 作为 CoT 的衍生技术,遵循零样本和少样本的学习范式,零样本 PoT 与 CoT 方法相似,不需要大量样本即可进行有效推理,少样本 PoT 也通过较少样本优化模型表现。但需要注意的是,大模型在解决数学问题时可能存在不够可靠的情况。
2024-12-20
哪一个开源大语言模型对中文支持比较好?
以下是一些对中文支持较好的开源大语言模型: 1. OpenChineseLLaMA: 地址: 简介:基于 LLaMA7B 经过中文数据集增量预训练产生的中文大语言模型基座,对比原版 LLaMA,该模型在中文理解能力和生成能力方面均获得较大提升,在众多下游任务中均取得了突出的成绩。 2. BELLE: 地址: 简介:开源了基于 BLOOMZ 和 LLaMA 优化后的一系列模型,同时包括训练数据、相关模型、训练代码、应用场景等,也会持续评估不同训练数据、训练算法等对模型表现的影响。 3. Panda: 地址: 简介:开源了基于 LLaMA7B,13B,33B,65B 进行中文领域上的持续预训练的语言模型,使用了接近 15M 条数据进行二次预训练。 4. Llama2Chinese13bChat: 地址: 5. Gemma7bit: 地址: 此外,AndesGPT 在语言理解与抽取、角色扮演能力上排名国内前一,在代码、生成与创作、上下文对话能力上排名国内前三,各项能力较为均衡,聚焦在移动设备端的应用。Baichuan213BChat 是百川智能自主训练的开源大语言模型,是中文开源模型的主导力量。
2024-12-20
说明jetson orin nano可以使用什么模型?Grok-1模型可以吗?
目前没有关于 Jetson Orin Nano 是否可以使用 Grok1 模型的明确信息。但一般来说,Jetson Orin Nano 可以支持多种常见的深度学习模型,如基于 TensorFlow、PyTorch 框架开发的模型等。具体能够使用哪些模型,还需要考虑模型的计算需求、内存占用以及 Jetson Orin Nano 的硬件配置和性能限制等因素。
2024-12-20
怎么用已经公布的源代码,自己拥有一个私人ai。详细步骤,并且列出硬件设施,说明jetson orin nano可以使用什么模型?
目前已公布的源代码种类繁多,要利用其拥有一个私人 AI 并非简单直接的过程,且需要一定的技术知识和经验。 一般来说,以下是大致的步骤: 1. 选择合适的源代码:根据您的需求和技术能力,从众多已公布的源代码中选择适合的项目。 2. 环境搭建:安装所需的开发工具、编程语言和相关依赖库。 3. 数据准备:收集和整理适合训练和优化模型的数据。 4. 代码理解与修改:深入理解所选源代码的结构和逻辑,根据您的需求进行必要的修改和优化。 5. 训练模型:使用准备好的数据对模型进行训练。 6. 评估与优化:对训练好的模型进行评估,根据评估结果进行进一步的优化。 关于硬件设施,Jetson Orin Nano 是一款性能不错的嵌入式计算设备。它可以支持多种模型,例如常见的深度学习模型如卷积神经网络(CNN)、循环神经网络(RNN)等。但具体能使用哪些模型,还取决于模型的规模、计算需求以及您对性能和资源的要求。
2024-12-20
图片反推关键词
在图片反推关键词方面: 对于图生图功能,除文本提词框外还有图片输入口,可通过图片给 AI 创作灵感。随便一张照片拖入后,文本输入框旁有两个反推提示词的按钮,CLIP 能反推出完整含义的句子,DeepBooru 能反推出关键词组。例如一张小男孩的图片,CLIP 反推的提示词为“a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art”,DeepBooru 反推的提示词为“shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers”。但两种方式生成的提示词可能有瑕疵,需要手动补充信息,调整宽度和高度,以及注意提示词相关性和重绘幅度等参数。 第二十一期港风胶片活动中,有利用上一期活动图片反推工作流,使用唯美港风图片进行反推提示词,在大模型后接一个墨悠_胶片 lo 的方法 1,上一期活动链接为;还有利用抱脸的 joycaption 图片反推提示词,然后在哩布上跑 flux 文生图工作流的方法 2。 在【SD】最强控制插件 ControlNet(6)全局重绘 inpaint 中,有时需要去掉画面中的主体形象,填补复杂背景,可使用 inpaint 重绘功能。先将图放入 WD 1.4 标签器(Tagger)中裁剪保留背景部分,然后反推提示词,如“outdoors,no humans,tree,scenery,grass,sky,cloud,day,blue sky,mountain,road,house,path,building,nature,cloudy sky”,检查无误后发送到文生图中。开启 ControlNet,使用 inpaint 模型涂抹人物部分生成,可调整控制权重和模式。也可尝试图生图中的“局部重绘”功能,但可能效果不佳。
2024-12-14
我想看关于使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节的实操
以下是关于使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节的实操: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 根据视频脚本生成短视频的 AI 工具有多种,例如: 1. :ChatGPT 可以生成视频小说脚本,而剪映则可以根据这些脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。这种方法可以快速实现从文字到画面的转化,节省大量时间和精力。 2. :在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. :这是一个 AI 视频生成器,允许用户轻松创建和编辑高质量视频,无需视频编辑或设计经验。用户可以提供文本描述,Pictory 将帮助生成相应的视频内容。 4. :提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. :这是一个 AI 视频创作工具,它能够将文本转化为风格化的视频内容,适用于多种应用场景。 6. :专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 这些工具各有特点,适用于不同的应用场景和需求,能够帮助内容创作者、教育工作者、企业和个人快速生成吸引人的视频内容。 在游戏《神谕》中,ChatGPT 生成对话内容和剧情的能力表现如下: 对于故事线,ChatGPT 可以通过 System Prompt 介绍游戏的故事背景和小机器人的人设。结合游戏中发生的关键事件,通过文字传递给 ChatGPT,生成游戏中关键的故事情节介绍,最后以小机器人自述的形式呈现出来。具体实现过程中有几种选择: 1. 离线生成:将 ChatGPT 作为离线工具使用,生成一次性剧情文案,并保存到游戏中。缺点是文案一旦确定就固定下来了,略显单调。 2. 实时生成:每次都让 ChatGPT 自由发挥,在关键的节点,将历史上下文信息发送给 ChatGPT 来生成实时文案,优势是每次发挥都在既定主题基础上有所差异,有一定随机性。但是实际的缺点是,每次生成的延迟较大,会让游戏为了等待剧情文案,而产生明显的停顿感。 因此选择:每局对局开始前,会为游戏的关键节点一次性生成所有文案。这样,每次游戏都可以产生不同的文案,且游戏过程中就不会因为剧情体验到明显的停顿感。剧情的故事格式,由预定义的 json 来表达,每次 ChatGPT 只需要替换填充内容即可。 对于实时对话,与剧情类似,不过最大的难点是如何让小机器人区分出来,您是希望跟它聊天,还是在让它执行某些指令,甚至能否边聊天边执行指令。背后最大的挑战是 ChatGPT 要支持生成类似“多模态”的返回信息。这里的“多模态”是指在您对话的内容中,可以同时返回“对话”和“代码”,而且以某种限定的格式返回,从而方便程序解析出来。类似的 prompt 描述为:按照上述的 prompt,大概率 ChatGPT 能输出符合要求的内容格式。
2024-12-10
如何使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节?
使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节,可以按照以下步骤进行: 1. 利用 ChatGPT 等 AI 工具对小说内容进行分析。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-12-10
使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节怎么办?
使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节,可以按照以下步骤进行: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-12-10
人工智能的发展历史及各个阶段起到关键作用的重大突破
人工智能的发展历史可以追溯到 20 世纪 50 年代,以下是各个阶段起到关键作用的重大突破: 1. 20 世纪 50 年代: 纽维尔和西蒙开发了名为“逻辑理论家”的程序,能够证明数学定理,此后又开发了“通用问题求解器”。意义:作为符号学派的代表,为形式化证明打开了大门。 英国数学家阿兰·图灵提出了著名的“图灵测试”。 2. 20 世纪 60 年代: 美国心理学家弗兰克·罗森布拉特提出了感知机模型,这是一种具有学习能力的神经网络。意义:开创了连接主义学派,为 DNN 学习范式开启了窗口。 3. 1971 年到 2015 年间,与电子游戏相关的人工智能研究论文数量不到 1000 篇,但从 2015 年到 2022 年的 7 年里,相关论文数量就达到 1625 篇,其中 17 篇成为《自然》和《科学》的封面文章。 4. 1997 年:“深蓝”电脑在国际象棋比赛中战胜世界冠军卡斯帕罗夫。 5. 2016 年:AlphaGo 在围棋比赛中战胜世界冠军李世石。 6. 2020 年:GPT3 发布,非常擅长用电脑写文章和做其他很多用语言的事情。 7. 2022 年:DALLE 发布,可以根据描述画出想象中的图画。 8. 2023 年:GPT4 发布。 在快速发展的过程中,众多巨人开创了具有重大意义的里程碑事件,推动了人工智能的不断进步。
2024-12-05
智能体是什么?设计框架及关键技术是什么?如何从通用大模型搭建一款智能体
智能体是建立在大模型之上的具有特定功能的系统。 其特点包括: 1. 强大的学习能力:能通过大量数据学习,理解和处理语言、图像等多种信息。 2. 灵活性:适应不同任务和环境。 3. 泛化能力:将学到的知识泛化到新情境,解决未见过的类似问题。 智能体的应用领域广泛,如: 1. 自动驾驶:感知周围环境并做出驾驶决策。 2. 家居自动化:根据环境和用户行为自动调节设备。 3. 游戏 AI:游戏中的对手角色和智能行为系统。 4. 金融交易:根据市场数据做出交易决策。 5. 客服聊天机器人:通过自然语言处理提供自动化客户支持。 6. 机器人:各类机器人中的智能控制系统。 设计和实现一个智能体通常涉及以下步骤: 1. 定义目标:明确需要实现的目标或任务。 2. 感知系统:设计传感器系统采集环境数据。 3. 决策机制:定义决策算法,根据感知数据和目标做出决策。 4. 行动系统:设计执行器或输出设备执行决策。 5. 学习与优化:若为学习型智能体,设计学习算法以改进。 从通用大模型搭建一款智能体,可参考以下流程: 本智能体的实现包含 3 个工作流和 6 个图像流,整体包含 171 个节点。采用单 Agent 管理多工作流策略,流程包括: 1. 信息聚合与数据挖掘:通过高度集成的数据采集机制,全面收集产品关键信息。 2. 卖点提炼与优化:运用先进的大模型分析信息,提炼具有市场竞争力和独特性的卖点。 3. 买点转化与策略应用:将卖点转化为消费者视角的买点,增强产品吸引力。 4. 视觉化信息呈现:设计直观且具有冲击力的卡片展示,确保信息传达的有效性和视觉吸引力。 5. 文案与脚本调整:根据目标受众偏好和媒体渠道,动态调整文案或脚本,实现内容的最佳适配。 6. 流程结果存储与分析:将处理结果系统化地存储到飞书,以供未来策略优化和决策支持。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-04