Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我想看到一些AI agent的开放源,怎么才能看到

Answer

以下是一些 AI Agent 的开源项目及相关信息:

此外,还有以下开源项目:

Content generated by AI large model, please carefully verify (powered by aily)

References

大圣:胎教级教程:万字长文带你使用Coze打造企业级知识库

LLM可以成为AI Agent的“大脑”主要是因为它具备了以下的关键能力1.复杂语言理解:LLM经过大规模数据训练,具备理解和处理自然语言的能力,包括语法、句法以及言外之意。2.丰富的世界知识:训练数据覆盖广泛的知识域,模型可以连结不同的信息片段,进行知识推理和应用。3.上下文感知:能够根据上下文信息做出响应,连贯地处理对话或相关任务,这在处理持续的交互中非常重要。4.生成能力:不仅能够理解信息,还能够创建回答、文章甚至代码,这在任务自动化中尤为重要。5.适应不同场景:通用性和可定制性使得LLM能够适应各种不同的应用场景和需求,类似于大脑如何通过学习适应新环境。6.持续学习能力:一些LLM可通过进一步训练根据反馈学习和提升,类似于大脑通过经验学习。[heading2]1.5 AI Agent的开源项目[content][AutoGPT](https://github.com/Significant-Gravitas/AutoGPT)[BabyAGI](https://github.com/yoheinakajima/babyagi)[MetaGPT](https://github.com/geekan/MetaGPT)[GPT Researcher](https://github.com/assafelovic/gpt-researcher)[AI-16Z的AI-town](https://github.com/a16z-infra/ai-town)[斯坦福的AI-Town](https://github.com/joonspk-research/generative_agents)[ChatDev](https://github.com/OpenBMB/ChatDev)

12月26日 AI资讯汇总

DeepSeek-V3-Base宣布开源。685B参数,256个专家动态路由,效率与性能兼备在aider多语言编程测评超过Claude 3.5 Sonnet-20241022和Gemini Exp-1206。🌟地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main[heading3]智谱开源新的GUI Agent:CogAgent-9B-20241220[content]CogAgent仅依赖于屏幕截图作为输入(无需HTML等文本表征),可以根据用户指定的任意任务,结合过往的操作历史,预测下一步的GUI操作。在GUI感知、推理预测准确性、动作空间完善性、任务的普适和泛化性上得到了大幅提升,能够接受中英文双语的屏幕截图和语言交互。1.模型基座和结构升级:使用更强大的视觉语言模型GLM-4V-9B作为基座模型,大幅提升模型的基座图像理解性能。2.视觉处理模块优化:实现了更高效统一的视觉处理模块,支持1120*1120原生高分辨率图像输入。3.数据集丰富与完善4.预训练策略优化,后训练策略改进,模型推理及思维链优化此版CogAgent模型已被应用于智谱AI的GLM-PC产品🌟地址:https://cogagent.aminer.cn/blog#/articles/cogagent-9b-20241220-technical-report申请内测:[https://cogagent.aminer.cn/home](https://cogagent.aminer.cn/home)如有任何问题请联系后台~电子邮箱:alolg@163.com

GPTs 、中间层、Chatbot虚拟社交、AI Agent, 大模型应用最新方向解析

准确的来说,AI Agent指的是一种智能代理系统,它接近人类的大脑,可形成记忆、达成行动规划、自动交互、主动预测。目前AI Agent的概念在市场上并没有达成共识,存在被广泛滥用的现象。(很多Chatbot应用给Bot冠以“智能体”的名称,准确的说是对Agent的误用)[heading3]AI Agent应用的特点:[content]个性化:随着用户的使用越来越了解用户习惯和想法,从而作出喜好预测Dot App在对话中了解用户喜好,随后为用户推荐新的咖啡店自主完成任务:Auto GPT:用户输入一个目标后,可自主执行任务、递归地开发和调试代码多Agent协作斯坦福大学的SmallVille(小镇)项目,现已开源25个人工智能体居住在一个沙盒虚拟城镇中通过复杂的社交互动来执行他们的日常生活Fixie AI在收到用户请求后启动多个负责不同模块的Agent进行数据查询和传递,最终生成邮件内容给客户回复博主林亦LYi的《AI炒股?我开了一家员工全是AI的公司,自动帮我炒股》就在某种程度上实现了多Agent协作的能力:目前,AI Agent应用大多集中在2B场景,面向个人消费者的产品少之又少。一方面是高度智能化的Agent能力需要打磨,概念落地还有较长一段距离;一方面是AI和娱乐消费诉求的结合还几乎没有,其主要带来的是生产方式变革和效率变革。个人消费者方向,目前只看到“私人助理”场景。

Others are asking
ai现在发展到什么阶段了
目前 AI 发展大致可以分为以下几个阶段: 1. 小模型阶段:能力单一,无法泛化和理解,例如早期的人脸识别,只能完成特定任务。 2. GPT 出现阶段:AGI 迎来拐点,机器实现与人类的交流。 3. Sora 出现阶段:打开了 AGI 的大门,能够认知世界并与世界互动,但训练算力可能受到限制。 4. 强人工智能阶段:机器能看懂一些常识并交流,但还缺少对世界力量的感知,如加速度、重力等,目前热炒的具身智能正处于此阶段。 5. 超级人工智能阶段:机器能够总结出世界的规律,达到如爱因斯坦、牛顿般的水平。 此外,OpenAI 内部会议上分享的 AGI 五个发展等级分别为: 1. 聊天机器人:具备基本对话能力,依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者:具备人类推理水平,能解决复杂问题,如 ChatGPT,可根据上下文和文件提供详细分析和意见。 3. 智能体:不仅具备推理能力,还能执行全自动化业务,但目前许多产品执行任务后仍需人类参与。 4. 创新者:能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可加速科学研究和新药发现。 5. 组织:最高级别,能够自动执行组织的全部业务流程,包括规划、执行、反馈、迭代、资源分配和管理等。
2025-01-12
我说我现在对ai不大很明白,你想系统的学习一下ai应用,我印在从哪里开始学
如果您想系统学习 AI 应用,可以从以下几个方面入手: 一、基础概念和知识 1. 了解 AI 背景知识,包括人工智能、机器学习、深度学习的定义及其之间的关系。 2. 回顾 AI 的发展历程和重要里程碑。 二、数学基础 1. 掌握统计学基础,熟悉均值、中位数、方差等统计概念。 2. 了解线性代数基本概念,如向量、矩阵。 3. 学习基础的概率论知识,如条件概率、贝叶斯定理。 三、算法和模型 1. 学习监督学习,了解常用算法,如线性回归、决策树、支持向量机(SVM)。 2. 熟悉无监督学习,如聚类、降维等算法。 3. 了解强化学习的基本概念。 四、评估和调优 1. 学会如何评估模型性能,包括交叉验证、精确度、召回率等。 2. 掌握模型调优的方法,如使用网格搜索等技术优化模型参数。 五、神经网络基础 1. 理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 2. 熟悉常用的激活函数,如 ReLU、Sigmoid、Tanh。 六、学习途径和实践 1. 阅读「」部分,熟悉 AI 的术语和基础概念。 2. 在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程。还可以通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习。 3. 选择感兴趣的模块深入学习,比如图像、音乐、视频等。掌握提示词的技巧,上手容易且很有用。 4. 理论学习之后,通过实践巩固知识,尝试使用各种产品做出作品。在知识库查看大家实践后的作品、文章分享,并分享自己实践后的成果。 5. 体验 AI 产品,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式。 七、中学生学习 AI 的特别建议 1. 从编程语言入手,如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识。 2. 尝试使用 ChatGPT、Midjourney 等 AI 生成工具,探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识,了解其基本概念、发展历程、主要技术及在各领域的应用案例。 4. 参与学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题。 5. 关注 AI 领域的权威媒体和学者,了解最新进展,思考其对未来社会的影响。 总之,系统学习 AI 应用需要逐步积累知识、多实践,并根据自己的兴趣和需求选择合适的学习方向和方法。
2025-01-12
我想把ip角色变成动画,可以用哪个ai软件
以下是一些可以将 IP 角色变成动画的 AI 软件及相关信息: Pika、Pixverse、Runway、SVD 这四大 AI 视频工具可以用于制作 AI 短片。在使用时,需要注意写好 prompt 来描述角色形象,比如景别、特征、位置关系、环境、影片风格和比例等。 Midjourney 可以用于生成 IP 角色的动画效果。例如,生成一个帅气的男孩,描述其穿着、鞋子、视图等细节,还可以为女孩生成特定的形象,如来自未来赛博朋克的可爱女孩,穿着银色雨衣等。同时,要注意设置合适的关键词,如干净的背景、电影照明、超细节、3D 渲染等,以获得理想的效果。
2025-01-12
如何构建自己的AI职业
以下是关于构建自己的 AI 职业的一些建议: 1. 掌握 Prompt 工程:了解 Claude 的 5 层 Prompt 体系,将其应用到日常工作中,如市场研究、写作、数据分析等项目,以提升驾驭 AI 的能力。 2. 借助元学习:鉴于人工智能依赖的神经网络基础,通过元学习让 AI 更快地获得知识,与人类共同进步。 3. 实践打造微信 AI 机器人: 确定功能范围,如支持用户发送“关键字”获取“AI 相关资料链接”,回答 AI 相关知识,作为微信客服助手发布在微信公众号上。 准备实现所需的内容,包括编写 prompt 提示词,整理“关键字”与“AI 相关资料链接”的对应关系,创建知识库、工作流,准备微信公众号。
2025-01-12
小白如何学AI?
对于小白学习 AI,以下是一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据自身兴趣选择特定模块深入学习。 掌握提示词的技巧,因其上手容易且实用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 知识库中有很多实践后的作品和文章分享,欢迎实践后进行分享。 5. 体验 AI 产品: 与现有的 AI 产品(如 ChatGPT、Kimi Chat、智谱、文心一言等)进行互动,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 6. 持续学习和跟进: AI 发展迅速,新成果和技术不断涌现,关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。 考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 此外,还可以参考《雪梅 May 的 AI 学习日记》,其适合纯 AI 小白。学习模式为输入→模仿→自发创造,学习内容可在 waytoAGI 社区发现自己感兴趣的 AI 领域并学习最新内容。学习时间灵活,资源免费开源。
2025-01-12
我是AI小白如何接触AI领域
对于 AI 小白接触 AI 领域,您可以参考以下步骤: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您能找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,还有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后进行分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 6. 持续学习和跟进: AI 是一个快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。 考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 此外,您还可以参考《雪梅 May 的 AI 学习日记》,这适合纯 AI 小白。其学习模式是输入→模仿→自发创造。学习内容可根据您的兴趣在 waytoAGI 社区寻找最新的内容。学习时间较为灵活,日记中的学习资源免费开源。如果您学习状态未达最佳,不必有压力,能学多少算多少。
2025-01-12
我想看到国内在coze平台上的一些AI agent的开放源,怎么才能看到
以下是一些国内的 Agent 构建平台及 Coze 平台的相关信息: Agent 构建平台: Coze:是新一代一站式 AI Bot 开发平台,集成丰富插件工具,涵盖从基础文本处理到高级机器学习功能,还有众多符合平民生活化的插件,如新闻资讯、天气预报、出行必备、生活便利等方面的插件。 Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景方面表现出色。 要查看 Coze 平台上的 AI agent 开源内容,您可以通过以下途径尝试:在相关的技术社区、开源代码托管平台(如 GitHub 等)上进行搜索,或者关注 Coze 平台的官方网站及开发者论坛获取相关信息。但需注意,开源内容的获取可能受到平台规定和开发者授权的限制。
2025-01-12
我想看到在coze平台上的一些AI agent的开放源,怎么才能看到
在 Coze 平台上,以下是一些 AI Agent 的开源项目: 此外,以下是一些常见的 Agent 构建平台: Coze:新一代的一站式 AI Bot 开发平台,集成丰富插件工具,适用于构建各类问答 Bot。 Mircosoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等场景。 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色。
2025-01-12
如果开发agent
开发 Agent 可以从以下几个方面考虑: 1. 技术基础与经验: 对于 ComfyUI 新人来说,之前更多使用 Coze 做 Agent,涉及绘图功能会调用 Coze 的图像流。但图像流较弱时,会在 Glif 上做 Bot 并以插件调用 API 完成绘图功能。Glif 提供的云端 ComfyUI 带来更多图像玩法。 Coze 的工作流和 ComfyUI 的图像流代表了 Agent 内部两个子领域的领先水平,但大多数同学专注一个领域精进,好处是能做出落地的 Agent,短期短板是依赖平台或社区弥补。 例如,熟悉 Coze 的同学开发助理类 Bot 便捷,但出图自由度不高;熟悉 ComfyUI 的同学能完成高水平图像、视频流,但流程中 Agent 含量不高。 只要从擅长的阵地向另一块多迈出一步,就能更好把控 Agent 中各种节点的设计和运用。 2. 赚钱与应用方向: 赚钱方式多样,如 Key 商、写书、卖课、接项目、做镜像站等。 从做产品角度,选择的方向是 Agent。如 WebPilot 作者开发长文写作的 Agent 并对外提供接口。 熟悉业务结合 AI 能力打磨产品是护城河,是 AI 应用开发者应坚持的方向。 3. 市场机遇: AI Agent 开发正迎来重要市场机遇期,我们正经历人机交互范式的重大转变。 从精准交互到理解模糊意图,从信息孤岛到整合多源信息,从单一功能到全流程服务,每个领域都在寻找适合的 Agent 解决方案,带来前所未有的开发需求。 百宝箱的基因优势突出,依托支付宝庞大的线上线下商家网络和生活服务小程序生态,为开发者打开通向本地生活服务的大门。 本地生活服务是体现 Agent 价值的领域,复杂场景正是 Agent 擅长应对的。 技术浪潮不停,发现贴近生活、困扰用户的痛点是应用机遇,“让复杂的事情变简单”是开发者的使命。
2025-01-11
怎么在 coze搭建 agent
在 Coze 搭建 Agent 的步骤如下: 1. 梳理手捏 AI Agent 的思路: 在上篇文章中提到过 Prompt 工程的必备能力,即通过逻辑思考,从知识经验中抽象表达出关键方法与要求,这一理念同样适用于在 Coze 中创建 AI Agent。 搭建工作流驱动的 Agent 简单情况可分为 3 个步骤:规划、实施、完善。 2. 实施步骤中的搭建工作流框架,设定每个节点的逻辑关系: 首先进入 Coze,点击「个人空间 工作流 创建工作流」,打开创建工作流的弹窗。 根据弹窗要求,自定义工作流信息。 点击确认后完成工作流的新建,可以看到整个编辑视图与功能。 其中,左侧「选择节点」模块中,根据子任务需要,实际用上的有:插件(提供一系列能力工具,拓展 Agent 的能力边界)、大模型(调用 LLM,实现各项文本内容的生成)、代码(支持编写简单的 Python、JS 脚本,对数据进行处理)。 编辑面板中的开始节点、结束节点,则分别对应分解子任务流程图中的原文输入和结果输出环节。 接下来,按照流程图,在编辑面板中拖入对应的 LLM 大模型、插件、代码节点,即可完成工作流框架的搭建。
2025-01-11
我想自己在 coze 或者类似平台做一个 agent 帮助我们公司的销售提升话术技巧以及 Q&A,我需要在哪里学习怎么搭建
以下是一些关于在 Coze 或类似平台搭建 Agent 以帮助公司销售提升话术技巧及 Q&A 的学习资源和相关信息: 常见的 Agent 构建平台: Coze:新一代一站式 AI Bot 开发平台,集成丰富插件工具,适用于构建各类问答 Bot。 Mircosoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及部署到各种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者打造产品能力。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 钉钉 AI 超级助理:依托钉钉优势,在处理高频工作场景如销售等方面表现出色。 Coze 相关的后续活动筹划:包括 COW 机器人搭建、Coze 搭 Agent 共学等。 Coze 平台的消息卡片系统: 通过高度模块化和图形化操作,支持官方模板、AI 自动生成或手动构建。 相关专业词汇解释:如 Bot 是自动化程序;消息卡片是展示信息的方式;AI 生成卡片是利用人工智能技术自动创建的卡片等。 您可以根据自身需求选择适合的平台进行进一步探索和应用。
2025-01-11
如何制作这样的一个AI agent?我可以将所有的文档放在本地或者云盘。
AI Agent 是基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。 AI Agent 包括以下几个概念: 1. Chain:通常一个 AI Agent 可能由多个 Chain 组成。一个 Chain 视作是一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的 Chain 是大语言模型完成的 LLM Chain。 2. Router:我们可以使用一些判定(甚至可以用 LLM 来判定),然后让 Agent 走向不同的 Chain。例如:如果这是一个图片,则 a;否则 b。 3. Tool:Agent 上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。 总结下来,我们需要三个 Agent: 1. Responser Agent:主 agent,用于回复用户(伪多模态)。 2. Background Agent:背景 agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)。 3. Daily Agent:每日 agent,用于生成剧本,配套的图片,以及每日朋友圈。 这三个 Agent 每隔一段时间运行一次(默认 3 分钟),运行时会分析期间的历史对话,变更人物关系(亲密度,了解度等),变更反感度,如果超标则拉黑用户,抽简对话内容,提取人物和用户的信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。 在了解 AI Agent 之前,我们先考虑一个场景:我们要写一本 20 万字的关于人工智能最新技术的书。在没有大模型之前,写书一般会按照如下流程: 1. 先使用搜索引擎搜索一些相关书籍和信息进行阅读,为我们打开思路。 2. 形成本书的大纲,并且考虑清楚每一章节要编写的内容。 3. 针对每一个章节进行内容的编写,在编写过程中可能会调整文章的大纲。 4. 在编写后面章节的时候可能会忘记前面写的内容,需要去翻阅前面已经写的内容。 5. 文章初步完成之后,可能会找相关专业人士帮忙修改。 6. 经过几番调整之后,书籍最终成型。 在大模型出现之后,可能会直接请大模型帮忙生成,但会发现写出来的书根本无法阅读,这不仅仅是因为大模型的能力不行,还因为相比于第一种写书的方式,第二种方式明显缺少了几个环节: 1. 没有办法使用 Google 获取最新的外部信息(大模型的训练数据是有日期限制的)。 2. 没有对整个事情进行规划(比如先写大纲,再编写每个章节,然后和别人讨论,最后成文)。 3. 大模型没有记忆的能力,由于上下文(脑容量)的限制,无法一次性完成 20 万字的文章,会造成前言不搭后语的现象。 而 AI Agent 就是为了解决这个问题。AI Agent 是应用了大模型(LLM)能力的 Agent。以 GPT 为代表的大模型的出现,将 Agent 的能力提高到了前所未有的高度。OpenAI 的 Lilian Weng 将以 LLM 为驱动的 AI Agent,形式化为如下的公式:
2025-01-10
如果我给你一张人像图片,想看到10年以后的样子,应该用什么样的ai
如果您想看到一张人像图片中人物 10 年后的样子,可以尝试以下两种方法: 1. 利用 Stable Diffusion(SD)相关技术: 在新上线的 controlnet 模型中,Recolor 新模型可将黑白图片重新上色。对于人物照片还原,可选择 realisian 的写实大模型,提示词直接描述颜色和对应的内容。ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果可能更好。但可能存在颜色不精准出现在想要位置、提示词相互污染、背景不统一等问题,此时可启用 cutoff 插件进行控制,具体可参考相关文章。 若照片像素较低,还可将其变得更高清。 2. 利用 GPT 识图功能: 对图片的内容进行细致描述,可借用 GPT 来进行,也可自行描述。例如,对人物的年龄、发型、肤色、五官、穿着、姿态、背景等进行详细描述。
2024-12-30
我在哪里能看到吴恩达的大模型通识课?
以下是一些可以看到吴恩达大模型通识课的途径: 1. 中文版的大模型入门教程,围绕吴恩达老师的大模型系列课程展开,地址: 2. 目录:吴恩达讲 Prompt,地址:https://github.com/zard1152/deepLearningAI/wiki ; 3. 2023 年 8 月 24 日,吴恩达最新的《》短课程上线。
2024-12-30
听说你这里有ai小白学习ai知识从0到1的文档,哪里可以查看到
新手学习 AI 可以按照以下步骤进行: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出自己的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 如果您是零基础小白,还可以: 1. 网上找基础课程进行学习。 2. 观看科普类教程。 3. 阅读 OpenAI 的文档,理解每个参数的作用和设计原理。 4. 推荐使用一些练手的 Prompt 工具和相关教程文档。
2024-12-26
我需要一个工具 让我能够把看到的资料汇总到里面,慢慢的他就成为了我的一个智能助理,但凡我阅读过的东西,只要我能想到一点点相关内容,都能通过这个工具在里面找到汇总答案,同时还能链接到原来的文章或知识点,有这样的AI工具么
以下是为您整理的相关信息: 目前有一些工具和方法可以满足您的需求。例如: 1. 在“让机器理解世界/GPT 时代人类再腾飞·译者序”中提到,人类要学会深刻理解 AI 系统的工作方式与它的边界,AI 可以作为伙伴帮助我们充分发挥潜力。 2. 7 月 16 日 Jimmy Wong &吕立青的相关内容中,提到可以通过输入端输入不同模态的内容,包括音频、文本、视频等并消化,在输出端借助自己的知识或让 AI 助理基于收藏或保存的知识点来完成某些事情,如写文章、输出代码等。 3. 在“VIRTUAL”中,提到可以用 AI 搜索引擎如 felo.ai/search 搜索并归纳内容,用 AI 可视化工具 napkin.ai 转成图示。还提到可以像编程一样预先写好咒语(prompts),将日常工作中固定输入输出的部分写成“智能体”并不断迭代优化。很多 AI 网站都可以创建“智能体”,您可以手搓各种机器人为您工作,如出试题、找资料、画插图、专业翻译等,还能设置“常用语”“小助手”“bot”,如 Kimi.ai 。 综合来看,目前有多种方式和工具可以帮助您实现将资料汇总并成为智能助理的需求。
2024-12-14
关于图转视频的开放的api
以下是一些关于图转视频的开放 API 信息: 出门问问 Mobvoi 的照片数字人工作流及语音合成(TTS)API: API 官网:https://openapi.mobvoi.com/ 语音合成(TTS)API 地址:https://openapi.mobvoi.com/pages/soundlibrary 语音合成(TTS)操作文档:https://openapi.mobvoi.com/document?name=%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90%EF%BC%88TTS%EF%BC%89 使用 GPT 的视觉功能和 TTS API 处理和讲述视频: 原文作者:Kai Chen 发表于 Nov 6, 2023 Open in Github 在 Github 中打开:https://github.com/openai/openaicookbook/blob/main/examples/GPT_with_vision_for_video_understanding.ipynb 原文链接:https://cookbook.openai.com/examples/gpt_with_vision_for_video_understanding 示例包括: 使用 GPT4 获取视频的描述 使用 GPT4 和 TTS API 为视频生成画外音 详细示例链接:https://cookbook.openai.com/examples/gpt_with_vision_for_video_understanding1usinggptsvisualcapabilitiestogetadescriptionofavideo
2024-10-20
RAG应用的案例,结合本地知识库和开放搜索
以下是一些 RAG 应用的案例: 1. 用户向 ChatGPT 查询最近引起广泛关注的事件,如 OpenAI 首席执行官的突然解雇和复职,由于 ChatGPT 预训练数据的限制缺乏对最新事件的了解。RAG 通过从外部知识库中检索最新的文档摘录来解决这一问题,获取相关新闻文章并与最初的问题合并成丰富的提示,使 ChatGPT 能够合成知情的回答,展示了其通过实时信息检索增强模型响应能力的过程。 2. 在本地知识库的搭建中,利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用。RAG 应用可抽象为 5 个过程:文档加载,从多种来源加载文档;文本分割,把文档切分为指定大小的块;存储,包括将切分好的文档块嵌入转换成向量形式并存储到向量数据库;检索,通过检索算法找到与输入问题相似的嵌入片;输出,把问题及检索出来的嵌入片一起提交给 LLM,让其生成更合理的答案。 3. 在了解 RAG 全貌时,其流程分为离线数据处理和在线检索两个过程。离线数据处理目的是构建知识库这本“活字典”,在线检索则是利用知识库和大模型进行查询的过程。以构建智能问答客服这一最经典的应用场景为例,可深入了解 RAG 所有流程中的“What”与“Why”。
2024-10-20
开放式提示词,封闭式提示词,引导式提示词的联系与区别,请画表格描述
|提示词类型|联系|区别| |||| |开放式提示词|都是提示词的不同形式,旨在引导模型生成相应的输出|没有明确的限制和指向,给予模型较大的创作空间| |封闭式提示词| |具有明确的限制和具体的指向,模型的输出范围较窄| |引导式提示词| |在一定程度上引导模型的输出方向,但又不像封闭式那么严格|
2024-09-07
什么是开放式提示词
开放式提示词通常指具有开放和自由特质的表述。例如在音乐风格中,“Open”指的是开放和自由的音乐风格,通常具有宽广和无拘无束的特质,典型用于表现开放和自由情感的音乐作品,如 John Lennon's《Imagine》,关联流派有 Rock、Pop、Classic Rock 等。在教学场景中,好老师会擅长用简单而充满哲理的语言给学生带来开放性的想象。在哲学沉思中,任务是讨论给定主题的一个哲学概念或思想实验,通过简要解释该概念,呈现主要论点和含义,并提出开放式问题来鼓励批判性思维。
2024-09-07