Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

生成式AI相关知识

Answer

生成式 AI 相关知识如下:

  • GenAI 是生成式 AI 的一种,全称 Generative AI,是基于深度学习技术和机器学习算法,从已有数据中学习并生成新数据或内容的 AI 应用。其通过大规模数据集训练深度神经网络模型,能为游戏、娱乐和产品设计等提供解决方案,典型的 GenAI 包括 OpenAI 推出的 ChatGPT、GPT-4、DALL-E 以及百度的文心一言、阿里云的通义千问等。但在数据处理中存在未经授权收集信息、提供虚假信息、侵害个人隐私等潜在合规风险。
  • AIGC 指利用 GenAI 创建的内容,包括图像、视频、音频、文本和三维模型等。其工具使用机器学习算法,通常基于自然语言处理,分析大型文本数据集并学习生成新内容。国内主要在《网络安全法》《数据安全法》《个人信息保护法》框架下,由《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《科技伦理审查办法(试行)》共同监管。
  • AIGC 主要分为语言文本生成、图像生成和音视频生成,分别利用不同的模型和技术,应用于多个领域,但也可能引发内生风险、数据隐私问题和知识产权风险,相关法律和规定对其有一定要求,但部分问题仍需更多法律明确,且需加强监管和伦理约束。

此外,台湾大学李宏毅教授的生成式 AI 课程介绍了其基本概念、发展历程、技术架构和应用场景等内容,共 12 讲,每讲约 2 小时。通过学习该课程,可掌握生成式 AI 的基本概念和常见技术,能够使用相关框架搭建简单的生成式模型,了解其发展现状和未来趋势。课程包括生成式 AI 的定义和分类、生成式模型、生成式对话、预训练语言模型、生成式 AI 的挑战与展望等内容,并提供了教材、参考书籍、在线课程、开源项目等学习资源和学习方法。

Content generated by AI large model, please carefully verify (powered by aily)

References

2024AIGC法律风险研究报告(更新版).pdf

在引入AIGC的概念之前,本报告将先解释另一相关的热门词条“GenAI”,全称Generative AI,即生成式AI。GenAI是一种基于深度学习技术(deep learning algorithm),利用机器学习(machine learning)算法从已有数据中学习并生成新的数据或内容的AI应用。其工作原理是通过大规模的数据集训练深度神经网络模型,学习各种数据的规律和特征,实现对输入数据的分析、理解和生成。GenAI为游戏、娱乐和产品设计等应用提供了新颖且有创意的解决方案,如自动写作、虚拟现实、音乐创作等,甚至协助科学研究开辟了新的可能性。目前典型的GenAI包括OpenAI推出的语言模型ChatGPT、GPT-4、图像模型DALL-E以及百度推出的文心一言、阿里云推出的通义千问等。虽然生成式AI是一种非常强大的技术,能够应用于诸多专业领域;但其在数据处理过程中存在多重潜在合规风险,如未经授权收集信息、提供虚假信息、侵害个人隐私等。AIGC(全称AI-Generated Content)指利用GenAI创建的内容,如图像、视频、音频、文本和三维模型。具体来讲,AIGC工具使用机器学习算法,通常以自然语言处理为基础,分析大型文本数据集,并学习如何生成风格和语气相似的新内容。国内目前主要是在《网络安全法》《数据安全法》以及《个人信息保护法》的框架下,由《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》共同监管AIGC行业。

学习笔记:《生成式AI导论2024》 李宏毅

一、课程介绍这是台湾大学李宏毅教授的生成式AI课程,主要介绍了生成式AI的基本概念、发展历程、技术架构和应用场景等内容。课程共分为12讲,每讲约2小时。二、学习目标通过学习本课程,掌握生成式AI的基本概念和常见技术,能够使用相关框架搭建简单的生成式模型,了解生成式AI的发展现状和未来趋势。三、学习内容1.什么是生成式AI生成式AI的定义和分类生成式AI与判别式AI的区别生成式AI的应用领域2.生成式模型生成式模型的基本结构和训练方法生成式模型的评估指标常见的生成式模型及其优缺点3.生成式对话生成式对话的基本概念和应用场景生成式对话系统的架构和关键技术基于生成式模型的对话生成方法4.预训练语言模型预训练语言模型的发展历程和关键技术预训练语言模型的优缺点预训练语言模型在生成式AI中的应用5.生成式AI的挑战与展望生成式AI面临的挑战和解决方法生成式AI的未来发展趋势和研究方向四、学习资源1.教材:《生成式AI导论2024》,李宏毅2.参考书籍:《深度学习》,伊恩·古德费洛等3.在线课程:李宏毅的生成式AI课程4.开源项目:OpenAI GPT-3、字节跳动的云雀等五、学习方法

2024AIGC法律风险研究报告(更新版).pdf

GenAI(即生成式AI)是一种能够从已有数据中学习并生成新的数据或内容的AI应用,利用GenAI创建的内容即AIGC(全称AI-Generated Content)。作为一种强大的技术,生成式AI能够赋能诸多领域,但也存在多重潜在的合规风险。目前,我国对AIGC的监管框架由《网络安全法》《数据安全法》及《个人信息保护法》构成,并与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》等形成了共同监管的形势。AIGC主要分为语言文本生成、图像生成和音视频生成。语言文本生成利用马尔科夫链、RNN、LSTMs和Transformer等模型生成文本,如GPT-4和Gemini Ultra。图像生成依赖于GANs、VAEs和Stable Diffusion等技术,应用于数据增强和艺术创作,代表项目有Stable Diffusion和StyleGAN 2。音视频生成利用扩散模型、GANs和Video Diffusion等,广泛应用于娱乐和语音生成,代表项目有Sora和WaveNet。此外,AIGC还可应用于音乐生成、游戏开发和医疗保健等领域,展现出广泛的应用前景。AIGC应用可能引发内生风险、数据隐私问题和知识产权风险。内生风险包括算法的不可解释性和不可问责性,以及代码开源可能带来的安全和伦理担忧。数据隐私方面,AIGC工具可能导致数据泄露、匿名化不足、未经授权的数据共享等问题。应用风险涉及作品侵权、不当竞争等问题。相关法律和规定对AIGC的透明性、数据收集和处理、知识产权归属等提出了要求。然而,著作权归属、数据隐私等问题尚需更多法律明确规定。此外,AIGC的滥用可能导致虚假信息传12AIGC法律风险研究报告播、侵犯隐私等问题,因此需要进一步加强监管和伦理约束。13AIGC法律风险研究报告14AIGC法律风险研究报告

Others are asking
大模型和小模型区别是什么?是否大模型都属于生成式AI,小模型属于判别式AI,为什么大模型有幻觉小模型没有?
大模型和小模型的区别主要体现在以下几个方面: 1. 规模和参数数量:大模型通常具有更多的参数和更复杂的架构,能够处理更大量和更复杂的数据。 2. 能力和性能:大模型在语言理解、生成等任务上往往表现更出色,能够生成更准确、丰富和连贯的内容。 3. 应用场景:大模型适用于广泛的通用任务,而小模型可能更专注于特定的、较狭窄的领域。 并非大模型都属于生成式 AI,小模型都属于判别式 AI。生成式 AI 能够生成新的内容,如文本、图片等;判别式 AI 则主要用于对输入进行分类或判断。模型的分类与其大小并无直接的必然联系。 大模型出现幻觉的原因主要是其通过训练数据猜测下一个输出结果,可能会因错误或不准确的数据导致给出错误的答案。而小模型相对来说数据量和复杂度较低,出现幻觉的情况相对较少,但这并非绝对,还取决于模型的训练质量、数据的准确性等多种因素。优质的数据集对于大模型减少幻觉现象非常重要。
2025-02-21
人工智能(AI)、机器学习(ML)、深度学习(DL)、生成式AI(AIGC)的区别与联系
AI(人工智能)是一个广泛的概念,旨在让机器模拟人类智能。 机器学习(ML)是AI的一个分支,指计算机通过数据找规律进行学习,包括监督学习(使用有标签的训练数据,学习输入和输出之间的映射关系,如分类和回归)、无监督学习(处理无标签数据,让算法自主发现规律,如聚类)和强化学习(从反馈中学习,以最大化奖励或最小化损失,类似训练小狗)。 深度学习(DL)是一种机器学习方法,参照人脑构建神经网络和神经元,由于网络层数较多被称为“深度”。神经网络可用于监督学习、无监督学习和强化学习。 生成式 AI(AIGC)能够生成文本、图片、音频、视频等内容形式。 它们之间的联系在于:深度学习是机器学习的一种重要方法,机器学习又是实现人工智能的重要途径,而生成式 AI 是人工智能的一个应用领域。例如,生成式 AI 中的一些技术可能基于深度学习和机器学习的算法。2017 年 6 月,谷歌团队发表的论文《Attention is All You Need》首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖于循环神经网络或卷积神经网络,对相关技术的发展具有重要意义。大语言模型(LLM)如谷歌的 BERT 模型,可用于语义理解(如上下文理解、情感分析、文本分类),但不擅长文本生成,对于生成式 AI,生成图像的扩散模型不属于大语言模型。
2025-02-19
生成式AI教育场景应用 项目式学习 中小学案例
以下是一些中小学在生成式 AI 教育场景应用中采用项目式学习的案例: 北京市新英才学校: 开设“AI 创作家”小学课后服务特色课程,12 个五、六年级的学生在老师的引导和帮助下,主导设计一款实用的桌游。 学生们提出解决学校面积大导致新生和访客迷路的问题,决定制作一款学校地图桌游。 课程中,学生有时听老师讲解人工智能知识和工具使用方法,有时自己写 prompt 与大语言模型对话,还使用文生图 AI 工具生成桌游卡牌背后的图案,手绘第一版学校地图,选择游戏机制并梳理游戏流程。 在教育领域,生成式 AI 带来了诸多改变: 解决了教育科技长期以来在有效性和规模之间的权衡问题,可大规模部署个性化学习计划,为每个用户提供“口袋里的老师”,如实时交流并给予发音或措辞反馈的语言老师。 出现了众多辅助学习的产品,如教授新概念、帮助学习者解决各学科问题、指导数学作业、提升写作水平、协助创建演示文稿等。
2025-02-18
生成式AI教育场景应用 中小学案例
以下是北京市新英才学校在中小学教育场景中生成式 AI 的应用案例: 特色课程方面:学校开设了“AI 创作家”小学课后服务特色课程,12 个五、六年级的学生在老师的引导下,用 AIGC 工具设计一款实用的桌游。学生主导从收集需求、定义问题到设计背景、机制、内容、视觉,再到测试、迭代的全过程。例如,为解决学校面积大导致新生和访客迷路的问题,学生决定做一款学校地图桌游。课程中,学生学习人工智能知识、使用工具写 prompt 与大语言模型对话,还使用 OpenInnoLab平台生成桌游卡牌图案、手绘地图、选择游戏机制、梳理游戏流程。此外,还邀请中国传媒大学的吴卓浩教授合作,采用“大学生,小学生同上一节课”的方式,大学生为小学生讲解 AI 工具、试玩桌游。本学期,学生们测试并迭代桌游,使用 3D 打印机打印配件,用 ChatGPT 和 Midjourney 增强视觉设计,用 Kimi 辅助编写说明书,还计划让学生尝试用文生音乐工具 Suno 制作歌曲加入桌游 2.0 版本。 英语主课方面:初中部的英语课也融入了 AIGC 工具。魏一然协助初中部的英文老师杨佳欣和刘奕玚进行探索。在课程初期,更多是老师带着学生使用 AIGC 工具,prompt 由学生提出,老师引导。例如,在研究学校食堂食物浪费问题时,老师带着学生与 ChatGPT 对话,了解处理方法,让 ChatGPT 为学生生成生词解释和例句,形成生词库,并灵活加工生词生成题目、游戏或文章帮助学生复习单词。在关于社交媒体的英语辩论课上,尝试让学生自主使用 AIGC 工具做辩论准备。
2025-02-18
中小学AI教育场景 生成式 全息
以下是关于中小学 AI 教育场景生成式的相关内容: 北京市新英才学校在中小学 AI 教育方面进行了积极探索。跨学科项目老师带着学生用 AIGC 做学校地图桌游,英语老师在 AIGC 帮助下备课和授课,生物和信息科技老师合作带着学生训练 AI 模型以识别植物。数字与科学中心 EdTech 跨学科小组组长魏一然深入参与其中。 在英语课上,对于初中以上学生,一开始更多是老师带着使用 AIGC 工具,由学生提出 prompt,老师引导。例如在研究学校食堂食物浪费问题时,老师带着学生与 ChatGPT 对话获取信息,还让 ChatGPT 生成单词解释和例句,加工生词生成题目、游戏或文章帮助学生复习单词。在社交媒体的英语辩论课上,尝试让学生自主使用 AIGC 工具做辩论准备。 教育科技长期以来在有效性和规模之间权衡,而有了 AI 这种状况不再存在。现在可以大规模部署个性化学习计划,为每个用户提供“口袋里的老师”。像 Speak、Quazel、Lingostar 已在做实时交流并给予反馈的语言教学。Photomath、Mathly 指导学生解决数学问题,PeopleAI、Historical Figures 通过模拟与杰出人物聊天教授历史。学生在作业中也利用 Grammarly、Orchard、Lex 等工具提升写作水平,处理其他形式内容的产品如 Tome、Beautiful.ai 协助创建演示文稿。
2025-02-17
影视行业的生成式AI工具有哪些?帮我分一下类
以下是影视行业常见的生成式 AI 工具分类: 视频和图像类:Civitai、Kling AI、Viggle、Hailuo、Hedra、RunPod、Higgsfield、ThinkDiffusion、neural frames、Genmo、fal、LTX Video、CogVideoX、Morph Studio、Domo、Haiper、Pony Diffusion、Leonardo AI、Rubbrband 音频类:ElevenLabs、Hailuo、Cartesia、Sync、Tunes by Freepik 3D 类:Playhouse、Playbook、Tripo AI 故事板类:SAGA 在视频大类的分类下,按场景分,主要有以下几类: 1. 纯 AI 视频生成(RunwayML 等为代表) 2. 数字人(Heygen 等) 3. 营销类视频生成及编辑(生成内容以模板化,商业化内容为主) 4. 视频编辑(全面编辑,长剪短等) 此外,全球最大的生成式 AI 视频竞赛之一 Project Odyssey 第二季已开始,相关信息如下: 赛事官网:https://www.projectodyssey.ai/ 注册地址:https://projectodyssey.myflodesk.com/season2 赛事 Discord:https://discord.com/invite/projectodysseyai 提交地址:https://www.projectodyssey.ai/submission 时间线: 12 月 2 日:Project Odyssey 第二季开放报名 12 月 9 日:比赛规则公布 12 月 16 日:报名用户可解锁免费试用、完整规则正式发布、作品提交正式开启 1 月 16 日:提交截止,进入评审阶段 2 月 14 日:直播颁奖 参赛类别: 叙事类:通过鲜明的角色和深刻的故事情节,讲述能够打动人心的故事。 音乐视频:将视觉效果与原创音乐完美结合,打造震撼体验。 品牌创意:构思创意广告或活动视频,为虚拟品牌注入灵魂。(短于 60 秒) 创意预告片:制作极具吸引力的预告片或片头,为电影或剧集呈现特别概念。(短于 2 分 30 秒)
2025-02-16
当前DEEPSEEK发展壮大情况下,个人应具备AI方面什么能力避免被时代淘汰,如何提升这些能力,细化具体可执行的步奏
在 DEEPSEEK 发展壮大的情况下,个人为避免被时代淘汰,应具备以下 AI 方面的能力并通过以下具体可执行的步骤来提升: 1. 善用工具: 历史表明,使用工具的人通常表现更优,人类发展就是工具演化的过程。 不会用 AI 工具自动化重复性任务,可能面临被淘汰,应适应这种转变。 因自动化效率提升,可腾出时间进行高层次思考。 具体步骤:积极学习和掌握 AI 工具的使用方法,将重复性工作交给工具处理,培养利用工具提升效率的习惯。 2. 抽象与整合: “大语言模型”压缩了大量知识,可快速回放,无需直接学习所有知识细节,要在更高层次学习并抽象更多细节。 AI 能使人类更易学习技能或知识,技术进步使“整合”而非专业化成为可能,人们在更高层次工作,为 AI 提供方向并作选择。 具体步骤:锻炼高层次的思维能力,学会从复杂信息中提炼关键要点,不断提升整合能力,将精力集中于制定“策略”,把执行细节交给自动化系统。
2025-02-24
openai
OpenAI 相关信息如下: 模型: OpenAI API 由多种具有不同功能和价位的模型提供支持,还可通过微调针对特定用例对原始基本模型进行有限定制。 具体模型包括:GPT4 Beta(一组改进 GPT3.5 的模型,可理解和生成自然语言或代码)、GPT3.5(一组改进 GPT3 的模型,可理解并生成自然语言或代码)、DALL·E Beta(可在给定自然语言提示的情况下生成和编辑图像的模型)、Whisper Beta(可将音频转换为文本的模型)、Embeddings(可将文本转换为数字形式的模型)、Codex Limited Beta(一组可理解和生成代码的模型,包括将自然语言转换为代码)、Moderation(可检测文本是否敏感或不安全的微调模型)、GPT3(一组可理解和生成自然语言的模型)。 通用人工智能(AGI)计划: 有网络上传播的关于 OpenAI 计划在 2027 年前实现通用人工智能(AGI)的计划的相关文档,内容为各种报道和推文的拼凑猜测。 文档提到 OpenAI 于 2022 年 8 月开始训练一个拥有 125 万亿参数的多模态模型,第一阶段被称为 Arrakis 或 Q,该模型于 2023 年 12 月完成训练,但因高昂推理成本发布被取消,原计划 2025 年发布的 GPT5 取消,Gobi(GPT4.5)被重新命名为 GPT5。 技术栈: 从 GPT、DALL·E 到 Sora,OpenAI 成功跑通了 AGI 的所有技术栈。加州大学伯克利分校计算机科学 PHD、知乎作者 SIY.Z 从技术实现、商业和技术趋势上分析了原因,并尝试预测了 OpenAI 下一步的进展。
2025-02-24
如何在拼多多接入AI客服
在网站上接入 AI 客服通常可以按照以下步骤进行: 1. 创建大模型问答应用:通过百炼创建一个大模型应用,并获取调用大模型应用 API 的相关凭证。 2. 搭建示例网站:通过函数计算,快速搭建一个网站,模拟您的企业官网或者其他站点。 3. 引入 AI 助手:通过修改几行代码,实现在网站中引入一个 AI 助手。 4. 增加私有知识:准备一些私有知识,让 AI 助手能回答原本无法准确回答的问题,帮助更好地应对客户咨询。 另外,基于 COW 框架实现 ChatBot 时需要注意: COW 是基于大模型搭建的 Chat 机器人框架,将多模型塞进自己的微信里实现方案。 基于相关教程,可实现打造属于自己的 ChatBot(文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等)以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入。本文只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等。 可选择多种模型,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等。 支持多种消息类型,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能。 有多部署方法,如本地运行、服务器运行、Docker 的方式。
2025-02-24
如何接入AI客服
接入 AI 客服主要有以下两种方式: 1. 在网站上接入 AI 助手: 创建大模型问答应用:通过百炼创建大模型应用,并获取调用大模型应用 API 的相关凭证。 搭建示例网站:通过函数计算,快速搭建一个网站,模拟企业官网或其他站点。 引入 AI 助手:修改几行代码,实现在网站中引入 AI 助手。 增加私有知识:准备私有知识,让 AI 助手能回答原本无法准确回答的问题,更好地应对客户咨询。 2. 在微信上接入 AI 客服: 微信公众号:Coze AI 平台支持与微信公众号对接,使 AI 机器人能够自动回复用户消息。 微信服务号:Coze AI 平台支持与微信服务号对接,提升服务效率。 微信客服:Coze AI 平台支持与微信客服对接,自动回答用户咨询,提高客服响应速度。 个人微信/微信群:最近 Coze 的国内版正式发布了 API 接口功能,使得直接对接个人微信甚至微信群成为可能。但对接国外版 Coze 平台需要部署的服务支持黑魔法。
2025-02-24
如何给AI提问,得到自己想要的更准确的内容
以下是一些给 AI 提问以获得更准确内容的方法: 1. 设定角色:给 AI 赋予一个明确的角色,例如“你是一个专注于民商事法律领域的律师”,让其以特定角色来理解和回答问题。 2. 举例子:通过给出实际的例子,能使 AI 更准确地了解您的要求。 3. 连续提问:对于复杂的问题,可以就一个问题连续提问,根据 AI 的回复不断细化要求。 4. 直接问 AI 如何提问:当不知道如何提问时,可以先向 AI 请教如何提问,然后用它产生的问题再问它。 5. 讲清楚背景和目的:在提问时,除了明确的问题描述,还要梳理清楚背景信息和提问目的,帮助 AI 更好地理解问题上下文。 6. 学会提问:使用清晰、具体的语言,避免模糊表述,同时了解 AI 的工作原理和限制,设计合适的问题。 7. 拆解环节、切分流程:将复杂任务分解成更小、更具体的环节,让 AI 更精确地执行。 8. 对于编程相关问题: 提供代码范例,尤其是新进入代码节点的 IDE 中的范例。 说清楚输入变量与输出变量的类型。 说明与工作流中匹配或想要的变量名称。 列出输入变量的具体书写形式。 讲清楚代码要实现的功能,复杂功能尽量说清运行逻辑,描述中用变量名称指代相关变量。并可参考以下提问范式:。关键步骤请附上注释。
2025-02-24
我是一个什么都不懂的小白,但是我想通过ai弄出一个应用,我该怎么做?
对于纯小白想要通过 AI 开发应用,您可以参考以下步骤: 1. 从基础小任务开始: 让 AI 按照最佳实践为您写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以此学会必备的调试技能。 比如在学习写 chrome 插件时,可以要求 AI 选择适合小白上手的技术栈生成简单的示范项目,并包含尽可能全面的典型文件和功能,同时讲解每个文件的作用和程序运行的逻辑。 如果使用 o1mini,还可以在提示词最后添加“请生成 create.sh 脚本,运行脚本就能直接创建插件所需要的所有文件。请教我如何运行脚本。”(windows 机器则是 create.cmd),从而一次性生成多个目录和文件。 2. 明确项目需求: 通过和 AI 的对话,逐步明确项目需求。 可以让 AI 像高级别的懂技术的产品经理那样向您提问,帮助梳理产品功能,尤其注意涉及技术方案选择的关键点。 来回对话后,让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知正在做的功能点。 需要注意的是,虽然 AI 能提供帮助,但对于复杂的应用开发,仍需要您在过程中逐渐学习一些编程知识。目前像字节 Coze 这样的工具本质上是「AIfirst aPaaS」,它把实现应用所需的不同类型代码用不同可视化工具实现,生成的是「配置」,且开发和运行阶段都有大模型的支持。
2025-02-24
知识库目录
以下是通往 AGI 之路的知识库目录相关内容: 1. 直播一期:知识库及 GPT 基础介绍 包含知识库及社群介绍,提供了直播回放链接,还介绍了最新知识库精选同步,如通往 AI 绘画之路(小红书),专注于 AI 绘画,分享优质设计 Prompt,并进行了知识库目录导览。 2. 5.关于我们&致谢 介绍这是一个开源 AI 社区,创建知识库的初衷是坚信人工智能将重塑思考和学习方式,带来强大力量。特别感谢支持和推荐知识库的伙伴们,WaytoAGI 是由热爱 AI 的专家和爱好者共同建设的开源 AI 知识库,整合各种 AI 资源,让不同水平的人都能受益。 3. 🌈通往 AGI 之路分享会 深入浅出理解 AI,从有趣的应用到核心原理。包括自我介绍,愿景和目标是让每个人学习 AI 少走弯路,让更多人因 AI 强大。目录涵盖有趣的 AI 案例、AI 的原理、Diffusion 原理和案例、什么是 Agent 。
2025-02-24
搭建个人知识库
以下是关于如何搭建个人知识库的详细介绍: 要搭建基于 GPT API 的定制化知识库,首先需要给 GPT 输入(投喂)定制化的知识。但 GPT3.5(即当前免费版的 ChatGPT)一次交互(输入和输出)只支持最高 4096 个 Token,约等于 3000 个单词或 2300 个汉字,这个容量对于绝大多数领域知识是不够的。为解决此问题,OpenAI 提供了 embedding API 解决方案,可参考 OpenAI embedding documents。 embeddings(直译为嵌入)是一个浮点数字的向量(列表)。两个向量之间的距离衡量它们的关联性,小距离表示高关联度,大距离表示低关联度。向量是数学中表示大小和方向的一个量,通常用一串数字表示,在计算机科学和数据科学中,向量通常用列表(list)来表示,列表是一种包含一组有序元素的数据结构。向量之间的距离是一种度量两个向量相似性的方法,最常见的是欧几里得距离,其计算方法是将两个向量的对应元素相减,然后取平方和,再开平方。在 OpenAI 词嵌入中,靠近向量的词语在语义上相似,例如“猫”和“狗”距离近,它们都是宠物,与“汽车”距离远,相关性低。文档上给了创建 embeddings 的示例。 将文本转换成向量能大大节省空间,可简单理解为索引,发送给 GPT API。 LlamaIndex 是更高一层 LangChain 的抽象,之前叫 GPT Index。之前的文章中的例子就是使用的 LlamaIndex 包。它简化了 LangChain 对文本分割、查询这块的接口,提供了更丰富的 Data Connector。LlamaIndex 只针对 GPT Model 做 Index,而 LangChain 是可以对接多个 LLMs,可扩展性更强。参考 https://gptindex.readthedocs.io/en/latest/ 。 最近各家大厂接连放大招,AI 技术和应用突飞猛进,GPT4 接口已经支持最大 32K 输入,AI 的开发和使用门槛肯定会越来越低。垂直领域知识库的搭建和优化可能更多的是一个业务问题,而不是一个技术问题。欢迎关注公众号“越山集”,多交流。
2025-02-24
siliconflow可以搭建rag知识库吗
SiliconFlow 本身并不能直接搭建 RAG 知识库。但一般搭建 RAG 知识库的步骤通常包括以下方面: 1. 准备数据:收集需要纳入知识库的文本数据,包括文档、表格等格式,并对数据进行清洗、分段等预处理,确保数据质量。 2. 创建知识库: 访问相关平台的知识库索引,如阿里云百炼,单击创建知识库。在创建知识库界面填入知识库名称与描述。 选择文件,类目位置单击默认类目,文件名称选择准备好的数据文件。 进行数据处理,使用默认的智能切分或根据需求选择合适的处理方式。 3. 配置相关设置:如在 Dify 中提供了三种索引方式供选择,包括高质量模式、经济模式和 Q&A 分段模式,可根据实际需求选择合适的索引方式。 4. 集成至应用:将创建好的数据集集成到相应的应用中,作为应用的上下文知识库使用,并在应用设置中配置数据集的使用方式。 5. 持续优化:收集用户反馈,对知识库内容和索引方式进行持续优化和迭代,定期更新知识库,增加新的内容以保持时效性。 需要注意的是,不同的平台和工具在具体操作上可能会有所差异。
2025-02-24
如何搭建 知识库
以下是搭建知识库的相关内容: 使用 Dify 构建知识库的步骤: 1. 准备数据:收集纳入知识库的文本数据,包括文档、表格等格式,进行清洗、分段等预处理以确保数据质量。 2. 创建数据集:在 Dify 中创建新数据集,上传准备好的文档,并编写良好的描述。 3. 配置索引方式:Dify 提供三种索引方式,根据实际需求选择,如追求更高准确度可选高质量模式。 4. 集成至应用:将数据集集成到 Dify 的对话型应用中,在应用设置中配置数据集使用方式。 5. 持续优化:收集用户反馈,对知识库内容和索引方式持续优化和迭代,定期更新增加新内容。 使用 Coze 智能体机器人搭建知识库的步骤: 1. 手动清洗数据:本次创建知识库使用手动清洗数据,提高数据准确性。 2. 在线知识库:点击创建知识库,创建画小二课程的 FAQ 知识库,飞书在线文档中每个问题和答案以分割,选择飞书文档、自定义,输入,可编辑修改和删除,添加 Bot 并在调试区测试效果。 3. 本地文档:注意拆分内容提高训练数据准确度,将海报内容训练到知识库,按章节进行人工标注和处理,选择创建知识库自定义清洗数据。 4. 发布应用:点击发布,确保在 Bot 商店中能搜到。 本地部署大模型以及搭建个人知识库中关于 RAG 的介绍: 利用大模型的能力搭建知识库是 RAG 技术的应用。在进行本地知识库搭建实操前,需先了解 RAG。RAG 是当需要依靠不包含在大模型训练集中的数据时,通过检索增强生成的技术。其应用可抽象为 5 个过程:文档加载、文本分割、存储(包括将文档块嵌入转换成向量形式并存储到向量数据库)、检索、输出(把问题及检索出的嵌入片提交给 LLM 生成更合理答案)。文本加载器是将用户提供的文本加载到内存中以便后续处理。
2025-02-24
WaytoAGI 知识库有什么应用场景
WaytoAGI 知识库具有以下应用场景: 1. 在飞书 5000 人大群中,内置了智能机器人“waytoAGI 知识库智能问答”,可根据文档及知识进行回答。使用时在飞书群里发起话题时即可,它能自动回答用户关于 AGI 知识库内的问题,对多文档进行总结、提炼;在内置的“waytoAGI”知识库中搜索特定信息和数据,快速返回相关内容;提供与用户查询相关的文档部分或引用,帮助用户获取更深入的理解;通过互动式的问答,帮助群成员学习和理解 AI 相关的复杂概念;分享有关 AGI 领域的最新研究成果、新闻和趋势;促进群内讨论,提问和回答,增强社区的互动性和参与度;提供访问和下载 AI 相关研究论文、书籍、课程和其他资源的链接;支持多语言问答,满足不同背景用户的需求。 2. WaytoAGI 是由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库,目前知识库的内容覆盖:AI 绘画、AI 视频、AI 智能体、AI 3D 等多个版块,包含赛事和活动促进大家动手实践。 3. WaytoAGI 里有个离谱村,是由 WaytoAGI 孵化的千人共创项目,让大家学习和接触 AI 更容易,更感兴趣。参与者不分年龄层,一起脑洞和创意,都可以通过 AI 工具快速简单地创作出各种各样的作品。离谱村是一个没有被定义的地方,每个人心中都有自己想象中的离谱村,不仅代表着一个物理空间,更是灵魂的避风港,激励着每一个生命体发挥其无限的想象力,创造属于自己的独特生活方式。
2025-02-24
关于RAG和知识库的应用
RAG(检索增强生成,Retrieval Augmented Generation)是一种利用大模型能力搭建知识库的技术应用。当需要依靠不包含在大模型训练集中的数据时,可通过该技术实现。 RAG 的应用可抽象为以下 5 个过程: 1. 文档加载(Document Loading):从多种不同来源加载文档,如 PDF 等非结构化数据、SQL 等结构化数据以及 Python、Java 之类的代码等。LangChain 提供了 100 多种不同的文档加载器。 2. 文本分割(Splitting):文本分割器把 Documents 切分为指定大小的块,称为“文档块”或“文档片”。 3. 存储(Storage):涉及两个环节,一是将切分好的文档块进行嵌入(Embedding)转换成向量的形式,二是将 Embedding 后的向量数据存储到向量数据库。 4. 检索(Retrieval):数据进入向量数据库后,通过某种检索算法找到与输入问题相似的嵌入片。 5. Output(输出):把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示生成更加合理的答案。 离线数据处理的目的是构建知识库这本“活字典”,知识会按照某种格式及排列方式存储在其中等待使用。在线检索则是利用知识库和大模型进行查询的过程。以构建智能问答客服为例,可了解 RAG 所有流程中的 What 与 Why。 相关资源: 文本加载器:将用户提供的文本加载到内存中,便于后续处理。 海外官方文档:https://www.coze.com/docs/zh_cn/knowledge.html 国内官方文档:https://www.coze.cn/docs/guides/use_knowledge
2025-02-24
我是广告公司高管,请推荐相关的AI工具
以下是为您推荐的适用于广告公司高管的相关 AI 工具: 营销领域的 AI 工具: 1. Synthesia:允许用户创建由 AI 生成的高质量视频,包括数字人视频,提供多种定价计划,可用于制作营销视频、产品演示等。 2. HeyGen:基于云的 AI 视频制作平台,用户可从 100 多个 AI 头像库中选择,并通过输入文本生成数字人视频,适合制作营销视频和虚拟主持人等。 3. Jasper AI:人工智能写作助手,可用于生成营销文案、博客内容、电子邮件等,提供多种语气和风格选择,写作质量较高。 4. Copy.ai:AI 营销文案生成工具,可快速生成广告文案、社交媒体帖子、电子邮件等营销内容,有免费和付费两种计划。 5. Writesonic:AI 写作助手,专注于营销内容创作,如博客文章、产品描述、视频脚本等,提供多种语气和行业定制选项。 更多的营销产品可以查看 WaytoAGI 网站:https://www.waytoagi.com/sites?tag=8 。总的来说,这些 AI 工具能够帮助营销人员高效创作各种营销内容,提高工作效率。用户可根据实际需求选择合适的工具。 AI 博主素材相关工具: 1. AI 研究工具:Claude、ChatGPT、Bing Chat、Perplexity。 2. 图片处理:DallE、Leonardo、BlueWillow、Midjourney。 3. 版权写作:Rytr、Copy AI、Wordtune、Writesonic。 4. 设计:Canva、Clipdrop、Designify、Microsoft Designer。 5. 网站搭建:10Web、Framer、Hostinger、Landingsite。 6. 视频处理:Klap、Opus、Invideo、Heygen。 7. 音频处理:Murf、LovoAI、Resemble、Eleven Labs。 8. SEO 优化:Alli AI、BlogSEO、Seona AI、Clearscope。 9. Logo 设计:Looka、LogoAI、Brandmark、Logomaster。 10. 聊天机器人:Droxy、Chatbase、Voiceflow、Chatsimple。 11. 自动化工具:Make、Zapier、Bardeen、Postman。 AI 搜索引擎: 1. 秘塔 AI 搜索:由秘塔科技开发,提供多模式搜索、无广告干扰、结构化展示和信息聚合等功能,旨在提升用户的搜索效率和体验。 2. Perplexity:聊天机器人式的搜索引擎,允许用户用自然语言提问,使用生成式 AI 技术从各种来源收集信息并给出答案。 3. 360AI 搜索:360 公司推出的 AI 搜索引擎,通过 AI 分析问题,生成清晰、有理的答案,并支持增强模式和智能排序。 4. 天工 AI 搜索:昆仑万维推出的搜索引擎,采用生成式搜索技术,支持自然语言交互和深度追问,未来还将支持图像、语音等多模态搜索。 5. Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,提供插件系统和社区功能。 6. Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 7. Phind:专为开发者设计的 AI 搜索引擎,利用大型语言模型提供相关的搜索结果和动态答案,特别擅长处理编程和技术问题。 以上内容由 AI 大模型生成,请仔细甄别。
2025-02-24
知识库中智能体相关的文章
以下是为您整理的关于智能体的相关内容: 在“01通往AGI之路知识库使用指南”中: 提到智能体由大语言模型衍生而来,因提示词不太可控才有进阶。 讲述了智能体进阶案例拆解,推荐景淮老师的相关成果。 阐述扣子、千帆百炼属于智能体范畴,扣子更偏ToC应用,所以有专门讲解扣子相关内容。 指出学习AI agent可能较痛苦,建议先吃透prompt再看相关内容。 在“这可能是讲Coze的知识库最通俗易懂的文章了”中: 提到读完文章您会收获更好地使用Coze等AI Agent平台中的知识库组件,打造更加强大的智能体。 预告了关于AI时代编程基础系列,包括数据库、知识库、变量、JSON、API、操作系统与服务器、Docker等内容。 在“元子:WayToAGI知识库究竟咋用?”中: 通识篇中有现有常见AI工具小白扫盲的介绍,包括相关文章和视频链接,适用于对AI没有太多概念的纯纯小白,能帮助其快速感受当下AI工具的力量。 通识篇中还有AI常见名词、缩写解释,提供了相关文章链接,适用于看不懂“黑话”和诸多缩写的小白。
2025-02-23
如何权构建个人AI知识库,请提供详尽的方案,并提供相关工具应用案例。
以下是构建个人 AI 知识库的详尽方案及相关工具应用案例: 方案: 1. 知识收集:学习如何有效地收集、整理和检索信息,例如分新闻、观点、访谈、论文翻译来进行提炼。 2. 知识管理:通过实际操作,体验工具在知识管理方面的应用。 3. 数据处理:使用工具对数据进行转换、提取和呈现,如从图像和图形中提取数据。 4. 内容总结:总结视频内容、翻译和改换风格等。 工具应用案例: 1. 知识收集与整理: 通义听悟整理录音笔记:https://tingwu.aliyun.com 用 React 实现选中即解释 本机跑大语言模型工具:https://ollama.com 选词翻译、解读、拓展:https://snapbox.app 与各种 AI 机器人聊天:https://opencat.app 、https://chathub.gg/ 、https://www.elmo.chat/ 定义提示语,根据不同类型提取有用信息:https://memo.ac/zh/ 2. 数据获取与处理: 下载视频:Mac 用 Downie,Windows 推荐 IDM 淘宝数码荔枝店购买 开源免费屏幕录制工具 OBS:https://obsproject.com/ 用 losslessCut 快速切块 3. 构建知识库: 将文本转换成向量(如使用 embeddings API),先把大文本拆分成若干小文本块(chunk),将小文本块转换成 embeddings 向量并在向量储存库中保存,当用户提问时,通过比对向量提取关联度最高的文本块与问题组合成新的 prompt 发送给 GPT API。 例如对于一篇包含多个文本块的文章,如“文本块 1:本文作者:越山。xxxx。”“文本块 2:公众号越山集的介绍:传播效率方法,分享 AI 应用,陪伴彼此在成长路上,共同前行。”等,当提问“此文作者是谁?”时,可通过比较 embeddings 向量找出关联度最高的文本块。 4. 工具入门: 提示词:现成好用的 Prompt: AI Agent:Agent 工具 小白的 Coze 之旅: AI Pic:现在主流的 AI 绘图工具网站:
2025-02-22
有dify相关的教程吗
以下是关于 Dify 的一些教程: 1. 接入企业微信: 在 Dify 平台创建基础编排聊天助手应用,获取 API 密钥和 API 服务器地址。 下载 Dify on WeChat 项目并安装依赖。 在项目根目录创建 config.json 文件,填写 API 密钥和服务器地址。 把基础编排聊天助手接入微信,可选择源码部署或 Docker 部署。 把工作流编排聊天助手接入微信,包括创建知识库、导入文件、设置节点等操作。 把 Agent 应用接入微信,创建应用、设置模型和工具、生成 API 密钥等。 更多内容请访问原文:https://docs.dify.ai/v/zhhans/learnmore/usecases/difyonwechat 2. 免费搭建微信机器人: 参考丁先生的教程,从特定步骤开始接入微信,把 fastgpt 当成 dify 来看,大同小异。 注意一些命令和配置要求,如微秘书登陆要用小号,且不能是新号,可能需要一个礼拜以上,并绑定一张银行卡。若删除数据退出登陆,需在宝塔面板上重启微秘书的容器。修改配置后,可私聊小号输入“更新”,一分钟后新配置生效。 3. 相关能力介绍: 以 API 形式链接 Zion 和 Coze,同理也可为 dify、kimi 等制作收费前端。参考: 自定义配置,包括变现模版 UI 交互、API、数据库等拓展功能,支持在 Zion 内自由修改,可参考文档配置。 支付: Actionflow: 权限: 代码组件: 微信小程序变现模版正在开发中,不久将会上线。目前实现小程序端可以通过 API 形式搭建。 Zion 支持小程序、Web、AI 行为流全栈搭建,APP 端全栈搭建 2025 上线。
2025-02-22
我是一名教师,是一个AI小白,现在想系统学习相关内容,请帮我规划好
以下是为您规划的系统学习 AI 的方案: 第一阶段:迈出第一步,打好基础 1. 学习指南 系统性学习:避免碎片化输入,系统地阅读相关书籍、听取优质课程,了解 AI 的底层原理和发展历程。 2. 初步探索 避免弯路:不要仅依赖刷短视频学习,对于 B 站等平台上的内容要有选择性,注重质量高的系统性内容。 3. 加入 AI 社区 例如“通往 AGI 之路”开源知识库,参考新手指引入门。 第二阶段:深入学习 1. 了解 AI 基本概念 阅读「」,熟悉术语和基础概念,包括主要分支及相互联系。 浏览入门文章,了解历史、应用和发展趋势。 2. 开始学习之旅 参考「」,学习生成式 AI 等基础知识,推荐李宏毅老师的课程。 利用在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习,并争取获得证书。 第三阶段:选择感兴趣的模块深入 1. 领域选择 AI 领域广泛,如图像、音乐、视频等,根据兴趣选择特定模块深入学习。 掌握提示词技巧,因其上手容易且实用。 第四阶段:实践和尝试 1. 巩固知识 理论学习后通过实践巩固,尝试使用各种产品创作作品。 分享实践成果。 第五阶段:体验 AI 产品 1. 互动学习 尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解工作原理和交互方式,获取实际应用体验,激发对 AI 潜力的认识。
2025-02-22
我想要了解 Defy 的相关信息
Dify 是一个开源的大模型应用开发平台: 理念:结合后端即服务和 LLMOps 的理念。 特点:为用户提供直观界面,能快速构建和部署生产级别的生成式 AI 应用。具备强大的工作流构建工具,支持广泛的模型集成,有功能丰富的提示词 IDE 以及全面的 RAG Pipeline 用于文档处理和检索。允许用户定义 Agent 智能体,通过 LLMOps 功能持续监控和优化应用程序性能。 部署选项:提供云服务和本地部署选项,满足不同用户需求。 开源特性:确保对数据的完全控制和快速的产品迭代。 设计理念:注重简单性、克制和快速迭代,旨在帮助用户将 AI 应用的创意快速转化为现实。 使用建议:个人研究时推荐单独使用,企业级落地项目推荐多种框架结合。 Dify 官方手册:https://docs.dify.ai/v/zhhans
2025-02-21