直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

我要用半小时的时间介绍way to AGI,主要想介绍知识库当中的prompt 和 智能体,请给我生成文稿。

回答

以下是为您生成的半小时介绍 way to AGI 的文稿:

首先,我们来谈谈《24 节气》这个节目。去年 3 月份开始接触 SD,年终才真的开始系统性学习,非常痴迷,原本正常作息的我变得每天 3 点睡觉。会把所有的知识点细致的记录,每个参数都测试很多遍。在学习光影字的时候,制作 24 节气图成了我的固定节目,我会在🌈通往 AGI 之路的 AI 知识库里开源所有测试出来的稳定的 prompt 和参数,每张图都会做成海报,分享给 waytoAGI 的小伙伴们。这里的字体都是由请叶承欢帮忙手写的毛笔字体,比起电脑输入的字体更有温度。这次 AI 春晚,要求更高,每个节气需要制作六张作品,为了保持高度一致性,基本全部重新制作了一遍,每个节气至少抽卡 200 次选出最满意的那几张,每张作品的字体、粗细、大小和效果都有所不同,尤其是立夏,我尝试了 400 多张才勉强满意。不过有了前期的积累,仅用三四天时间就完成了一整套作品。AJ 作为整体策划统筹号召了小伙伴一起制作,邵帅把每张图都用 runway 生成非常美的动态效果,并剪辑在一起,刘润梓 KEEN 很精心的用 AI 音乐工具生成了每个节气的背景音,大家可以仔细听一下,都有不同。关于音乐部分,KEEN 也会开源在 waytoagi.com 的音乐板块中。一起发扬共创开源精神。

接下来是关于 Prompt 提示词的内容。Prompt,也就是所谓提示词工程,现在算得上如火如荼了,也开始内卷出各个流派了。2023 年初调侃 AI 为什么林冲要去高老庄这样的交互方式,被亲切地称为“一刀流”。咱也不会,咱也不懂,那咱就学呗。下面这个图是相当火热的开源知识库 waytoagi 整理的框架图。但是不要被框架唬住,咱也是上过学的,咱来它个庖丁解牛试试。结构化降低了沟通难度,提高结果准确度,同时也限制了更多可能性,有利有弊。大部分框架都不太适合解决过于主观,个人情绪的问题,也没必要解决太过于简单的问题。有了框架固然比一刀流看起来牛掰一些,但是想要完全符合需求,往往不是一个框架能完全搞定的。

最后,上周扎克伯格在他的 threads 和 Ins 上发布了一段视频,宣布 Meta 将会致力于实现 AGI,为了实现这一目标公司正将其两大 AI 研究团队 FAIR 和 GenAI 进行合并,同时将投入超过 90 亿美元向英伟达采购员超过 34000 张 H100 显卡,到 24 年底 Meta 的 GPU 算力将达到 60 万个 H100。今年英伟达总的 H100 出货量将有 15 万张,Meta 一下就要拿走 1/5 真的狠。对于通用人工智能究竟是什么,以及何时能实现,连扎克伯格自己也没有明确的答案。尽管如此,他依然全力以赴地研究智能的各个方面,从逻辑推理到直觉判断。Meta 正在开发名为 Llama 3 的大语言模型,目的是提升它在代码生成和逻辑推理方面的能力。重要的是扎克伯格正在推动一种开源的通用人工智能开发方式,这也是大家这么关注他的进展和 Llama3 的原因。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

节目介绍及投票

通往AGI之路,赞15“去年3月份开始接触SD,年终才真的开始系统性学习,非常痴迷,原本正常作息的我变得每天3点睡觉。会把所有的知识点细致的记录,每个参数都测试很多遍。在学习光影字的时候,制作24节气图成了我的固定节目,我会在🌈通往AGI之路的AI知识库里开源所有测试出来的稳定的prompt和参数,每张图都会做成海报,分享给waytoAGI的小伙伴们。这里的字体都是由请叶承欢帮忙手写的毛笔字体,比起电脑输入的字体更有温度。这次AI春晚,要求更高,每个节气需要制作六张作品,为了保持高度一致性,基本全部重新制作了一遍,每个节气至少抽卡200次选出最满意的那几张,每张作品的字体、粗细、大小和效果都有所不同,尤其是立夏,我尝试了400多张才勉强满意。不过有了前期的积累,仅用三四天时间就完成了一整套作品。AJ作为整体策划统筹号召了小伙伴一起制作,邵帅把每张图都用runway生成非常美的动态效果,并剪辑在一起,刘润梓KEEN很精心的用AI音乐工具生成了每个节气的背景音,大家可以仔细听一下,都有不同。关于音乐部分,KEEN也会开源在waytoagi.com的音乐板块中。一起发扬共创开源精神”--三思

Prompt 提示词没那么玄乎也就是个沟通方式-大雨整理

Prompt,也就是所谓提示词工程,现在算得上如火如荼了,也开始内卷出各个流派了。2023年初调侃AI为什么林冲要去高老庄这样的交互方式,被亲切地称为“一刀流”。咱也不会,咱也不懂,那咱就学呗。下面这个图是相当火热的开源知识库waytoagi整理的框架图。但是不要被框架唬住,咱也是上过学的,咱来它个庖丁解牛试试。结构化降低了沟通难度,提高结果准确度,同时也限制了更多可能性,有利有弊。大部分框架都不太适合解决过于主观,个人情绪的问题,也没必要解决太过于简单的问题。有了框架固然比一刀流看起来牛掰一些,但是想要完全符合需求,往往不是一个框架能完全搞定的。

AIGC Weekly #56

Midjourney提示词:body,low angle::1 Macro,3d,glass floating flat organic forms,shapeless,close-up ribbed plastic object,depth of field,pastel,rainbow colored border,in the style of ethereal light effects,monochromatic white figures,minimalist,shimmering metallics,light tan grey olive background::2 --v 6.0 --style raw --s 50 --ar 16:9[💎查看更多风格和提示词](https://catjourney.life/)上周扎克伯格在他的threads和Ins上发布了一段视频,宣布Meta将会致力于实现AGI,为了实现这一目标公司正将其两大AI研究团队FAIR和GenAI进行合并,同时将投入超过90亿美元向英伟达采购员超过34000张H100显卡,到24年底Meta的GPU算力将达到60万个H100.今年英伟达总的H100出货量将有15万张,Meta一下就要拿走1/5真的狠。对于通用人工智能究竟是什么,以及何时能实现,连扎克伯格自己也没有明确的答案。尽管如此,他依然全力以赴地研究智能的各个方面,从逻辑推理到直觉判断。Meta正在开发名为Llama 3的大语言模型,目的是提升它在代码生成和逻辑推理方面的能力。重要的是扎克伯格正在推动一种开源的通用人工智能开发方式,这也是大家这么关注他的进展和Llama3的原因。

其他人在问
使用AGI写作
以下是关于使用 AGI 写作的相关内容: 利用 AI 打造爆款公众号文章: AI 生产文章的关键在于提供清晰且具指导性的提示词。基础提示词能生成基础文章,更详细和具创意的提示词能提升文章质量,如“请根据我们收集的关于 OpenAI 回应马斯克言论的资讯,创作一篇既深入又易于理解的科技资讯文章。文章应该有一个吸引人的标题,开头部分要概述事件的背景和重要性,主体部分详细分析 OpenAI 的回应内容及其可能产生的影响,结尾处提出一些引人深思的问题或观点。”AI 生成的文章可能需要微调以符合预期和公众号风格,通常不到十分钟就能完成内容产出。 OpenAI 通用人工智能(AGI)的计划被揭露: 一家公司正在建造强大的 AI,它具备多种能力且不断获得新能力,工程师们在讨论其意义及可能带来的影响,包括工作过时、道德义务等。 通往 AGI 之路的相关教程: 1. (入门级,网速好时一小时能搞定) 2. 3. 作者 Allen 准备调整加强写作能力训练的工作流,先在飞书上发布初稿获取反馈再拆分细化。
2024-11-15
WAY TO AGI中AGI是什么意思?
AGI 指通用人工智能,也叫强人工智能。通常在其出现时会是奇点科技大爆炸的时刻,科技将推动文明呈指数级增长。虽然通往通用人工智能的道路可能还漫长,但它已如海风般逐渐临近。例如科幻作家刘慈欣所说“未来已来,像盛夏的大雨,在我们还不及撑开伞时就扑面而来”(很多人早就失业了)。
2024-11-15
AGI是什么意思?
AGI 即通用人工智能(Artificial General Intelligence),指能够像人类一样思考、学习和执行多种任务的人工智能系统。它可以做任何人类可以做的事。 Deepmind 的研究团队在去年十一月发表的论文《Levels of AGI》中,给 AGI 的定义提出了六个原则,其中最重要的一点是“关注能力,而非过程”,即应关注 AGI 能完成什么,而非它如何完成任务。AGI 的定义应包括多个级别,每个级别都有明确的度量标准和基准。 还有一个常见且较合理和可验证的定义:AGI 是一种自主系统,在大多数具有经济价值的工作中超越了人类的能力。例如 Sam Altman 常说的,用自动化来贡献 GDP。Andrej Karpathy 今年初在其博客上发表的《Selfdriving as a case study for AGI》(虽很快删除),全文用自动化的交通服务来类比 AGI 和它的经济价值。
2024-11-13
如何可以快速的学习Agi
以下是关于快速学习 AGI 的一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 鉴于人工智能依赖的神经网络基础,专家 AI 可能通过元学习(或学会学习)比我们预期的更快地获得知识,并带着我们人类一同进步。AI 的性质让我们可以做一些我们无法对人做的事情,即将他们一部分一部分地拆解,并研究每一个小部分。通过构建系统以深入探索专家 AI 的内部工作机制,我们将创造一个学习的飞轮。最终,专家 AI 可能超越领域专家的角色,成为下一代专家——无论是人类还是 AI——的教师。
2024-11-13
主流大厂目前的agi 进展
目前主流大厂在 AGI 方面的进展情况如下: 2023 年之前,国内 AI 行业自认为与美国差距不大,但 ChatGPT 和 GPT4 的出现打破了这种认知,OpenAI 直接拉开了 2 年的技术差距。 2023 年上半年,国内大厂纷纷囤卡招人,研究类 GPT 架构,或成立创业公司,试图创造国产 AGI。但下半年发现不容易后,纷纷转向“垂直应用”“商业化”,不再提 AGI。 国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距。 百度和阿里在大厂中比较高调,百度的“文心 4.0”是当前国内能力较好的模型之一,即将发布的阿里的“通义千问”也备受关注。 大厂们在人才、GPU、数据和资金储备方面具备冲击 AGI 的条件,但实际效果尚无明确亮点,且受内部短期考核压力影响,多数力量用于卷新产品和向上汇报工作,同时还背负其他业务和政治考量。
2024-11-12
什么是AGI
AGI 即通用人工智能(Artificial General Intelligence),是指具有人类水平的智能和理解能力的 AI 系统。它有能力完成任何人类可以完成的智力任务,适用于不同的领域,同时拥有某种形式的意识或自我意识。目前还只是一个理论概念,还没有任何 AI 系统能达到这种通用智能水平。 AGI 的发展有五个等级: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 更多信息请见(AGI)。OpenAI 原计划在 2026 年发布的 Q 的下一阶段(最初被称为 GPT6,后重新命名为 GPT7),由于埃隆·马斯克最近的诉讼而被暂停。计划在 2027 年发布的 Q 2025(GPT8)将实现完全的 AGI。
2024-11-12
一个 prompt 有 10 段文本内容,怎么标记不同段落的权重
当一个 prompt 有 10 段文本内容时,标记不同段落权重的方法如下: 使用双冒号“::”将提示分成不同部分,并在双冒号后面立即添加一个数字来指定该部分的相对权重。例如,“hot::2 dog”表示单词“hot”比“dog”重要度高出两倍。 在版本 1、2、3 中只接受整数作为权值,版本 4 能接受权值的小数位数。未指定权值时默认为 1。 负数权值可用于提示中以删除或排除不需要的元素,但所有权值的比必须是正数。 改变 tag 权重有多种方式: :数值从 0.1 到 100,低于 1 减弱,大于 1 加强。 括号,权重就重 1.1 倍;每加一层括号就反向减弱 1.1 倍。 小括号权重乘 1.1,如 a;中括号权重除以 1.1;小括号里面直接用冒号写权重也行;反斜杠可以让小括号的权重不生效当做一般字符串处理。 花括号写法,一个花括号权重为 1.05。 提示词其他常用语法:是画到一半的时候开始不画女孩。
2024-11-17
什么是prompt?
Prompt 是您给大模型的文本,用于引发相关输出,通常以问题或指示的形式出现。它可以是一套与大模型交互的语言模板,通过这个模板,您可以输出对大模型响应的指令,明确大模型应该做什么、完成什么任务以及如何处理具体任务,并最终获得期望的结果。大模型的本质是基于语言的概率模型,没有 Prompt 时,大模型随机给出答案,有了 Prompt 则相当于给了一个包含对模型要求、输入和输出限制的模板,让大模型在限制下得到概率最大的答案。此外,Prompt 是给到大模型输入的一段原始输入,能帮助模型更好地理解用户需求并按特定模式或规则进行响应。例如可以设定“假设你是一位医生,给出针对这种症状的建议”,后续对话会按此设定展开,还能在设定中要求模型按一定思路逻辑回答,如思维链(cot),也能让模型按特定格式(如 json)输出,使模型成为输出器。
2024-11-17
用 mj 做文生图,Prompt 模板
以下是使用 MJ 进行文生图的 Prompt 模板: 1. 定主题:明确您需要生成一张什么主题、什么风格、表达什么信息的图。 2. 选择基础模型 Checkpoint:按照主题,找内容贴近的 checkpoint。一般喜欢用模型大佬麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等,效果较好。 3. 选择 lora:在想要生成的内容基础上,寻找内容重叠的 lora,以控制图片效果及质量。可多参考广场上好看的帖子中使用的 lora。 4. ControlNet:用于控制图片中特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能,可后续学习。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语的组合,不用管语法,单词、短语之间用英文半角逗号隔开。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。 9. 采样算法:较复杂,一般选 DPM++ 2M Karras 较多。最稳妥的是留意 checkpoint 的详情页上模型作者是否有推荐采样器,使用推荐的采样器更有保障。 10. 采样次数:根据采样器特征,选 DPM++ 2M Karras 后,采样次数一般在 30 40 之间,多了意义不大且慢,少了出图效果差。 11. 尺寸:根据个人喜好和需求选择。 另外,使用 Stability AI 基于 Discord 的媒体生成和编辑工具进行文生图时: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 2. 进入 ARTISAN 频道,任意选择一个频道。 3. 输入/dream 会提示没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。 4. 输入/dream 提示词,这部分和 MJ 类似。 5. 和 MJ 手工输入参数不同,可选参数有五类: prompt:提示词,正常文字输入,必填项。 negative_prompt:负面提示词,填写负面提示词,选填项。 seed:种子值,可以自己填,选填项。 aspect:长宽比,选填项。 model:模型选择,SD3,Core 两种可选,选填项。 Images:张数,1 4 张,选填项。完成后选择其中一张。 在 MJ 应用篇儿童绘本制作、人物一致性方面: 1. 生成人物图片:确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 mj 中生成直到得到满意的人物图像。垫图 URL + “In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,取 iw 2 。 2. 合成人物和场景,垫图并重新生成:使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐(若画面和谐或 PS 技术足够,也可不用图生图),将合成后的图作为垫图(iw 2),mj 重新生图,如“prompt:垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 3. 绘本展示。
2024-11-15
文生图的 Prompt 模板
以下是关于文生图的 Prompt 模板的相关内容: 通常描述逻辑包括人物及主体特征(如服饰、发型发色、五官、表情、动作),场景特征(如室内室外、大场景、小细节),环境光照(如白天黑夜、特定时段、光、天空),画幅视角(如距离、人物比例、观察视角、镜头类型),画质(如高画质、高分辨率),画风(如插画、二次元、写实)。通过这些详细的提示词,能更精确地控制 Stable Diffusion 的绘图。 对于新手,有功能型辅助网站帮助书写提示词,如 http://www.atoolbox.net/ ,可通过选项卡方式快速填写关键词信息;https://ai.dawnmark.cn/ ,每种参数有缩略图参考,方便直观选择提示词。还可以去 C 站(https://civitai.com/)抄作业,复制每一张图的详细参数并粘贴到正向提示词栏,然后点击生成按钮下的第一个按键,不过要注意图像作者使用的大模型和 LORA,不然即使参数一样,生成的图也会不同,也可只取其中较好的描述词使用。 在 Tusiart 中,文生图的操作流程如下: 定主题:确定要生成的图的主题、风格和表达的信息。 选择基础模型 Checkpoint:找内容贴近主题的 checkpoint,如麦橘、墨幽的系列模型。 选择 lora:寻找内容重叠的 lora 控制图片效果及质量。 ControlNet:控制图片中特定的图像,如人物姿态、特定文字、艺术化二维码等。 设置 VAE:无脑选择 840000 。 Prompt 提示词:用英文写需求,单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 负向提示词 Negative Prompt:用英文写要避免的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:如选 DPM++ 2M Karras,留意 checkpoint 详情页上模型作者推荐的采样器。 采样次数:根据采样器特征,如选 DPM++ 2M Karras 采样次数在 30 40 之间。 尺寸:根据喜好和需求选择。 在一些提示词中,括号和“:1.2”等是用来增加权重的,权重越高在画面中体现越充分,提示词的先后顺序也会影响权重。同时还有反向提示词,告诉 AI 不要的内容。
2024-11-15
关于儿童绘本的Prompt
以下是关于儿童绘本的 Prompt 相关内容: 对于儿童故事读物,通常需要具备以下特点: 1. 语言简单易懂,使用简洁的语言和短句子,便于孩子理解和跟随故事情节。 2. 具有丰富的想象力,充满奇幻和想象,带有魔法、奇妙的生物和奇异的世界,激发孩子的创造力和想象力。 3. 包含教育意义,常包含道德教训或生活启示,帮助孩子理解基本价值观。 4. 拥有生动的角色,包括可爱的动物、勇敢的英雄、善良的公主等,以有趣的人物形象吸引孩子注意力。 5. 经常使用重复的句子或韵律感强的语言,增强记忆力和语言的音乐感。 6. 具备互动性,许多儿童故事设计为互动式,鼓励孩子参与情节发展。 7. 有明确的情节结构,故事情节简单明了,有清晰的开始、发展和结局,方便孩子跟随和理解。 8. 配有丰富的插图和图画,增强视觉吸引力,帮助孩子更好地理解和记忆故事内容。 在让 LLM 生成故事时,需要限定生成的内容主题、风格、适合人群等的 prompt,例如生成「漫画小书虫📚🐛」的相关故事,并按照格式返回文本内容,以方便后续对数据解析、配图。 此外,小七姐在 K12 领域应用中提到儿童 PBL 项目 Prompt,原始设计思路包括: 1. 作为家长,获取 10 个生活中可能的 PBL 项目主题。 2. 对感兴趣的主题进一步拓展 5 个相关主题。 3. 选择主题后,设计包含目标、项目周期、项目阶段和任务、项目评估的 PBL 项目。 4. 根据反馈优化项目。 5. 设计测试评估孩子在项目中的知识与能力、提升可能、学习风格和兴趣点。 6. 根据孩子的真实反馈设计个性化学习方案。 7. 明确家长在项目中承担的角色和提供的支持。 8. 写一封信吸引孩子参与家长设计的学习项目。 例如为一位特别喜欢识认汽车品牌、喜欢交通工具、挖掘机等工程机械车的 3 岁小朋友设计一个包含能练习中、英文的 PBL 项目式学习任务,包含项目目标、项目周期、项目阶段和任务、项目评估。 在提示简介中,提示是给 Claude 的用于引发相关输出的文本,通常以问题或指示的形式出现,Claude 回答的文本被称为“响应”,有时也被称为“输出”或“完成”。
2024-11-15
prompt是什么
Prompt 是您给 AI(如 Claude)的文本,用于引发相关输出,通常以问题或指示的形式出现。例如:“Why is the sky blue?” 它是一段指令,用于指挥 AI 生成您所需要的内容,每个单独的提示词叫 tag(关键词)。支持的语言为英语,emoji 也可以用。语法规则包括用英文半角符号逗号分隔 tag,改变 tag 权重有两种写法,还可以进行 tag 的步数控制。此外,prompt 是给到大模型输入的一段原始输入,能够帮助模型更好地理解用户的需求并按照特定的模式或规则进行响应。比如可以设定“假设你是一位医生,给出针对这种症状的建议”,然后后续对话会按照这个设定展开,还能在 prompt 的设定中要求模型按照一定的思路逻辑回答,如思维链(cot),也能让模型按照特定格式(如 json)输出,将模型变成输出器。
2024-11-14
我要用数字人AI做教学讲课
数字人 AI 用于教学讲课具有诸多优势: 1. 突破时空限制:可以让历史人物如牛顿亲自授课《牛顿运动定律》,白居易讲述《长恨歌》背后的故事,学生能与任何历史人物对话交流,不受时空约束。 2. 个性化教学:能根据学生的学习情况、兴趣和偏好提供定制化学习计划和资源,因材施教,提高学习效率和成果,缓解教育资源不平等问题。 3. 提高参与感:数字教师博学多能、善解人意且不受情绪左右,基本可实现一对一辅导,让学生参与感更高。 4. 丰富教学形式:如卡尔的 AI 沃茨的数字人课程,包含 15 节视频课,持续更新并增加最新内容,还有课外社群辅导。课程回顾了 2023 年数字人领域的破圈事件,如 AI 马斯克对谈 AI 乔布斯等。 5. 优化工作流:数字人的出现能在制作个人 IP 短视频、配音、直播、智能客服、虚拟偶像等领域完成赋能。 关于数字人课程的学习: 1. 推荐卡尔的 AI 沃茨的数字人课程,建立了完整的数字人学习体系。 2. 报名方式可通过扫码查看课程详细内容和介绍。 在与 AI 交互方面: 1. 对于提示词工程和学习提示词,有人持反对观点,认为像打字和写作一样,不断尝试和大模型交互是最佳方法。 2. 和大模型交互不一定需要遵循规则,未达成目的可锲而不舍地开新窗口再尝试,或更换模型。 3. 用 Markdown 格式清晰表达问题有助于提高与大模型交流的效率和精确性,其具有结构清晰、格式化强调、适用性广等优点。
2024-11-17
我现在是一个AI小白,我想学习AI相关知识,我要怎么进阶学习?
对于 AI 小白的进阶学习,您可以参考以下步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能、机器学习、深度学习等主要分支及其之间的联系。 浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅: 在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并争取获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,根据自身兴趣选择特定模块深入学习。 掌握提示词的技巧,因其上手容易且实用。 4. 实践和尝试: 理论学习后,通过实践巩固知识,尝试使用各种产品创作自己的作品。 分享实践后的经验和成果。 5. 体验 AI 产品: 与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式,获取实际应用中的体验,激发对 AI 潜力的认识。 同时,您还需要掌握以下基础知识: AI 背景知识: 基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等线性代数基本概念。 概率论:基础的概率论知识,如条件概率、贝叶斯定理。 算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:简介强化学习的基本概念。 评估和调优: 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习如何使用网格搜索等技术优化模型参数。 神经网络基础: 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。
2024-11-14
我要用Sd做图片细化,要怎么做?给出具体方法
以下是使用 SD 做图片细化的具体方法: 1. 对于更精确的蒙版,如人物的眼睛或配饰等,可使用 Segment Anything 中的 GroundingDINO。启用 GroundingDINO 后,AI 会自动下载模型,若没有魔法,可去云盘下载并放到指定文件目录下。在检测提示词中输入相关内容,如“eye”,AI 可自动检测并设置蒙版,还可通过预览箱体得到编号来选择调整单一部分。选择要修改的蒙版上传到重绘蒙版中,并添加提示词,如“闭眼”,点击生成即可完成修改。 2. 给人物换背景时,加载生成的背景蒙版。大模型选择 revAnimated_v122,正向提示词可设为“简单背景、花、国画、工笔”,蒙版模式选择“重绘非蒙版内容”。若头发部分没抠好,可将其放入图生图中,使用 tile 模型做整体细化,还能给人物衣服添加国风元素。 3. SD 扩图时,若原本图片尺寸为 1152x1152 需增高高度,可设置为(1152x1526)。ControlNet 设置方面,若无法识别处理,可采取以下措施:提高 ControlNet 的权重(增加预处理权重,降低引导介入时机直到为 0,增加引导终止时机直到为 1);降低重绘幅度(高清修复大图时使用);把原始的黑白二维码叠加在二维码上方(正片叠底,保留 4 个定位点,擦去其他地方),调节透明度;使劲抽卡。 4. SD 放大通常重绘幅度设置在 0.3 以下,使用 tile 模型时可提高重绘幅度,如保持重绘幅度为 1 放大 1.5 倍绘图,能加强画面细节且不崩坏。对于草图,可将其导入 ControlNet 中,添加提示词进行细化,还可通过改变控制模式和增加关键词来优化效果,如实现随机提示词转换,用提示词对参考图做出调整。
2024-11-09
我要按怎样的步骤学习AI
以下是学习 AI 的步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库查看大家实践后的作品、文章分享,并分享自己的实践成果。 5. 体验 AI 产品: 与现有的 AI 产品(如 ChatGPT、Kimi Chat、智谱、文心一言等)进行互动,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术(如机器学习、深度学习等)。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 为了在医疗保健中让 AI 产生真正的改变,应投资创建一个模型生态系统,让“专家”AI 像优秀的医生和药物开发者那样学习。成为顶尖人才通常从多年的密集信息输入开始,通过正规学校教育和学徒实践,从该领域出色的实践者那里学习,获得有助于在复杂情况下确定最佳答案的直觉。对于 AI,应通过使用彼此堆叠的模型来训练,而不是仅依靠大量数据和期望一个生成模型解决所有问题。例如,先训练生物学的模型,再是化学的模型,然后添加特定于医疗保健或药物设计的数据点。预医学生的课程从化学和生物学基础开始,设计新疗法的科学家也需要经历多年相关学习和研究,这种学习方式有助于培养处理涉及细微差别决策的直觉。
2024-11-08
我要怎么用waytoAGI学东西
WaytoAGI 是一个由热爱 AI 的专家和爱好者共同建设的开源 AI 知识库,具有以下功能和特点: 1. 学习途径:参加如 AJ 组织的 wayto AGI 活动,可以认识很多小伙伴和前辈,从中学习到很多 AI 相关知识。 2. 网站功能: 和 AI 知识库对话,可询问任何关于 AI 的问题。 提供集合的精选 AI 网站,按需求找到适合的工具。 集合精选的提示词,可复制到 AI 对话网站使用。 呈现知识库的精华内容。 3. 离谱村:是由 WaytoAGI 孵化的千人共创项目,参与者不分年龄层,都可以通过 AI 工具创作出各种作品。离谱村是一个没有被定义的地方,是灵魂的避风港,激励着人们发挥想象力,创造独特生活方式。 您可以通过参与相关活动、使用网站的各项功能以及参与离谱村的共创等方式,在 WaytoAGI 学习到丰富的 AI 知识。
2024-11-08
我要学习prompt,给我指定一个学习计划
以下是为您制定的学习 prompt 的计划: 一、准备阶段 首先,您需要拥有一个大模型账号,并熟悉与它们对话的方式。推荐使用性能较强的 ChatGPT4 ,国产平替有 。 二、基础学习 1. 阅读 OpenAI 的官方文档,包括: 同时,也可以参考我和熊猫 Jay 在 AGI 分享的中文精读版官方 Cookbook: 三、深入学习与实践 1. 学习 Claude 官方提示词,中文版(含 API Prompt),包括为给定主题创建全面的课程计划,如: 明确课程目标,使其清晰、可衡量,并与教育标准一致。 提供详细大纲,分为介绍、主要活动和总结,描述教学方法、学习活动和资源。 采用差异化策略适应不同学习需求和风格。 确定评估方法以评估学生的理解和掌握程度。 2. 进行苏格拉底式对话,就给定话题通过反复询问激发更深层次的思考和反思。 3. 针对给定主题生成同音连绵的词语和句子。 4. 掌握 Prompt 句式,例如: 对于“我想了解xxxx,我应该向你问哪些问题?”等句式,明确哪些是您不知道而 GPT 知道的。 对于“我理解的 xxx 是这样的,你觉得我的理解对吗?”等句式,进行认知的检验。 对于“我在 xxx 问题上遇到困难,你能提供一些可能的解决方案或建议吗?”等句式,实现认知的扩充。 希望这个学习计划对您有所帮助,祝您学习顺利!
2024-11-07
如何加入 WaytoAGI 社区群
如果您想加入 WaytoAGI 社区群,可以通过以下方式: 1. 填写问卷进群,群内会分享最新 AI 信息和社区活动。 2. 搜索微信号 Andywuwu07 或扫描二维码加微信,备注 AI 共学,以便被拉进免费的 AI Agent 共学群。 3. 飞书群内置 AI 智能机器人,可以回复任何与 AI 相关的问题。 4. 新手可以使用 Kimi 智能助手入门学习和体验 AI,PC 端可通过下载。 5. 如需下载研究报告,诚邀您加入知识星球:了解。
2024-11-11
介绍一下WaytoAGI
WaytoAGI 是由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库。 其特点和内容包括: 大家贡献并整合各种 AI 资源,使人们能轻松学习各类 AI 知识,应用 AI 工具和实战案例等。 知识库的内容覆盖 AI 绘画、AI 视频、AI 智能体、AI 3D 等多个版块,还包含赛事和活动以促进大家动手实践。 孵化了离谱村这个千人共创项目,让大家更轻松、更有兴趣地学习和接触 AI。 2023 年 4 月 26 日诞生,在没有任何推广的情况下,一年时间已有超过 70 万用户和超千万次的访问量。 您可以通过以下方式进一步了解: 即刻体验:https://waytoagi.com/ 更多详细介绍: 此外,还有一些相关的内容,如: 放几个有意思的视频:离谱村、春晚、24 节气、 关键词学社:
2024-11-07
runway,视频模型对比
以下是关于 Runway 视频模型的相关信息: OpenAI 的 Sora 与 Runway 的对比: OpenAI 刚刚发布的首款文生视频模型 Sora 表现出色,能根据文字指令创造逼真且充满想象力的场景,生成长达 1 分钟的一镜到底超长视频,视频中的人物和背景具有惊人的一致性和稳定性。而 Runway Gen 2、Pika 等 AI 视频工具在几秒内的连贯性上还在突破,相比之下 OpenAI 达到了史诗级的纪录。 Runway 的特点: 优势: 拥有强大的底层模型,能理解复杂需求并转化为高质量视频输出。 生成的视频在画面清晰度、动作流畅性和内容连贯性上达到较高水准,满足普通用户和专业创作者需求。 团队持续进行技术迭代和更新,保持在视频 AI 技术前沿。 不足: 共用账号或生成特别好的视频时,生成队列相对较短,使用高峰期可能需等待。 某些时段生成速度可能变慢。 Runway 的其他信息: 由总部位于旧金山的 AI 创业公司制作,2023 年初推出的 Gen2 代表了当前 AI 视频领域前沿模型,能通过文字、图片等方式生成 4 秒左右的视频。 致力于专业视频剪辑领域的 AI 体验,同时扩展图片 AI 领域能力。 支持在网页、iOS 访问,网页端有 125 积分的免费试用额度(可生成约 105 秒视频),iOS 有 200 多,两端额度不同步。官方网站:https://runwayml.com/ Gen1 和 Gen2 的区别和使用方法:Gen1 的主要能力有视频生视频、视频风格化、故事版、遮罩等,仅支持视频生视频是 Gen1 和 Gen2 的最大差异。Gen1 使用流程可参考:https://research.runwayml.com/gen1 、https://help.runwayml.com/hc/enus/articles/15161225169171 ,也可通过视频 https://youtu.be/I4OeYcYf0Sc 学习详细设置方式。
2024-11-06
Wayto AGI的功能
WaytoAGI 具有以下功能: 1. 与 AI 知识库对话:您可以在此询问任何关于 AI 的问题。 2. AI 网站:集合了精选的 AI 网站,可按需求找到适合您的工具。 3. AI 提示词:集合了精选的提示词,能复制到 AI 对话网站使用。 4. 知识库精选:将每天知识库的精华内容呈现给大家。 WaytoAGI 是一个由开发者、学者和有志人士等参与的学习社区和开源的 AI 知识库。它不仅是一个知识库,还是连接学习者、实践者和创新者的社区,让大家在这里碰撞思想,相互鼓舞,一同成长。 此外,WaytoAGI 里有个离谱村,这是由 WaytoAGI 孵化的千人共创项目,能让大家学习和接触 AI 更轻松、更有趣。参与者不分年龄层,都可以通过 AI 工具快速简单地创作出各种各样的作品。离谱村是一个没有被定义的地方,在这里,想象力是至高无上的法则,奇迹是日常生活的一部分。
2024-11-06