Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

你和GPT4o、MJ、suno有什么区别呢

Answer

GPT-4o 能快速返回答案,但可能存在错误且无法自动纠错。

o1 推理模型在给出最终结果前会反复推演和验证,耗时更长但结果更准确,o1 Pro 计算时间更长,推理能力更强,适合复杂问题。

MJ (Midjourney)是一款专注于生成图像的工具。

Suno 相关的特点未在提供的内容中有明确提及。

由于不清楚您提到的“Suno”的具体情况,无法给出更详细的对比。但总体来说,不同的工具在功能、性能、适用场景等方面存在差异。

Content generated by AI large model, please carefully verify (powered by aily)

References

宝玉 日报

亮点:AI生成图片时可加入中文文字,提升应用场景多样性。示例场景:教孩子古诗时生成配图加文字,让学习更有趣。春节生成春联配图,增加节日氛围。制作漫画、梗图等内容,释放创意潜力。**关键点:**文生图支持文字后,AI创作更关注想象力而非技术。🔗[https://x.com/dotey/status/1864975649430966362](https://x.com/dotey/status/1864975649430966362)5⃣️🤖o1推理模型:从“快思考”到“慢思考”特性:o1模型在给出最终结果前会反复推演和验证,就像围棋高手在算棋。区别:GPT-4o:快速返回答案,但可能错误,且无法自动纠错。o1:支持回溯推理,耗时更长但结果更准确。o1 Pro:计算时间更长,推理能力更强,适合复杂问题。应用案例:o1 Pro成功完成《纽约时报》“Connections”文字游戏,这曾是GPT-4o无法解决的任务。**趋势:**未来算力的重点将从训练模型转向增强推理能力。🔗[https://x.com/dotey/status/1865890371722440734](https://x.com/dotey/status/1865890371722440734)6⃣️🎥OpenAI发布会:Sora v2功能公布新版亮点:生成1分钟长度的视频。支持文字转视频、文字加图片转视频、文字加视频转视频。提升多媒体创作灵活性,为用户提供更多创意选择。

Others are asking
免费试用chatgpt4o
ChatGPT 4o 于 5 月 13 日发布后引起热潮,目前 ChatGPT 官网有 3 个版本,分别是 GPT3.5、GPT4 和 ChatGPT 4o。发布会上称 ChatGPT 4o 可以免费体验,但次数有限。 GPT3.5 为免费版本,拥有 GPT 账号即可使用,但其智能程度不如 GPT4o,且无法使用 DALL.E3 等插件。ChatGPT 3.5 的知识更新到 2022 年 1 月,ChatGPT 4o 的知识更新到 2023 年 10 月,ChatGPT 4 则更新到 2023 年 12 月。 想要更多功能更智能的 GPT4o 需升级到 PLUS 套餐,收费标准为 20 美金一个月,GPT4 还有团队版和企业版,费用更贵,一般推荐使用 PLUS 套餐。 以下是安卓系统安装、订阅 GPT4 的教程: 1. 安装 Google Play:到小米自带的应用商店搜索 Google Play 进行安装,安装好后打开,按提示登录。 2. 下载安装 ChatGPT:在谷歌商店搜索“ChatGPT”进行下载安装,开发者是 OpenAI。可能会遇到“google play 未在您所在的地区提供此应用”的问题,可通过在 Google Play 点按右上角的个人资料图标,依次点按:设置>常规>帐号和设备偏好设置>国家/地区和个人资料,添加国内双币信用卡,地区选美。若仍搜不到,可卸载重装 Google Play 并保持梯子的 IP 一直是美。 3. 体验 ChatGPT:若只想体验 ChatGPT 3.5 版本,不升级 GPT4,直接登录第二部注册好的 ChatGPT 账号即可。 4. 订阅 GPT4 Plus 版本:先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡,然后在 ChatGPT 里订阅 Plus。
2024-11-19
gpt4o视觉模型
GPT4o 是 OpenAI 推出的模型。开发人员现在可在 API 中将其作为文本和视觉模型进行访问。与 GPT4 Turbo 相比,具有速度快 2 倍、价格减半、速率限制高出 5 倍的优势。未来几周计划向 API 中的一小群受信任的合作伙伴推出对其新音频和视频功能的支持。 GPT4o(“o”代表“omni”)是迈向更自然人机交互的一步,能接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出的任意组合。它在 232 毫秒内可响应音频输入,平均为 320 毫秒,与人类响应时间相似。在英语文本和代码上的 GPT4 Turbo 性能相匹配,在非英语语言的文本上有显著改进,在 API 中更快且便宜 50%,在视觉和音频理解方面表现出色。 在 GPT4o 之前,语音模式由三个独立模型组成的管道实现,存在信息丢失等问题。而 GPT4o 是在文本、视觉和音频上端到端训练的新模型,所有输入和输出都由同一个神经网络处理,但对其能做什么及局限性仍在探索。
2024-11-14
GPT4o能免费用几次
ChatGPT 4o 可以免费体验,但免费体验次数很有限。截至 2024 年 5 月 13 日,Plus 用户在 GPT4o 上每 3 小时最多发送 80 条消息。免费套餐的用户将默认使用 GPT4o,且使用 GPT4o 发送的消息数量受到限制,具体数量会根据当前的使用情况和需求而有所不同。当不可用时,免费层用户将切换回 GPT3.5。
2024-10-26
chatgpt4o免费的模型和付费的模型有什么区别
ChatGPT 免费的模型(如 GPT3.5)和付费的模型(如 GPT4o 的 PLUS 套餐)主要有以下区别: 1. 知识更新时间:ChatGPT 3.5 的知识更新到 2022 年 1 月,ChatGPT 4o 的知识更新到 2023 年 10 月,而 ChatGPT 4 更新到 2023 年 12 月。 2. 智能程度:GPT3.5 的智能程度明显低于 GPT4o。 3. 功能:GPT3.5 无法使用 DALL.E3(AI 画图功能)、GPTs 商店和高级数据分析等插件。 4. 费用:想要使用更多功能更智能的 GPT4o 需要升级到 PLUS 套餐,收费标准是 20 美金一个月。GPT4 还有团队版企业版,费用更贵,一般推荐使用 PLUS 套餐即可。 此外,ChatGPT 4o 发布后,虽称可免费体验,但免费体验次数很有限。
2024-10-26
如何连接GPT4o
以下是连接 GPT4o 的方法: 1. 对于 ChatGPT Mac 客户端: 下载地址:persistent.oaistatic.com/sidekick/public/ChatGPT_Desktop_public_latest.dmg 使用 Proxyman、Charles 或您喜欢的网络代理来进行以下操作(需要有 ChatGPT 付费账号,以及网络技术基础):以 ProxyMan 为例 登录一次以触发 API 调用 对 ChatGPT 的 App 启用 SSL 代理(需要配置好 ProxyMan 证书) 再登录一次以触发 API 调用 然后右键点击 ab.chatgpt.com/v1/initialize 选择本地映射,并将所有的 false 替换为 true 再尝试一次,您就应该能顺利登录了。 详细版图文教程: 2. 对于安卓系统: 先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡 然后在区 chatgpt 里订阅 Plus,操作如下截图 完成后即可开始使用 ChatGPT 4o
2024-08-18
gpt4o mini有关的文档
以下是关于 GPT4o mini 的相关文档信息: Open AI 发布了 GPT4o mini 模型。其 MMLU 得分为 82%,碾压其他同级别小模型。价格较低,为 0.15 美元/100 万 token 输入和 0.6 美元/100 万 token 输出,比 GPT3.5 Turbo 便宜超过 60%。具有 128k 的大上下文窗口,非常适合 RAG。GPT4o mini 在 API 中支持文本和图片,未来将支持文本、图像、视频和音频输入和输出。GPT4o mini 接替 3.5 成为 ChatGPT 中的免费模型,目前还不支持多模态,而且 4o mini 的 API 一旦涉及到图片 Token 数量也会大增。
2024-08-17
mj如何指定生成16:9的图
要在 Midjourney(MJ)中指定生成 16:9 的图,可以按照以下步骤操作: 1. 首先复制图片的网址,然后打开 discord,在聊天栏输入“/imagine prompt”。 2. 回到官网,复制图像的提示词,再回到 discord 粘贴到刚才拷贝的网址后面,注意空一格。 3. 生成图像后,放大觉得还不错的一张,点击“Custom Zoom”。 4. 此时可以改变拉伸镜头后的画面比例,将“ar”这个参数后面的数值改成 16:9(默认的方形构图这里是 1:1),“zoom”参数设置为 1.5。“zoom”参数是镜头拉伸的倍数,1.5 1.7 比较靠谱,太大(比如 2)会有更大几率生成一些莫名其妙的东西。 5. 选一张比较好的放大一下,就可以放进 PPT 调整构图。如果构图还是不太好,可以在当前这张图的基础上再用一次“Zoom Out 1.5x”。 另外,在 Pika 中使用 MJ 生成图片时,默认的照片幅度是 16:9。在使用 MJ 进行图生图功能时,要注意截图的对标比例未必是标准的 9:16,可以手动修改一下比例,以省去一些返工的情况。
2024-12-17
请问我该在知识库的 哪里找到MJ的提示词库
以下是关于 MJ 提示词库的相关信息: MidJourney 200 条风格词汇: 《》 @TheMouseCrypto 发表了一份 200 条风格词汇整理,页数是 77 页,很全的宝典。 Prompt 网站精选(图像类 Prompt 网站): MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库, MidJourney Prompt Tool:类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分, OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便你快速可视化生成自己的绘画提示词, AIart 魔法生成器:中文版的艺术作品 Prompt 生成器, IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器, Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT & Midjourney, OpenArt:AI 人工智能图像生成器, img2prompt:根据图片提取 Prompt, MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用, PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板, AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格供你选择, MJ 的随机种子库收集: 使用方法: 输入提示词 + sref random ar 1:1,可获得随机风格种子和图片。 测试风格种子的泛用性:{a girl,a boy,animals,plants,environment}sref 同一个风格种子
2024-12-08
照片使用mj做风格转化
以下是利用 Midjourney 进行照片风格转化的详细教程: 一、角色一致性 1. 得益于 cref,Midjourney 能够迅速达成角色一致性的目的而无需 Lora。其中,cref 代表 character reference(角色参考);cw 则代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。如果只想关注人脸,请调低到 0。 2. 不需要对角色原图使用 /describe 来贴近目标生成角色的形象,因为 cref 会帮完成这件事情。 3. 风格复制和服装的替换,应当用提示词(prompt)和 sref,默认值 100,越高越接近参考图像的风格。 二、解决“形似而神不似”问题 1. 用醒图(英文版叫做 hypic)或者美图秀秀等 App 调整脸部,拖拖修图进度条就好。如果用醒图,建议关注【人像>面部重塑>面部>比例】,调整上庭、中庭、下庭。 2. 对于照片转绘为 Minecraft 这种风格幅度变化很大的情况,如果发现 sw 风格权重拉满仍复制不了像素小人风格,可能是 cw 太高,调低 cw 可能成功复制。 三、其他补充 1. cref 和 sref 还可以同时参考多张 url,但上传同一个人不同角度的照片,容易导致形状畸形。 2. 如果 MJ 直出的皮肤缺乏质感(过于光滑),可以打开醒图【人像>手动美颜>皮肤肌理】。 3. 如果想快速调整光源但又不想学 PS,可以试试 Luminar。 四、sref 相关 1. Midjourney v6 版本提供“风格一致性”的功能,用户给 mj 输入一幅图像,mj 根据这幅图像的风格进行创作。 2. 使用指令:垫图链接+关键词+ “sref” +图片链接+风格化参数+ “v 6.0”。指令:url +关键词+ “sref” + url + “sw” + “v 6.0”。sw 风格化参数用于控制整体的风格强度,默认为 100,数值范围为。参考多张图像风格时,url 间使用空格隔开,权重代表不同参考风格的权重。 3. sref 模仿图片风格,垫图模仿图片结构、元素。 生成 url 时,准备一张照片(可以使用 AI 生成一张人物图像代替真人)和想要的写真风格参考图片。Prompt:垫图 url + Chinese female model,upper body,clothes with collars,bright space natural pose,big earrings,Chinese traditional minimalism,flat illustration,geometric shapes,minimalism niji 6 ar 3:4 sw 200 sref url
2024-12-05
用 mj 做文生图,Prompt 模板
以下是使用 MJ 进行文生图的 Prompt 模板: 1. 定主题:明确您需要生成一张什么主题、什么风格、表达什么信息的图。 2. 选择基础模型 Checkpoint:按照主题,找内容贴近的 checkpoint。一般喜欢用模型大佬麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等,效果较好。 3. 选择 lora:在想要生成的内容基础上,寻找内容重叠的 lora,以控制图片效果及质量。可多参考广场上好看的帖子中使用的 lora。 4. ControlNet:用于控制图片中特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能,可后续学习。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语的组合,不用管语法,单词、短语之间用英文半角逗号隔开。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。 9. 采样算法:较复杂,一般选 DPM++ 2M Karras 较多。最稳妥的是留意 checkpoint 的详情页上模型作者是否有推荐采样器,使用推荐的采样器更有保障。 10. 采样次数:根据采样器特征,选 DPM++ 2M Karras 后,采样次数一般在 30 40 之间,多了意义不大且慢,少了出图效果差。 11. 尺寸:根据个人喜好和需求选择。 另外,使用 Stability AI 基于 Discord 的媒体生成和编辑工具进行文生图时: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 2. 进入 ARTISAN 频道,任意选择一个频道。 3. 输入/dream 会提示没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。 4. 输入/dream 提示词,这部分和 MJ 类似。 5. 和 MJ 手工输入参数不同,可选参数有五类: prompt:提示词,正常文字输入,必填项。 negative_prompt:负面提示词,填写负面提示词,选填项。 seed:种子值,可以自己填,选填项。 aspect:长宽比,选填项。 model:模型选择,SD3,Core 两种可选,选填项。 Images:张数,1 4 张,选填项。完成后选择其中一张。 在 MJ 应用篇儿童绘本制作、人物一致性方面: 1. 生成人物图片:确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 mj 中生成直到得到满意的人物图像。垫图 URL + “In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,取 iw 2 。 2. 合成人物和场景,垫图并重新生成:使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐(若画面和谐或 PS 技术足够,也可不用图生图),将合成后的图作为垫图(iw 2),mj 重新生图,如“prompt:垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 3. 绘本展示。
2024-11-15
有和mj差不多的网站吗
以下是一些和 Midjourney 类似的网站: 1. Stable Diffusion:是一种可根据文本生成图像的人工智能程序。 2. DALL·E2:能够根据输入的描述生成逼真的图像。 Midjourney 是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像,于 2022 年 7 月 12 日进入公开测试阶段,用户可透过 Discord 的机器人指令进行操作创作图像作品。通过 Discord 的社区属性,它具有更轻量的产品形态、更简单的生图方式,且图片质量很高。MJ 具备更简单的交互,更直观的生成、放大、保留、分享功能,如果愿意购买更高级的服务,甚至可以享受更快速、更强大的增值服务。 Midjourney 官网现已向生成 100 张以上图片的用户开放了使用权限,登录 MJ 官网,左侧为各种页面入口,顶部是生成入口(prompt 框)和搜索框。在社区作品、创作(Create)以及组织(Organize)页面中,可随时使用 prompt 框和搜索框,方便查找参考和进行创作,无需频繁切换页面。还可以通过点击 prompt 框最右侧的图标来设置常用参数的默认值,包括画面比例和个性化模型开关。在官网上使用图片参考也变得简单直观,只需要点击 prompt 框最左侧的图片按钮,或直接拖入图片即可,并且官网会记录所有使用过的图片,方便调用或删除。当鼠标悬停在图片上时,会看到 3 个小图标,从左到右分别是角色参考、风格参考、整图参考,点击相应的图标即可,如需多种参考逻辑可按住 shift 键点选多个图标。创作页面最大亮点是 prompt 的复用,可以直接点击画面描述或复制描述词到 prompt 框中,也可以直接点击下方横列菜单里的按钮,将包括参考图在内的完整 prompt 替换当前的 prompt。点击图片则会进入单图调整模式,在 discord 中常用的操作指令都被集中在了右下角的按键中,并且上线了全新的 Editor 编辑器功能。 另外,MJ 官网更新了,刷图超过 1000 张的就可以用 alpha 版本了。可以不用在 discord 服务器生图了,官网操作更方便,很多参数直接可以控制。前几天还是需要 10000 张才可以,门槛降低了,过两天估计可以全量开放了。在官网上可以看各种排行榜和厉害的作品,右键也新增了很多功能,不错的作品也容易被发现,还有提示词可以直接复制。
2024-11-14
mj如何保持人物一致性
在 MJ 中保持人物一致性可以按照以下步骤进行: 1. 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 2. 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 iw 取值范围为,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,建议取 iw 2。 3. 确定图片角色一致性: 在得到构图相同后,利用 MJ 重绘功能,对画面进行局部重绘。在重绘提示词里输入 cref cw 来保证角色一致性。cref 所垫图还是用的是刚才一张图,因为第一张图有两个内容我们都要拿:构图、人物。 若出现黑边,将黑边部分框住,重绘输入关键词“background”就能去除黑边,保证背景一致。 需要注意的是,由于 MJ 不可控因素,相较于保证人物位置,先保证构图会容易很多。因为 MJ 在重绘时,如果要将一个角色从镜头一个位置挪到另外一个指定位置,非常难处理。整个 MJ 出图基本也是靠降噪重绘,固定位置重绘局部内容会比改变整个画面结构容易很多。这就好比美术课画画,给一张参考图,一个是把背景风格都做好了,让在固定位置添加内容,另一个是将整个页面内容全部重绘,还要保证画面的主题内容要和参考图一样,相比之下后者的随机性会大非常多(抽卡次数也会很多)。 在生成人物图片时,先确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 mj 中生成直到得到一张满意的人物图像。为了确保人物一致性,取 iw 2 。然后可以使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),mj 重新生图。
2024-11-02
Suno教程
以下是关于 Suno 教程的相关内容: Suno 是一家研究驱动型的人工智能公司,其专门研发的生成式 AI 模型为创意工作者提供强大的创作工具。公司推出的 Chirp 模型,通过文字描述就能实现逼真的音乐和声音效果,包括配乐、人声、音效等,可广泛用于游戏、短视频、播客等领域。 去年制作过一期 Discord 版本的 Suno 操作教程(Suno 操作指北 V1),但一些知识点解释的不清楚,可能对新手玩家不够友好,而且官方在 Web 上推出 Chirp V2 版本模型后,之前的一些操作方式也迭代了,所以最近重新整理了一份新的教程(Suno 操作指北 V2)。 目前,Chirp V2 版本模型的最大生成时长为 1 分 20 秒,延续的最大生成时长为 60 秒。 在使用 Suno 生成音乐时,和大语言模型一样具有很强的随机性,输入(prompt/tag)质量往往决定输出(生成音乐)质量,在自定义模式(Custom Mode)下,有音乐风格(Style of Music)与歌词(Lyrics)两个主要的输入窗口。音乐风格窗口需要填写一些 tag 来描述整首音乐的风格和感觉,多个 tag 之间用“,”进行分隔,可识别的 tag 包括音乐类型/流派、人声/乐器、情绪/氛围、节奏、场景、混响、其他和声/音效等。 相关教程链接: PS:以下内容需要科学上网,请自行解决。
2024-12-22
我想看suno操作指北
以下是 Suno 的操作指北: 1. 注册官方地址加入 discord。 2. 在消息栏输入/chirp。 3. 按下 Enter,将出现一个弹出窗口。 4. 输入您歌曲风格以及歌词到对应框中,或者在 Chirp 提供的 ChatGPT 框中输入关键词让 AI 帮您生成。 5. 点击提交。 Chirp 操作: Chirp v1 更新了类型描述窗口。提交完成后,等待 2 3 分钟,即可生成两个示例音频,目前 Chirp 最多可生成 40 秒的音频。 生成的两个示例音频,如果您喜欢第一个,就点击⏩Continue 1,Chirp 就会弹出 Continue 窗口,您可以继续填入您想要的歌曲风格和歌词,点击提交,Chirp 会根据您的提示生成新的两个示例音频。 如果您觉得生成的两个音频不满意,可以点击🔁,Chirp 会弹出窗口提供修改,点击提交即可生成新的两个示例音频。 当您延续生成足够多的音频,想要将它们连接起来生成一个完整的音频,可以点击最后想要的音频所对应的❤️,Chirp 会自动帮您剪接之前所选的音频并生成完整音频,这个过程不需要消耗次数。 延续音频流程:/Chirp 输入→⏩Continue→⏩Continue→❤️
2024-11-24
有没有suno相关的学习资料
以下是关于 Suno 的学习资料: 音乐生成使用了 Suno,相关教程可参考 Keen 和陈浚嘉的这两篇: Suno 网址: 优点:回答问题更准确、上下文的衔接更好。 限制:需要🪜,需要邮箱注册。 时间:10 min。 价格:每日有免费额度 10 首歌。 Custom Mode:开启为自己有歌词,关闭则给你随机生成歌词,你只要填描述。 Lyrics:直接填歌词即可,可以用熟悉的、喜欢的歌曲原词先感受一下产品功能,会有对比性。 Instrumental:不要歌词、直接出纯音乐的曲子。 Style of Music:写 Prompt 的地方,1 句简短的自然语言描述即可,注意最多 100 字符。 此外,还有可供参考。在自定义模式(Custom Mode)下,有两个主要的输入窗口:音乐风格(Style of Music)与歌词(Lyrics)。音乐风格(Style of Music)需要填写一些 tag 来描述整首音乐的风格和感觉,多个 tag 之间用“,”进行分隔。根据 Suno 的官方文档和测试,可以识别的 tag 包括音乐类型/流派、人声/乐器、情绪/氛围、节奏、场景、混响、其他和声/音效等。
2024-11-24
suno提示词怎么写
以下是关于 Suno 提示词的写法: 在创作“离谱村”时,先收到台词素材和配音,构思出“童趣”“欢乐”等词,让 AJ 提出活泼、离谱搞笑的方向。然后把台词和想到的形容词投喂给 GPT4 生成音乐脚本,再将脚本输入给 SunoBeats 生成提示词。但最初生成的提示词太长,之后参考论坛网友分享的格式,即通过调式变化加上情节描述,使用和弦进展推动故事情节发展,让 SunoBeats 模仿这种格式生成提示词,测试发现这种格式的提示词质量更好、利用率更高。 推荐的写法可参考详细教程,如。 Suno 创作音乐的小技巧:如果想参考现有歌曲的节奏,可以在(引子)来更好地告诉 AI 这段歌词应该怎么唱。
2024-11-13
SUNO下载
以下是关于 SUNO 下载的相关信息: Suno 是一款强大的 AI 驱动歌曲生成器,被誉为音乐界的 ChatGPT,能够根据简单提示创造出完整音乐作品。 地址:https://www.suno.ai/ 账号要求:需要拥有 Discord、谷歌或微软中的至少一个账号,并确保网络环境稳定。 订阅信息: 免费用户:每天 50 积分,每首歌消耗 5 积分,每天可创作 10 首歌曲,每次点击生成两首歌曲。 Pro 用户:每月 2500 点数(约 500 首歌),按月 10 美元,按年 8 美元/月,96 美元/年。 Premier 用户:每月 10000 点数(约 2000 首歌),按月 30 美元,按年 24 美元/月,288 美元/年。 点击 Create 有两种模式: 默认模式:关闭个性化,可进行歌曲描述、乐器开关、模型选择 v3 等操作。 个性化模式:开启个性化定制,可填写歌词、曲风、标题等。 生成歌词:可使用大模型如 Kimi、GPT、文心一言等帮助生成。 开始生成:填写好所需内容后,点击 Create,等待 2 3 分钟即可。 下载: Suno 新功能“Suno Scenes”可通过照片或视频生成独特音乐,目前只有 iOS 客户端,且系统版本需升级到 17.0+,下载需要使用美国 ID 并在美国 IP 环境下体验。更新/安装客户端:suno.com/ios 。 网址:https://suno.com/create ,优点是回答问题更准确、上下文衔接更好,限制是需要翻墙和邮箱注册,每日有免费额度 10 首歌。Custom Mode 开启为自己有歌词,关闭则随机生成歌词,只要填描述。Instrumental 可出纯音乐曲子,Style of Music 用简短自然语言描述(最多 100 字符)。
2024-10-30
suno教程
以下是关于 Suno 的教程信息: Suno 是一家研究驱动型的人工智能公司,其专门研发的生成式 AI 模型为创意工作者提供强大的创作工具。公司推出的 Chirp 模型,通过文字描述就能实现逼真的音乐和声音效果,包括配乐、人声、音效等,可广泛用于游戏、短视频、播客等领域。 目前,Chirp V2 版本模型的最大生成时长为 1 分 20 秒,延续的最大生成时长为 60 秒。 去年制作过一期 Discord 版本的 Suno 操作教程。 在自定义模式(Custom Mode)下,有两个主要的输入窗口:音乐风格(Style of Music)与歌词(Lyrics)。音乐风格(Style of Music)需要填写一些 tag 来描述整首音乐的风格和感觉,多个 tag 之间用“,”进行分隔。根据 Suno 的官方文档和测试,可以识别的 tag 包括音乐类型/流派、人声/乐器、情绪/氛围、节奏、场景、混响、其他和声/音效等。 音乐生成使用 Suno 时,和大语言模型一样具有很强的随机性,并且输入(prompt/tag)质量往往决定了输出(生成音乐)质量,想要避免无谓的抽卡,让生成结果无限地靠近自己的想法,就需要使用一些提示词技巧。 您可以通过以下链接获取更多相关内容: PS:使用以下内容需要科学上网,请自行解决。此外,还建立了一个微信群【通往 AI 音乐之路】,可以填写问卷:https://waytoagi.feishu.cn/share/base/form/shrcnuLtIpBNzE5bcQtZbS8UEjh 或添加 AJ(微信号 AAAAAAAJ)备注您的音乐成就,拉您进群。右侧可以扫码关注公众号“智音 Brook”,方便更充分的探讨交流。
2024-10-16
你和gpt4有什么区别
以下是关于我和 GPT4 的一些区别: 1. 在数学能力方面,GPT4 可能在比数学数据更多的代码上进行训练。相对于 ChatGPT,GPT4 在许多复杂数学问题中展示出更深入的理解,并能够应用适当的推理,而 ChatGPT 通常采用低级启发式方法,缺乏实际理解。 2. 在处理复杂约束及追问任务时,GPT4 不会像 GPT4o 那样首先主动询问用户的背景信息来判断提问意图。 3. 在局限性方面,GPT4 通常缺乏对 2021 年 9 月后发生事件的了解,不会从经验中学习,有时会犯简单推理错误,过于轻信用户虚假陈述,可能在预测中自信犯错且不注意复查工作。预训练模型高度校准,但后训练过程中校准度降低,其输出存在各种偏差。
2024-12-26
chatAI与chatGPT有区别吗
ChatAI 并非一个明确且被广泛认知的特定概念。而 ChatGPT 具有明确的定义和特点: 从 OpenAI 的官网可知,ChatGPT 在 2022 年宣发时被称为一种模型,但在官网的帮助页面中又被称为一种服务。目前我们所熟知的 ChatGPT 逐渐演变成了一种可以兼容多种 GPT 模型的聊天应用(服务)。 与更注重人格属性,试图满足社交、情感、陪伴等需求。 与 Pi 相比,Pi 优先考虑与人的对话,评价标准在于对话自不自然、情商够不够高,而 ChatGPT 在某些情况下给出的建议相对泛泛。在机制设置上,Pi 采取提问式结尾、不断主动追问的方式更有让人聊下去的欲望。
2024-12-25
comfyui和dify有什么区别?分别适合什么场景?
ComfyUI 和 Dify 的区别主要体现在以下方面: 1. 用户界面:SD WebUI 的 UI 更像传统产品,有很多输入框和按钮;ComfyUI 的 UI 界面复杂,有很多方块和复杂的连线。 2. 学习成本:ComfyUI 的学习成本比 SD WebUI 高。 3. 工作流方式:ComfyUI 采用连线搭建自动化工作流的方式,从左到右依次运行,通过改变节点可实现不同功能,如一个节点是直接加载图片,另一个是通过画板绘制图片,从而实现导入图片生图或绘图生图等不同功能。 适用场景: ComfyUI 因其自由和拓展性,适合以下场景: 1. 用户可以根据自身需求搭建适合自己的工作流,无需依赖开发者。 2. 能够根据需求开发并改造某个节点,从而调整使其切合自己的工作流甚至改造工作流。 Dify 方面的具体适用场景未在提供的内容中有明确提及。
2024-12-23
flux和sdXL出图的区别
Flux 和 SDXL 出图主要有以下区别: 1. 生成人物外观:Flux 存在女生脸油光满面、下巴等相同外观问题,而 SDXL 相对在这方面有改进。 2. 模型构成:SDXL 由 base 基础模型和 refiner 优化模型两个模型构成,能更有针对性地优化出图质量;Flux 中 Dev/Schnell 是从专业版中提取出来,导致多样性丧失。 3. 处理方式:在低显存运行时,可采用先使用 Flux 模型进行初始生成,再用 SDXL 放大的分阶段处理方式,有效控制显存使用。 4. 模型参数和分辨率:SDXL 的 base 模型参数数量为 35 亿,refiner 模型参数数量为 66 亿,总容量达 13G 之多,基于 10241024 的图片进行训练,可直接生成 1000 分辨率以上的图片,拥有更清晰的图像和更丰富的细节;而 Flux 在这方面相对较弱。
2024-12-20
flux和sd3.5出图的区别
Flux 和 SD3.5 出图存在以下区别: 1. 模型性质:Flux.1 有多种版本,如开源不可商用的 FLUX.1等。而 SD3.5 未提及相关性质。 2. 训练参数:Flux.1 的训练参数高达 120 亿,远超 SD3 Medium 的 20 亿。 3. 图像质量和提示词遵循能力:Flux.1 在图像质量、提示词跟随、尺寸适应、排版和输出多样性等方面超越了一些流行模型,如 Midjourney v6.0、DALL·E 3和 SD3Ultra 等。 4. 应用场景:Flux.1 可以在 Replicate 或 fal.ai 等平台上试用,支持在 Replicate、fal.ai 和 Comfy UI 等平台上使用,并且支持用户根据自己的数据集进行微调以生成特定风格或主题的图像。而 SD3.5 未提及相关应用场景。 5. 本地运行:文中尝试了在没有 N 卡,不使用复杂工作流搭建工具的 Mac Mini M1 上运行 FLUX.1,以及在边缘设备 Raspberry PI5B 上运行的情况,未提及 SD3.5 的相关内容。 6. 模型安装部署:对于 Flux.1,不同版本的模型下载后放置的位置不同,如 FLUX.1应放在 ComfyUI/models/unet/文件夹中。而 SD3.5 未提及相关安装部署内容。 7. 显存处理:对于 Flux.1,如果爆显存,“UNET 加载器”节点中的 weight_dtype 可以控制模型中权重使用的数据类型,设置为 fp8 可降低显存使用量,但可能会稍微降低质量。而 SD3.5 未提及相关显存处理内容。 8. 提示词使用:在训练 Flux 时,应尽量使用长提示词或自然语言,避免使用短提示词,因为 T5 自带 50%的删标。而 SD3.5 未提及相关提示词使用内容。
2024-12-20
WaytoAGI和豆包有什么区别
WaytoAGI 和豆包有以下一些区别: 1. 性质和定位不同:WaytoAGI 是一个提供多种 AI 相关功能的网站,包括和 AI 知识库对话、集合精选的 AI 网站、提供 AI 提示词、呈现知识库精选等。而豆包是一个专注于为用户提供语言交互服务和知识解答的智能助手。 2. 运营模式不同:有人将 WaytoAGI 与李一舟进行对比,李一舟选择的是内容商业化,而 WaytoAGI 选择的是内容开源,体现了“坦诚、无私、热情、互助”的精神,这是理想主义和商业化的区别。 3. 服务方式不同:WaytoAGI 通过网站的各种功能模块为用户服务,而豆包主要通过语言交流为用户提供帮助。 需要注意的是,两者在服务用户、促进对 AI 的了解和应用方面都有各自的价值和作用。
2024-12-19