Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

“GPT-4o”是什么软件,可以给ai生图提示词

Answer

GPT-4o 是 OpenAI 新推出的产品。 其具有以下特点和功能:

  1. 协作写作与编程新体验:提供写作方面的建议编辑、调整文章长度和阅读级别、添加表情符号、语法润色等功能;在编程方面,让用户轻松跟踪代码修改,支持代码审查、错误修复、添加注释、以及多语言代码移植。
  2. ChatGPT Plus 和 Team 用户可立即使用,企业和教育版用户下周开放,计划后续向免费用户推出。
  3. 在一些测试中展现出不同的能力,如文本理解能力更强、一次性出 10 个分镜速度极快等,但也存在一些不足,例如中文画图能力有限、某些任务的实际效果不太理想等。

关于 GPT-4o 的提示词优化技巧:

  1. 在 Playground 的 API 策略中,通过在输入前加上“Task,Goal,or Current Prompt:\n”来避免误解为指令。
  2. 翻译 GPT 案例中,在翻译提示词前加上“Now please translate the content below:”来避免混淆。

相关资源:

  1. 相关博客汇总了提示词优化的完整策略,帮助避免指令与输入内容的冲突。
  2. 相关测试链接:[https://waytoagi.feishu.cn/wiki/Y3Aawxm4Piynr2kNjXOcJpnDnld?fromScene=spaceOverview] 、[https://baoyu.io/blog/prompt-engineering/how-to-avoid-translated-content-being-treated-as-dialog] 、[https://x.com/dotey/status/1841899470885167236] 、[https://x.com/dotey/status/1841704140155601104] 。
Content generated by AI large model, please carefully verify (powered by aily)

References

宝玉 日报

🫧宝玉日报「10月7日」✨✨✨✨✨✨✨✨1⃣️📝OpenAI新推出的GPT-4o Canvas:协作写作与编程新体验写作功能:提供建议编辑、调整文章长度和阅读级别、添加表情符号、语法润色等功能。编程功能:让用户轻松跟踪代码修改,支持代码审查、错误修复、添加注释、以及多语言代码移植。用户覆盖:ChatGPT Plus和Team用户可立即使用,企业和教育版用户下周开放,计划后续向免费用户推出。🔗[https://x.com/dotey/status/1841899470885167236](https://x.com/dotey/status/1841899470885167236)2⃣️🔧提示词优化的技巧:避免用户输入被当成指令Playground的API策略:通过在输入前加上“Task,Goal,or Current Prompt:\n”来避免误解为指令。翻译GPT案例:在翻译提示词前加上“Now please translate the content below:”来避免混淆。相关博客:汇总了提示词优化的完整策略,帮助避免指令与输入内容的冲突。🔗博客文章:[https://baoyu.io/blog/prompt-engineering/how-to-avoid-translated-content-being-treated-as-dialog](https://baoyu.io/blog/prompt-engineering/how-to-avoid-translated-content-being-treated-as-dialog)🔗[https://x.com/dotey/status/1841704140155601104](https://x.com/dotey/status/1841704140155601104)3⃣️🎙️OpenAI Playground新增Prompt生成功能:高效生成提示词

OpenAI 春季发布会:GPT-4o

文本能力:[heading3]测试:小七姐同样的提示词,理解能力更强[content][GPT4o的一些文本生成任务测试(连夜)](https://waytoagi.feishu.cn/wiki/Y3Aawxm4Piynr2kNjXOcJpnDnld?fromScene=spaceOverview)"[heading3]测试:AJ一次性出10个分镜,速度极快[heading3]测试:猫叔,做了张图,可惜中文还是画不出来[heading3]测试:盖茨比,复现了官方案例,创建手写英文插图诗[heading3]测试:CT[content]来一张桌面首图镇楼,GPT-4o和桌面版应用发布[heading4]测试3D object Synthesis[content]画一个雕刻3D的形象。结论:质感很好,但是字母细节错了。[heading4]测试多模态,讲个故事,生成剧本,生成分镜图[content]讲个鬼故事并画出分镜[RPReplay_Final1715662704.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/M9AybXeOjojj9Ix3ZjHczXGYntf?allow_redirect=1)[heading4]测试photo of caricature[content]输入从网上找到的一张图对这张照片的描述作为输入生成动画的prompt除了护肤产品画得多了一点,没毛病。[heading4]测试Peotic typography with iterative editing 1[content]写了一个给waytoagi的诗❤️结果就一言难尽,看起来还是不能让他写字[heading4]测试Variable binding-cube stacking[content]prompt,想让它生成一个堆叠的openai字母。实际效果不太理想。结果没有生成正确

01-通往AGI之路知识库使用指南

[heading2]智能章节本章节从工程视角出发,提到用一个提示词就能写游戏,现在的AI编程(如CURSOR)能做出开源小游戏,可拿来使用、交流并研究内容、优化改造。还提到李继刚老师“read in prompt out”的名言,写prompt是基础,后面会讲如何用agent串联起来玩。内容太多难以一一道来。[01:04:32](https://waytoagi.feishu.cn/minutes/obcn7mvb3vu6k6w6t68x14v5?t=3872000)利用GPT快速制作小插件及AIPO项目鼓励小方案创作本章节AJ表示产品经理虽不会写代码,但用GPT能快速做出小插件,不到一分钟就做出统计网页字数的插件。AIPO项目不限制项目大小,只要动手操作,有想法写个小方案就可做线下路演。还提到GP4O等大语言模型可多模态识别,能用于识面相且准确率高。[01:05:58](https://waytoagi.feishu.cn/minutes/obcn7mvb3vu6k6w6t68x14v5?t=3958000)提示词相关内容的介绍与推荐本章节提到之前社区测试中有关夫妻相的有趣提示词测试,还指出有midjourney提示词、股市卡片、解压缩等众多内容。此外有最佳实践、方法论、论文精读,提到刘海写伪提示词等技巧,吴文达老师讲prompt较好,还有open i官方提示,博主列出的6大策略吃透有助于写提示词。[01:07:50](https://waytoagi.feishu.cn/minutes/obcn7mvb3vu6k6w6t68x14v5?t=4070000)社区中的prompt共学资源,包括直播、作业及六大实践办法

Others are asking
chatAI与chatGPT有区别吗
ChatAI 并非一个明确且被广泛认知的特定概念。而 ChatGPT 具有明确的定义和特点: 从 OpenAI 的官网可知,ChatGPT 在 2022 年宣发时被称为一种模型,但在官网的帮助页面中又被称为一种服务。目前我们所熟知的 ChatGPT 逐渐演变成了一种可以兼容多种 GPT 模型的聊天应用(服务)。 与更注重人格属性,试图满足社交、情感、陪伴等需求。 与 Pi 相比,Pi 优先考虑与人的对话,评价标准在于对话自不自然、情商够不够高,而 ChatGPT 在某些情况下给出的建议相对泛泛。在机制设置上,Pi 采取提问式结尾、不断主动追问的方式更有让人聊下去的欲望。
2024-12-25
如何学习跟生产相关AI内容
以下是关于如何学习跟生产相关 AI 内容的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 通过与这些 AI 产品的对话,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,谷歌生成式 AI 课程的学习路径将引导您完成有关生成式 AI 产品和技术的精选内容集合,从大型语言模型的基础知识,到如何在 Google Cloud 上创建和部署生成式 AI 解决方案。其链接为:https://www.cloudskillsboost.google/journeys/118 ,包含 10 个独立课程。 对于小白理解技术原理与建立框架,您可以参考以下通俗易懂的内容: 视频一主要回答了什么是 AI 大模型,原理是什么。 概念:生成式 AI 生成的内容,叫做 AIGC。 概念与关系:相关技术名词 AI——人工智能 机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。 监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。 无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。 强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。 深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。 生成式 AI——可以生成文本、图片、音频、视频等内容形式 LLM——大语言模型。对于生成式 AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的 BERT 模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类。 技术里程碑——2017 年 6 月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了 Transformer 模型,它完全基于自注意力机制(SelfAttention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。GPT 含义:Transformer 是关键。Transformer 比 RNN 更适合处理文本的长距离依赖性。
2024-12-25
什么是AI
AI 是一门令人兴奋的科学,它是指某种模仿人类思维,可以理解自然语言并输出自然语言的东西。对于不具备理工科背景的人来说,可以将其当成一个黑箱。 从历史角度看,最初计算机由查尔斯·巴贝奇发明,用于按照明确的程序进行数字运算,现代计算机虽更先进但仍遵循相同理念。然而,对于像根据照片判断一个人的年龄这类任务,我们无法明确编程步骤,而这正是 AI 感兴趣的。 AI 技术再怎么发展,其生态位仍是一种似人而非人的存在。我们可以从人类文明传说和古老哲人的智慧中寻找与这类似人非人存在相处的原则。 在健身领域,AI 健身是利用 AI 技术辅助或改善健身训练和健康管理的方法,能根据用户情况提供定制化训练计划和建议。相关的 AI 产品有 Keep、Fiture、Fitness AI、Planfit 等。
2024-12-25
写一篇会计的论文,方向是AI下的会计
以下是一篇关于“AI 下的会计”的论文: 标题:AI 对会计领域的影响与变革 在当今数字化时代,AI 技术正以前所未有的速度渗透到各个行业,会计领域也不例外。生成式 AI 为金融服务业带来了显著的变化,尤其在预测和报告方面展现出巨大的潜力。 尽管金融领域的其他方面不断取得进步,但现代财务团队的日常工作流程仍依赖于手动流程,如 Excel、电子邮件和需要人工输入的商业智能工具。由于数据科学资源的缺乏,基本任务尚未实现自动化,这导致 CFO 及其直接报告人在繁琐的记录和报告任务上耗费过多时间,而无法专注于战略决策。 总体而言,生成式 AI 能够助力金融服务团队从更多数据源获取数据,并实现突出趋势分析、预测和报告过程的自动化。例如,在预测方面,它可以帮助编写 Excel、SQL 和 BI 工具中的公式和查询,实现分析自动化,还能发现模式,从更广泛、更复杂的数据集中为预测提供输入,并建议如何适应模型以支持公司决策。 在报告方面,生成式 AI 能够自动创建文本、图表、图形等内容,并根据不同示例调整报告,无需手动整合数据和分析到外部和内部报告中,如董事会材料、投资者报告、周报表等。 对于会计和税务工作,会计和税务团队通常需要花费大量时间咨询规则并了解其应用,生成式 AI 可以帮助综合、总结,并就税法和潜在扣除项提供可能的答案。 在采购和应付账款方面,生成式 AI 能够自动生成和调整合同、采购订单和发票,并提供提醒。 综上所述,AI 技术为会计领域带来了高效、精准和创新的变革,使会计工作更加智能化和自动化,为企业的发展提供了有力支持。然而,在应用 AI 技术的同时,也需要关注数据安全、隐私保护和伦理道德等问题,以确保其健康、可持续地发展。
2024-12-25
有没有把文档变成手写字体的ai工具?
目前市面上有一些可以将文档转换为手写字体的 AI 工具,例如: 1. Handwriting.io:它能够根据输入的文本生成逼真的手写字体效果。 2. MyScriptFont:用户可以通过书写样本创建自己的手写字体,并应用于文档转换。 但不同工具的功能和效果可能会有所差异,您可以根据具体需求进行选择和尝试。
2024-12-25
如何让 ai 拟人化 去除 ai 味
要让 AI 拟人化去除 AI 味,可以从以下几个方面入手: 1. 生活化的语言: 注意语气的自然化,使用语气词如嗯、吧、啊、哈哈哈等。 增加口语化词语的使用。 避免过于正式、恭敬、官方的说话风格。 2. 塑造搞笑人设: 运用幽默手法,如夸张、比喻、双关、对比、反差等。 决定回答问题的逻辑与态度,可适当放肆、大胆地开玩笑。 3. 注重细节: 在标点符号、断句和表情符号上下功夫,但效果有限,最终还是内容为王。 另外,通过以下 PROMPT 工程步骤也有助于实现 AI 拟人化: 1. 第一步输入章鱼哥。 2. 第二步把情绪体感构建轮子的 prompt3 粘进去拼到章鱼哥下面。 3. 第三步点击发送按钮,让模型根据轮子的提示词自己完成人物的解构建构。 4. 第四步复制章鱼哥 prompt,给到模型略等几秒。 5. 第五步和章鱼哥聊天看章鱼哥反应,时不时假装海绵宝宝。 同时,在写作方面,挑选模型时要注重文风和语言能力,避免出现“首先、其次、再者、引人入胜”等一看就是 AI 写的套话。但需要指出的是,去除 AI 味可能是个伪命题,所谓的 AI 味实际上可能是 GPT 味。
2024-12-25
文生图软件
以下是关于文生图软件的相关信息: Tusiart 简易上手教程: 1. 定主题:明确生成图片的主题、风格和要表达的信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近内容的模型,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. ControlNet:可控制图片中特定图像,如人物姿态、生成特定文字等,属于高阶技能。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 8. 负向提示词 Negative Prompt:用英文写避免产生的内容,同样用单词和短语组合,用英文半角逗号隔开。 9. 采样算法:一般选 DPM++2M Karras,也可参考 checkpoint 详情页上模型作者推荐的采样器。 10. 采样次数:选 DPM++2M Karras 时,采样次数在 30 40 之间。 11. 尺寸:根据个人喜好和需求选择。 文生图工具: 目前市场上有许多文生图工具,一些比较受欢迎的包括: 1. DALL·E:OpenAI 推出,能根据文本描述生成逼真图片。 2. StableDiffusion:开源,可生成高质量图片,支持多种模型和算法。 3. MidJourney:图像生成效果好,界面设计用户友好,在创意设计人群中流行。 在 WaytoAGI 网站(https://www.waytoagi.com/category/104 ),可以查看更多文生图工具。 文字生成视频的 AI 产品: 1. Pika:擅长动画制作,支持视频编辑。 2. SVD:可在 Stable Diffusion 图片基础上生成视频。 3. Runway:老牌工具,提供实时涂抹修改视频功能,收费。 4. Kaiber:能将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多文生视频的网站可查看:
2024-12-24
文生图
以下是关于文生图的相关知识: 简明操作流程: 定主题:明确生成图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora 以控制图片效果和质量。 ControlNet:可控制图片中特定的图像,如人物姿态、特定文字等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:选择 840000 即可。 Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开。 负向提示词 Negative Prompt:用英文写要避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 采样次数:选 DPM++2M Karras 时,采样次数在 30 40 之间。 尺寸:根据喜好和需求选择,注意尺寸并非越大越好。 提示词: 分为内容型提示词和标准化提示词,用于描述想要的画面。例如选择 anythingV5 大模型,输入“1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面”等描述。 采样迭代步数通常控制在 20 40 之间,步数越高绘画越清晰,但速度越慢。 采样方法常用的有 Euler a、DPM++2S a Karras、DPM++2M Karras、DPM++SDE Karras、DDIM 等,有的模型有指定算法,搭配更好用。 比例设置为 800:400,模型练图基本按 512x512 框架,太大数值可能导致奇怪构图,可通过高清修复放大图像倍率。 文生图工具: DALL·E:OpenAI 推出,可根据文本描述生成逼真图片。 StableDiffusion:开源,能生成高质量图片,支持多种模型和算法。 MidJourney:图像生成效果好,界面设计用户友好,在创意设计人群中流行。 更多工具可在 WaytoAGI 网站(https://www.waytoagi.com/category/104 )查看。
2024-12-19
Sd文生图的专业术语有哪些
以下是一些关于 SD 文生图的专业术语: 1. 内容型提示词:主要用于描述想要的画面,如“1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面”。 2. 标准化提示词:例如“,drawing,paintbrush”。 3. 权重:通过括号和特定数值来增加提示词的权重,权重越高在画面中体现越充分,提示词的先后顺序也会影响权重。 4. 反向提示词:告诉 AI 不要的内容,如“NSFw,”。 5. 采样迭代步数:指 AI 绘画去噪的次数,步数越高绘画越清晰,但绘画速度越慢,通常数值控制在 20 40 之间较好。 6. 采样方法:AI 生成图像时的特定算法,常用的有“Euler a;DPM++2S a Karras;DPM++2M Karras;DPM++SDE Karras;DDIM”。 7. 比例:尺寸并非越大越好,模型练图通常按 512x512 的框架绘制,高宽比尽量在这个数值附近。高清修复可放大图像倍率,高宽比主要控制画面比例。
2024-12-16
ai生图
以下是一些关于 AI 生图的信息: 好用的图生图产品: Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感,丰富创作过程。 Retrato:AI 工具,将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,将上传照片转换为芭比风格,效果好。 这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可根据文本或参考图像生成有创意且质量不错的相似图像输出,但存在性能不稳定、生成内容不当等局限。 吐司网站的使用方法: 首页最上方有对话生图的快速入口,可输入想画的文字,没想法可点击右边的🎲随机出提示词,点击「对话生图」,几秒钟出图。 经典工作台:站内所有帖子均可轻松「一键做同款」,还有「今日灵感」。 模型选择:包括写实、2.5D、二次元。 Lora 选择:包括风格、元素、形象。 Controlnet 控制:线条、深度、姿态、语义、风格迁移,法向、色彩。 AI 小工具上手:涵盖扩图、高清修复、去背景等多个设计小工具,还有很多趣味玩法和风格滤镜,一键真人转动漫,有韩漫、日漫等风格。使用前请阅读标题和详情页描述。 有意思的小工具:一键特效写实笔刷_动效百宝箱(https://tusiart.com/template/771104332258195372 )、超精致 Q 版手办生成器(https://tusiart.work/template/773258443040693743 )、哇偶!!完美人偶(https://tusiart.com/template/724596781404555322 )。 在独立游戏开发中的 AI 绘画经验:先去掉微调模型用底模生图,然后用 ControlNet 加上微调模型出新图。从左到右依次是:底模+微调,底模,底模+微调+ControlNet,最终效果不错,该模型在美术做设计参考时也能用。
2024-12-15
我想学习文生图,怎么学
以下是学习文生图的方法: 1. 确定主题:明确您想要生成的图片的主题、风格和表达的信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. ControlNet(可选):用于控制图片中的特定图像,如人物姿态等,可在后期学习。 5. 局部重绘(下篇再学)。 6. 设置 VAE:选择 840000 即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语组合,用英文半角逗号隔开,无需考虑语法和长句。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样是单词和短语组合,用英文半角逗号隔开。 9. 采样算法:一般选择 DPM++2M Karras,也可参考 checkpoint 详情页上模型作者推荐的采样器。 10. 采样次数:选择 DPM++2M Karras 时,采样次数一般在 30 40 之间。 11. 尺寸:根据个人喜好和需求选择。 同时,您还需要根据电脑的硬件情况和自身财力选择合适的开始方式: 1. 本地部署:如果电脑是 M 芯片的 Mac 电脑(Intel 芯片出图速度慢,不建议)或者 2060Ti 及以上显卡的 Windows 电脑,可以选择本地部署,强烈建议在配有 N 卡的 Windows 电脑上进行。 2. 在线平台:对于电脑不符合要求的小伙伴可以直接使用在线工具,在线工具分为在线出图和云电脑两种,可根据实际情况选择。 3. 配台电脑(不建议一开始就配):非常不建议一上来就配主机,玩几个月后还对 AI 有兴趣的话再考虑配个主机。主机硬盘要大,显卡预算之内买最好,其他的随意。 此外,学习文生图还需要具备一定的先验经验,如熟练使用文生图、图生图,有一定的逻辑思考和推理能力,适合炼丹新人、小白。课程安排大约 70 80%是理论和方法论的内容,大部分练习会在课外沟通、练习,只有少部分必要内容会在课上演示。必学、必看内容是基础课,主要解决环境问题和软件安装不上的问题;建炉针对不同炼丹方式提供了不同的炼丹工具的安装教程;正式的内容部分分为了数据集预处理、模型训练以及模型调试及优化三个部分。在吐司网站上,首页有对话生图对话框,输入文字描述即可生成图片,不满意可通过对话让其修改。Flex 模型对语义理解强,不同模型生成图片的积分消耗不同,生成的图片效果受多种因素影响。可通过电图基于图片做延展,生图时能调整尺寸、生成数量等参数,高清修复会消耗较多算力建议先出小图。国外模型对中式水墨风等特定风格的适配可能存在不足,可通过训练 Lora 模型改善。获取额外算力的方法:通过特定链接注册或填写邀请码 BMSN,新用户 7 天内可额外获得 100 算力。
2024-12-13
我想学习文生图,怎么学
以下是学习文生图的方法: 1. 确定主题:明确您想要生成的图片的主题、风格和表达的信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. ControlNet(可选):用于控制图片中的特定图像,如人物姿态、生成特定文字等,可在后期学习。 5. 局部重绘(下篇再学)。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语的组合,用英文半角逗号隔开,不用管语法和长句。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样使用单词和短语组合,用英文半角逗号隔开,不用管语法。 9. 采样算法:一般选择 DPM++2M Karras,也可参考 checkpoint 详情页上模型作者推荐的采样器。 10. 采样次数:选择 DPM++2M Karras 时,采样次数一般在 30 40 之间。 11. 尺寸:根据个人喜好和需求选择。 同时,您还需要根据电脑的硬件情况和自身财力选择合适的开始方式: 1. 本地部署:如果电脑是 M 芯片的 Mac 电脑(Intel 芯片出图速度慢,不建议)或者 2060Ti 及以上显卡的 Windows 电脑,可以选择本地部署,强烈建议在配有 N 卡的 Windows 电脑上进行。 2. 在线平台:对于电脑不符合要求的小伙伴可以直接使用在线工具,在线工具分为在线出图和云电脑两种,可根据实际情况选择。 3. 配台电脑(不建议一开始就配):非常不建议一上来就配主机,因为大概率会变成游戏机或者吃灰(土豪请随意)。玩几个月后还对 AI 有兴趣的话再考虑配个主机。主机硬盘要大,显卡预算之内买最好,其他的随意。 此外,学习路径方面: 1. 先验经验:需要熟练使用文生图、图生图,有一定的逻辑思考能力和推理能力,适合炼丹新人、小白。 2. 课程简述:课程大约 70 80%是理论和方法论的内容,大部分练习会在课外沟通、练习,只有少部分必要内容会在课上演示。 3. 必学、必看内容是基础课,主要解决环境问题和软件安装不上的问题;建炉针对不同炼丹方式提供了不同的炼丹工具的安装教程;正式的内容部分分为了数据集预处理、模型训练以及模型调试及优化三个部分。
2024-12-13
gpt4
以下是关于 GPT4 的相关信息: 技术报告: GPT4 是一个能够处理图像和文本输入并产生文本输出的大型多模态模型。 此类模型是重要研究领域,有潜力用于多种应用,如对话系统、文本摘要和机器翻译,近年来备受关注并取得进展。 开发目标之一是提高理解和生成自然语言文本能力,尤其在复杂细致场景中。 GPT4 在为人类设计的考试中表现出色,如在模拟律师考试中分数位列前 10%,与 GPT3.5 形成鲜明对比。 在传统 NLP 基准测试中,超过以前大型语言模型和大多数先进系统,在 MMLU 基准测试中,不仅在英语中优势明显,在其他语言中也表现强大。 报告还讨论了项目关键挑战,即开发在各种规模下表现可预测的深度学习基础设施和优化方法。 GPT4 有类似早期 GPT 模型的局限性,如不完全可靠、上下文窗口有限、不从经验学习,使用其输出结果需谨慎。 能力测试: 在一系列不同基准上进行测试,包括模拟为人类设计的考试。 考试中的少数问题是模型在训练中看到的,会运行去除这些问题的变体,并报告较低分数,相信结果有代表性。 考试来源为公开材料,包括选择题和自由回答题,为每种形式设计单独提示,在需要输入的问题中加入图像。 评估设置根据考试验证集成绩设计,报告的最终结果基于预留测试考试,总分通过结合选择题和自由回答题分数确定,并报告应试者百分数。 对于 AMC 10 和 AMC 12 2022 年考试,人类百分位数未公布,报告数字是推断的,可能有不确定性。 常见问题解答: 所用模型为 GPT4。 若 GPT4 总结内容质量不行,可点击“重试”按钮让其重新总结。 无法让 GPT 输出排版内容时直接不输出“”,强制不输出会导致总结内容效果大幅下降。 前面提到的剪切板共享工具是微信输入法。
2024-12-25
chatgpt最快达到1亿用户应用
ChatGPT 是最快达到 1 亿用户的应用程序,在短短 6 周内就自然实现了这一成就。相比之下,Instagram 花了 2.5 年,WhatsApp 花了 3.5 年,YouTube 和 Facebook 花了 4 年才达到相同的用户需求水平。ChatGPT 并非孤立现象,Character AI 的参与深度(平均每次会话 2 小时)、Github Copilot 的生产力益处(效率提高 55%)以及 Midjourney 的商业化路径(数亿美元的收入)都表明第一批杀手级应用已经到来。OpenAI 对 ChatGPT 的反响感到震惊,尽管其内部的兴奋点更多集中在 GPT4 上,但 ChatGPT 让公众意识到必须应对 AI 这一现实,它成为了历史上增长最快的消费者应用,据说已积累 1 亿用户(OpenAI 不愿证实这一点,只说它拥有数百万用户)。
2024-12-25
chatgpt发展历史
ChatGPT 的发展历史如下: 在过去的一年里,许多人已主动或被动地了解了 ChatGPT,不少人可能已使用过。它能在人类生活的各个方面发挥作用。 2022 年,OpenAI 宣发时称 ChatGPT 是一种模型,其官网帮助页面称 ChatGPT 是一种服务,目前所熟知的 ChatGPT 逐渐演变成了一种可兼容多种 GPT 模型的聊天应用(服务)。 2022 年 8 月,GPT4 完成训练,是 OpenAI 的旗舰项目,强调指令遵循能力,但存在可靠性问题。 OpenAI 团队曾把产品给朋友和家人使用并考虑公开发布,之后减少对浏览功能的侧重。 团队将指令型数据和聊天数据混合,希望创造出既可以处理具体任务又能流畅聊天的模型,发现 chat 模型使用更简单,能更好地了解并处理潜在局限性,展现出更连贯的特征和更稳定的行为。
2024-12-25
如何使用chatgpt
以下是使用 ChatGPT 的方法: 1. 英文学习方面: 把特定的 prompt 喂给 ChatGPT(建议开新对话专门用于学习英文)。 ChatGPT 会扮演美国好朋友,对输入的英文和中文表达返回更地道的表达,对俚语部分加粗,还会针对发送的话题举一反三,结合欧美流行内容给出更多例子,并在输入特定语句时输出对话回顾和推荐任务以强化记忆。 建议使用方式:开一个窗口,复制 prompt;手机端打开历史记录;点右上角耳机图标,开始打电话,既能练口语又能练听力;结束后看回顾,帮助阅读。 2. 苹果系统安装、订阅 ChatGPT 4o 方面: 在 AppleStore 下载 ChatGPT:中国区正常下载不了,需切换到美区。美区 AppleID 注册教程参考知乎链接:。最终在 AppleStore 搜索下载安装,注意别下错。 支付宝购买苹果礼品卡并充值订阅付费 App:打开支付宝,地区切换到美区任意区,找到品牌精选 折扣礼品卡,点击大牌礼品卡,下滑找到 App Store&iTunes US 礼品卡,按需购买金额,建议先买 20 刀。支付宝购买礼品卡后,在 apple store 中兑换礼品卡,然后在 chatgpt 中购买订阅 gpt plus,中途不想订阅可在订阅列表中取消。 3. 使用 ChatGPT 4o 方面: 开启对话:打开 ChatGPT 应用或网页,点击开始对话。会员在苹果或安卓手机上购买的,电脑上都能登录。 体验最新语音对话功能:版本切到 ChatGPT 4o,点击右下角“耳机🎧”图标,选择一个声音,即可体验流畅的语音对话。
2024-12-25
ChatGPT如何训练需要的模型
ChatGPT 的训练模型主要包括以下几个方面: 1. 预训练(Pretrain)阶段:建立模型的能力上限,如确定模型各方面能力的天花板。此阶段跟 GPT3 的方法近似,例如采用 decoderonly 的网络架构,有特定的模型大小、输入窗口大小、单词本大小,见过大量的 tokens,使用大量的原始训练文本。 2. 监督微调(Supervised Finetune,SFT)阶段:让模型学会对话的形式展开,即知道如何按照对话的格式进行交流。 3. 强化学习从人类反馈(Reinforcement Learning from Human Feedback,RLHF)阶段:细分为奖励模型(RM)阶段和强化学习(RL)阶段,能激发模型具备多种能力,包括安全性、推理能力和稳定性等。 训练方式主要是通过材料学习,不断形成模型。其本质功能是“单字接龙”,通过自回归生成的方式,将生成的下一个词与之前的上文组合,不断重复生成任意长的下文。训练的目的不是记忆,而是学习提问和回答的通用规律,实现举一反三,即泛化。学习材料用于调整模型,得到通用模型,以处理未被数据库记忆的情况。ChatGPT 不是搜索引擎的升级版,搜索引擎无法给出未被数据库记忆的信息,而 ChatGPT 作为生成模型可以创造不存在的文本,但可能存在混淆记忆、无法直接查看和更新所学、高度依赖学习材料以及缺乏及时性和准确性等缺点。
2024-12-24
目前国内最多人用的ai软件是什么,大家具体的应用场景是什么。
目前国内较多人使用的 AI 软件及应用场景如下: 医疗保健领域: 医学影像分析:辅助诊断疾病。 药物研发:加速药物研发过程。 个性化医疗:提供个性化治疗方案。 机器人辅助手术:提高手术精度和安全性。 金融服务领域: 风控和反欺诈:降低金融机构风险。 信用评估:帮助做出贷款决策。 投资分析:辅助投资者决策。 客户服务:提供 24/7 服务并回答常见问题。 零售和电子商务领域: 产品推荐:向客户推荐可能感兴趣的产品。 搜索和个性化:提供个性化购物体验。 动态定价:根据市场需求调整产品价格。 聊天机器人:回答客户问题并解决问题。 制造业领域: 预测性维护:避免机器故障停机。 质量控制:检测产品缺陷。 供应链管理:优化供应链提高效率和降低成本。 机器人自动化:提高生产效率。 此外,还有一些具体的应用产品,如: 游戏领域:腾讯游戏助手的 AI 游戏角色生成器,为游戏开发者生成独特角色。 招聘领域:智联招聘 APP 的 AI 招聘筛选工具,帮助企业快速筛选简历。 房地产领域:贝壳找房 APP 的 AI 房地产评估系统,准确评估房地产价值。 天气领域:墨迹天气 APP 的 AI 天气预报助手,提供精准天气预报和气象预警。 需要注意的是,关于国内使用人数最多的 AI 软件,没有确切的权威统计数据,其使用情况可能因行业、用户需求和地域等因素而有所不同。
2024-12-24
视频去重AI软件哪个好用
以下是一些好用的视频去重 AI 软件: Sora:相关教程可参考 https://waytoagi.feishu.cn/wiki/S5zGwt5JHiezbgk5YGic0408nBc Hedra:工具教程见 https://waytoagi.feishu.cn/wiki/PvBwwvN36iFob7kqZktcCzZFnxd 视频转绘:应用教程 https://waytoagi.feishu.cn/wiki/ZjKpwSd5hiy6ZhkiBVHcOBb6n9r 视频拆解:应用教程 https://waytoagi.feishu.cn/wiki/WeKMwHRTmiVpYjkVdYpcFjqun6b 图片精修:应用教程 https://waytoagi.feishu.cn/wiki/CfJLwknV1i8nyRkPaArcslWrnle 此外,还有以下几个视频 AIGC 工具: Opusclip:可将长视频剪成短视频 Raskai:能将短视频素材直接翻译至多语种 invideoAI:输入想法后自动生成脚本和分镜描述,进而生成视频,再人工二编合成长视频 descript:屏幕/播客录制后以 PPT 方式做视频 veed.io:自动翻译自动字幕 clipchamp:微软的 AI 版剪映 typeframes:类似 invideoAI,内容呈现中文本主体比重更多 google vids 对于 Video Battle 视频挑战赛Farewell 送别,参与方式中的视频工具建议及云端 Comfyui 出图+AI 视频软件相关内容,您可参考: https://waytoagi.feishu.cn/wi 工作流: 步骤: 打开链接的工作流:https://www.esheep.com/app/5977,点击查看工作流,会出现登录或注册界面正常注册即可。如果已经登录会自动出现下面的界面。 步骤 1:红色框选择生成图片的大模型,绿色框添加提示词,蓝色框填写反向提示词 步骤 2:红色框设置大小确保是 16:9 的比例,绿色框修改参数,参数不理解的话保持默认即可。 步骤 3:红色框上传深度图 步骤 4:点击立即生成,最下面就会出现图片,在生成历史中下载图片即可。
2024-12-24
目前AI写小说最好的软件或者网站是哪个
以下是一些在 AI 写小说方面表现较好的软件或网站: Novel.ai:AI 写小说领域的头部应用,是典型的 LLM 产品。其产品功能复杂但使用模式简单,利用 LLM 的续写能力将写作改造成交互式的文本生成,渐进式生成小段,用户可自由更改或继续生成下一段,还抽象出模型风格、写作方式、故事世界、记忆等细分功能,本质上还是构造 Prompt,交互式、渐进式的 Prompt 构建降低了使用门槛。 Character.ai:大名鼎鼎的角色扮演类 AI 陪伴产品,服务游戏和二次元用户。使用简单,选择角色对话即可,创建也不难,角色的核心差异靠不同的详细描述,还开放用户角色 Prompt 可见。 筑梦岛:国内同类产品,玩法多样。和角色聊天、捏角色是共同主题,捏角色的产品化本质是收集信息产生高质量角色 Prompt 的过程,基于聊天模式有很多衍生玩法。 此外,还有一些可将小说制作成视频的工具和网址: Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com Adobe Firefly:Adobe 的 AI 创意工具,可生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/
2024-12-24
我如何利用AI软件写出好 的小说
以下是利用 AI 软件写好小说的一些方法: 1. 显式归纳与列出想要的文本特征:比如明确小说需要优秀的文风、细腻的文笔,具体描述如“几句话一换行”“以短句和对话为主,结构紧凑”“用词直白犀利”等,在调试过程中逐步增减描述,直至达到理想效果。 2. 通过 prompt 中的描述与词语映射到预训练数据中的特定类型的文本:直接指出想要的文本类型,如“充满张力的女性复仇文,可能会出现在晋江文学城或者起点中文网的古代言情分类中”。对于新的创作领域,可从熟悉的相关元素入手,如让模型写特殊格式的网络小说,并显式描述特征。 3. 往 prompt 里面塞例子:这是一种暴力但管用且流行的办法。 此外,要用 AI 创作出好的作品,首先要有足够的审美,知道“什么是好的,好在哪里”。同时,固定的故事结构写在 prompt 里可能不好使,因为会丧失多样性和惊喜。
2024-12-24
免费AI作图软件
以下是一些免费的 AI 作图软件: 1. draw.io(现在称为 diagrams.net):免费的在线图表软件,支持创建逻辑视图和部署视图等。 2. Archi:免费的开源工具,用于创建逻辑视图。 以下是一些与思维导图相关的 AI 工具: 1. GitMind:免费的跨平台 AI 思维导图软件,支持多种模式,如提问、回答、自动生成等。 2. ProcessOn:国内思维导图+AIGC 的工具,可利用 AI 生成思维导图。 3. AmyMind:轻量级的在线 AI 思维导图工具,无需注册登录即可使用,支持自动生成节点。 Imagen 3 是一款 AI 绘图工具,具有以下功能点和优势: 功能点: 1. 图像生成:根据用户输入的 Prompt 生成图像。 2. Prompt 智能拆解:自动拆解用户输入的 Prompt,并提供下拉框选项。 3. 自动联想:提供自动联想功能,帮助用户选择更合适的词汇。 优势: 1. 无需排队:用户可直接使用。 2. 免费使用。 3. 交互人性化:提供人性化的交互设计,如自动联想和下拉框选项。 4. 语义理解:能根据 Prompt 生成符合描述的图像。 5. 灵活性:用户可根据自动联想功能灵活调整 Prompt 以生成不同图像。
2024-12-23