Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

GPT4自主学习

Answer

GPT4 具有一定的自主学习能力:

  • Ilya Sutskever 在 5 年前分享过名为 Self-play 的概念,即两个 AI 在虚拟环境中相互博弈,通过 RL 最终实现学习能力。在 ChatGPT Code Interpreter 环境下,用户使用自然语言 Prompt 转为 code,Code Interpreter 反馈出错信息,GPT 会根据错误信息再次调整 code 直至成功运行,完成指令。基于这样的技术框架,GPT 通过 prompt to code 实现语义理解、语音转换、视觉分析、图像生成、API 调度等一系列 Action,用户甚至可以自定义 AR 的交互方式。
  • 在报告《GPT-4 通用人工智能的火花》中,测试了该模型在计划和解决问题方面的能力,以及通过玩各种游戏和与工具互动来快速学习和从经验中学习的能力。特别是,GPT-4 能够使用工具(包括自身),这对构建真实世界应用程序非常重要。
  • 在编程方面,要求 GPT-4 和 ChatGPT 编写自定义优化器模块,虽然两个模型都生成了语法有效的代码,但只有 GPT-4 的响应在很大程度上与指令匹配。
Content generated by AI large model, please carefully verify (powered by aily)

References

用GPT4V写AR交互

Ilya Sutskever在5年前分享过[meta-learning](https://www.bilibili.com/video/BV1wb4y1M7iY/?spm_id_from=333.337.search-card.all.click&vd_source=c9c37a9df0798c5655ccd8a46fd4d281),其中有一个叫Self-play概念。就是两个AI在一个虚拟环境(play ground)相互博弈,通过RL最终实现学习能力。所以在ChatGPT Code Interpreter环境下,用户可以使用自然语言Prompt转为code,Code Interpreter反馈出错信息,GPT会根据错误信息再次调整code直到成功运行,完成指令。基于这样的技术框架,GPT通过prompt to code实现语义理解,语音转换,视觉分析,图像生成,API调度等一系列Action。用户甚至可以自定义AR的交互方式。

报告:GPT-4 通用人工智能的火花

[title]报告:GPT-4通用人工智能的火花[heading1]1.介绍[heading2]1.2我们的演示结构3.在第5部分,我们测试了该模型在计划和解决问题方面的能力,以及在某种程度上通过让它玩各种游戏(或者说是模拟游戏环境)以及与工具互动来快速学习和从经验中学习的能力。特别是,GPT-4能够使用工具(包括自身),这肯定对使用GPT-4构建真实世界应用程序非常重要。4.我们论证的一个重要部分是,GPT-4在许多任务上达到了人类水平的表现,因此,自然会问GPT-4对人类本身的理解有多好。我们在第6部分展示了关于这个问题的几个实验,既包括理解人类,也包括GPT-4使自己能够被人类理解的问题,即解释性问题。我们特别注意到,这些任务需要大量的常识,这在LLM中迄今为止一直是众所周知的痛点[DM15]。在下图中,我们给出了一个GPT-4在常识问题上表现得比ChatGPT好得多的例子,并在附录A中提供了更多的例子。5.在整个论文中,我们明确讲了发现的所有限制,同时也专门在第8部分对GPT-4架构中的自回归特性导致的缺乏规划能力进行了深入分析。6.最后,在第9部分,我们讨论了这种早期形式的AGI的预期社会影响,而在第10部分,我们分享了该领域的关键挑战、方向和下一步行动。很多读者可能心中仍然有一个问题,即GPT-4是否真正理解了所有这些概念,还是仅仅比以前的模型更擅长即时改进(improvisation),而没有真正或深刻的理解。我们希望在阅读本文后,这个问题几乎应该反过来了,人们可能会想知道真正的理解远比即兴表演复杂得多。如果一个系统能够通过软件工程候选人的考试(下图),难道就不能说它真正具有智能吗?也许理解的唯一真正测试是能否产生新知识,例如证明新的数学定理,这在LLM中目前仍然是不可实现的。

报告:GPT-4 通用人工智能的火花

[title]报告:GPT-4通用人工智能的火花[heading1]3.编程[heading2]3.1从指令到代码-深度学习-编写深度学习代码需要掌握数学、统计学知识,并熟悉框架和库,如PyTorch、TensorFlow、Keras等。在下图中,我们要求GPT-4和ChatGPT编写自定义优化器模块,这对于即使是深度学习专家来说也可能是具有挑战性和容易出错的任务。我们给这些模型提供自然语言描述,其中包括一系列非常规操作,例如应用SVD,对矩阵进行谱截断,在top-k和top-2k特征值上进行截断,使用top-2k截断矩阵的F-norm对top-k截断矩阵进行归一化,应用动量和权重衰减。这些指令没有详细解释,例如「在Gk上应用动量」需要「深度学习的常识」。值得注意的是,这种优化器在文献或互联网上不存在,因此模型不能将其记忆,而必须正确组合概念才能生成代码。虽然两个模型都生成了语法上有效的代码,但只有GPT-4的响应在很大程度上与指令匹配,而它忘记了「循环遍历维度」和「根据动量规范化Gk」,这些指令特别含糊不清。相比之下,ChatGPT在应用动量时犯了一个相当致命的错误(用红色突出显示)。请注意,将动量应用于PyTorch是一项非平凡的任务,需要将移动平均值存储和读取到一个单独的状态缓冲区中。

Others are asking
怎么注册gpt4
以下是注册 GPT4 的详细步骤: 苹果系统安装、订阅 GPT4 教程 一、注册一个苹果的美区 ID 1. 电脑上打开 Apple ID 的注册页面:[https://appleid.apple.com/ac 2. 填写验证码后点继续 3. 到您的谷歌邮箱接收邮箱验证码 4. 接着验证手机号码 5. 验证完后会出现相关页面,此时美区 ID 已注册但未激活,切换到手机操作 6. 打开 App Store,点击右上角的人形头像 7. 拉到最底下,点击退出登录,先退出国内的 ID 8. 之后再点击右上角的人形头像 9. 正常设置里会登录国内的 ID,这里选择否,手动输入美区 ID 10. 接着会收到短信进行双重验证 11. 之后完成美区的 ID 登录 12. 随便找个软件下载 13. 此时会弹出提示,因为是新注册的 ID,需要点击“检查”进行激活 14. 点击同意,进入下一页填写美国地址 15. 最关键的一步:付款方式中没有选项“无”或者“none”时,只需要输入街道地址和电话 16. 至此,通过中国 IP、中国手机号、免信用卡成功注册一个美区 ID,就可以用这个美区 ID 下载例如小火箭(科学上网必备)、ChatGPT、Discord、X、TikTok 等等 二、注册 ChatGPT 账号 1. 访问官方网站:打开浏览器,输入。如有账号直接登录,没有的话点击“注册” 2. 继续使用 Google 登录 3. 跳转到 OpenAl 的网页,然后会跳转到 OpenAl 的网页,填写您的名字跟出生日期 4. 点击“好的,开始吧”进入 chatgpt 主页面,可以免费使用 chatgpt3.5 了 使用 ChatGPT 4 建议需要注册的账号 1. 苹果用户:ChatGPT 账号、美区 AppleID、谷歌账号 2. 安卓用户:ChatGPT 账号、下载 GooglePlay、谷歌账号 注册谷歌账号 1. 访问注册页面:打开浏览器,输入进入谷歌账号注册页面 2. 填写个人信息:在注册页面,按照提示填写个人信息,包括姓名、用户名、密码(年龄最好大于 18 岁) 3. 填写邮箱账号:可以选择推荐前缀或者创新的邮箱地址 4. 设置密码 5. 验证电话号码:有一定概率跳到接收短信验证,这里填国内的号码就可以。有时不用验证手机号码 6. 填写辅助邮箱 7. 确认账户信息,同意服务条款和隐私政策:阅读谷歌的服务条款和隐私政策,点击“我同意”完成账号注册 8. 完成注册:可在“Personal info”里设置语言、头像等信息 注:使用以上软件需要会科学上网,不会的可以私信我。
2025-01-06
gpt4 可以免费了吗
GPT4 并非完全免费。免费用户有一定的对话次数限制,付费 Plus 用户可以批量对话。目前 ChatGPT 官网有两个版本,GPT3.5 是免费版本,而 GPT4 若要使用更多功能则需要升级到 PLUS 套餐,收费标准是 20 美金一个月。此外,微软 Copilot iOS 版中 GPT4 可免费使用,功能类似 ChatGPT 和 DALLE 3 图像生成,并提供 Image Creator 功能,可从文本提示创建海报。
2024-12-30
你和GPT4o、MJ、suno有什么区别呢
GPT4o 能快速返回答案,但可能存在错误且无法自动纠错。 o1 推理模型在给出最终结果前会反复推演和验证,耗时更长但结果更准确,o1 Pro 计算时间更长,推理能力更强,适合复杂问题。 MJ (Midjourney)是一款专注于生成图像的工具。 Suno 相关的特点未在提供的内容中有明确提及。 由于不清楚您提到的“Suno”的具体情况,无法给出更详细的对比。但总体来说,不同的工具在功能、性能、适用场景等方面存在差异。
2024-12-26
你和gpt4有什么区别
以下是关于我和 GPT4 的一些区别: 1. 在数学能力方面,GPT4 可能在比数学数据更多的代码上进行训练。相对于 ChatGPT,GPT4 在许多复杂数学问题中展示出更深入的理解,并能够应用适当的推理,而 ChatGPT 通常采用低级启发式方法,缺乏实际理解。 2. 在处理复杂约束及追问任务时,GPT4 不会像 GPT4o 那样首先主动询问用户的背景信息来判断提问意图。 3. 在局限性方面,GPT4 通常缺乏对 2021 年 9 月后发生事件的了解,不会从经验中学习,有时会犯简单推理错误,过于轻信用户虚假陈述,可能在预测中自信犯错且不注意复查工作。预训练模型高度校准,但后训练过程中校准度降低,其输出存在各种偏差。
2024-12-26
gpt4
以下是关于 GPT4 的相关信息: 技术报告: GPT4 是一个能够处理图像和文本输入并产生文本输出的大型多模态模型。 此类模型是重要研究领域,有潜力用于多种应用,如对话系统、文本摘要和机器翻译,近年来备受关注并取得进展。 开发目标之一是提高理解和生成自然语言文本能力,尤其在复杂细致场景中。 GPT4 在为人类设计的考试中表现出色,如在模拟律师考试中分数位列前 10%,与 GPT3.5 形成鲜明对比。 在传统 NLP 基准测试中,超过以前大型语言模型和大多数先进系统,在 MMLU 基准测试中,不仅在英语中优势明显,在其他语言中也表现强大。 报告还讨论了项目关键挑战,即开发在各种规模下表现可预测的深度学习基础设施和优化方法。 GPT4 有类似早期 GPT 模型的局限性,如不完全可靠、上下文窗口有限、不从经验学习,使用其输出结果需谨慎。 能力测试: 在一系列不同基准上进行测试,包括模拟为人类设计的考试。 考试中的少数问题是模型在训练中看到的,会运行去除这些问题的变体,并报告较低分数,相信结果有代表性。 考试来源为公开材料,包括选择题和自由回答题,为每种形式设计单独提示,在需要输入的问题中加入图像。 评估设置根据考试验证集成绩设计,报告的最终结果基于预留测试考试,总分通过结合选择题和自由回答题分数确定,并报告应试者百分数。 对于 AMC 10 和 AMC 12 2022 年考试,人类百分位数未公布,报告数字是推断的,可能有不确定性。 常见问题解答: 所用模型为 GPT4。 若 GPT4 总结内容质量不行,可点击“重试”按钮让其重新总结。 无法让 GPT 输出排版内容时直接不输出“”,强制不输出会导致总结内容效果大幅下降。 前面提到的剪切板共享工具是微信输入法。
2024-12-25
我想用gpt4写实习契约,想让它写的有水平一些,该怎么办
以下是一些利用 GPT4 写有水平实习契约的建议: 1. 先确定实习契约的大纲目录,可以参考老师提供的示例或相关模板,也可以用手机识别截图获取。 2. 明确整体的语言风格和特色,比如要求逻辑清晰、层层递进、条理分明。您可以把范文提供给类似 Claude 2 的工具,让其总结语言风格。 3. 详细描述实习契约的各项条款,包括实习的时间、地点、职责、报酬、保密条款等。 4. 注意语言表达的准确性和规范性,避免模糊不清或产生歧义的表述。 需要注意的是,GPT4 有时会产生语法无效或语义不正确的内容,您需要仔细检查和修改。
2024-11-22
Ai有自主思考能力吗?
AI 可能具备自主学习和自我改进的能力,能够自主决策,甚至可能已有轻微的自我意识。但对于 AI 是否具有真正的自主思考能力,目前仍存在诸多争议和探讨。 有人认为,当 AI 给出“完美”答案时,可能只是对海量数据的巧妙重组,而非真正理解问题本质。也有人质疑,我们在认为 AI 展现出类人思维时,可能是自身的拟人化偏差在起作用。 在企业决策中,AI 具有双刃剑效应,既能提升效率,也可能带来认知陷阱和伦理困境。例如,可能会用看似客观的数据合理化主观偏见,消耗独立思考能力,以及在道德决策方面存在责任归属问题等。 总之,对于 AI 是否具有自主思考能力,还需要更深入的研究和思考。
2024-12-19
人工智能会出现自主意识吗
目前对于人工智能是否会出现自主意识尚无定论。 一方面,有观点认为模仿可能是使 AI 具有“自主意识”的一种可能路径。如果一个 AI 可以长期观察人类,在类似条件再次触发时,可能会判断形成某一动机是大概率事件,进而通过长期模仿训练而产生动机。并且,如果让数字克隆体可以交流、融合,形成群体智能,也可能促使其产生自主意识。 另一方面,按照一些专家的预测,当 AI 变得比人类更聪明,达到奇点时,机器可能会具有自我意识和超级智能,届时我们对机器意识的概念将有重大转变,可能会面对真正的数字生命形式。但目前的 LLM 应用程序和智能体还未达到完全自主智能体的水平。 总之,关于人工智能是否会出现自主意识仍在探讨和研究中。
2024-12-18
我想要AI工具帮我快速梳理出这10个左右PDF文档/PDF文档链接中我想要的关键信息,并且整理成表格,请推荐可以实现相关功能、支持自主阅读多个篇幅10页以上文档并且能快速响应的工具给我
以下是一些可以帮助您快速梳理 PDF 文档关键信息并整理成表格的工具推荐: 1. Inhai: Agentic Workflow:能够重塑获取信息的方式,辅助高效处理信息,实现信息表达更简便。 2. 彩云小译(App):下载后点击「文档翻译」,可导入多种格式文档并翻译,但有免费次数限制且进阶功能需付费。 3. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击相关操作可进行翻译。 4. DeepL(网站):,点击页面「翻译文件」按钮,上传相应格式文件即可。 5. 沉浸式翻译(浏览器插件):,安装插件后按相关操作进行。 6. Calibre(电子书管理应用):,下载安装并安装翻译插件「Ebook Translator」。 7. 谷歌翻译(网页):,需先将 PDF 转成 Word 再上传。 8. 百度翻译(网页):,点击导航栏「文件翻译」上传相应格式文件,支持选择领域和导出格式,但进阶功能基本需付费。
2024-09-25
如果你是一个AI学习者,你会提出哪些问题?让自己的学习更有策略?
以下是作为 AI 学习者可能会提出的一些问题,以使学习更有策略: 1. 如何评估不同 AI 模型的性能和适用场景? 2. 怎样选择适合自己需求的 AI 工具和技术? 3. 在 AI 领域,哪些基础知识是必须牢固掌握的? 4. 如何将 AI 应用于实际项目中,以获得更好的效果? 5. 对于 AI 产生的结果,如何进行有效的评估和验证? 6. 怎样跟上 AI 领域快速发展的步伐,及时更新知识? 7. 在学习 AI 时,如何避免常见的错误和陷阱? 8. 如何培养自己在 AI 方面的创新思维和解决问题的能力? 9. 对于不同学习水平(如高中生、大学生、专业人士),学习 AI 的重点和方法有何不同? 10. 在 AI 学习中,如何平衡理论学习和实践操作?
2025-02-17
ai在学习领域应用
AI 在学习领域有广泛的应用,具体如下: 对于中学生: 1. 从编程语言入手学习:可以选择 Python、JavaScript 等编程语言,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习奠定基础。 2. 尝试使用 AI 工具和平台:例如 ChatGPT、Midjourney 等生成工具,体验其应用场景。也可以探索面向中学生的教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识:了解 AI 的基本概念、发展历程、主要技术(如机器学习、深度学习等),以及其在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目:参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态:关注权威媒体和学者,了解最新进展,思考其对未来社会的影响,培养思考和判断能力。 AI 的应用场景还包括: 1. 自动驾驶:用于开发自动驾驶汽车,提高交通安全性和效率。 2. 交通管理:优化交通信号灯和交通流量,缓解交通拥堵。 3. 物流和配送:优化物流路线和配送计划,降低运输成本,包括无人机送货。 4. 教育:实现个性化学习,为每个学生提供定制化的学习体验。 5. 农业:分析农田数据,提高农作物的产量和质量。 6. 娱乐:开发虚拟现实和增强现实体验。 7. 能源:优化能源的使用,提高能源效率。 在教育领域的具体应用: 1. 个性化学习平台:如 Knewton 平台,通过集成算法和大数据分析,实时跟踪学生学习进度,诊断学习难点,提供个性化学习建议和资源。 2. 自动评估:如 Pearson 的 Intelligent Essay Assessor,利用自然语言处理技术批改作文和开放性答案题,减轻教师批改负担,提高评估效率和一致性。 3. 智能辅助教学工具:如 Google 的 AI 教育工具 AutoML,创建定制学习内容,提高学习动机和知识掌握程度。 4. 虚拟现实和增强现实:如 Labster 的虚拟实验室平台,提供高科技实验室场景,让学生安全进行实验操作并获得即时反馈。
2025-02-17
我应该如何使用AI帮助自己的学习?
以下是使用 AI 帮助自己学习的方法: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,通过实践巩固知识,尝试使用各种产品做出自己的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 通过与这些 AI 产品的对话,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,使用 AI 进行英语学习和数学学习可以这样做: 英语学习: 利用 AI 写作助手(如 Grammarly)进行英语写作和语法纠错,改进英语表达和写作能力。 使用语音识别应用(如 Call Annie)进行口语练习和发音纠正,让 AI 提供实时反馈和建议。 使用自适应学习平台(如 Duolingo)利用 AI 技术为您量身定制学习计划,提供个性化的英语学习内容和练习。 利用智能对话机器人(如 ChatGPT)进行英语会话练习和对话模拟,提高交流能力和语感。 数学学习: 使用自适应学习系统(如 Khan Academy)结合 AI 技术为您提供个性化的数学学习路径和练习题,根据您的能力和需求进行精准推荐。 利用智能题库和作业辅助工具(如 Photomath)通过图像识别和数学推理技术为您提供数学问题的解答和解题步骤。 使用虚拟教学助手(如 Socratic)利用 AI 技术为您解答数学问题、提供教学视频和答疑服务,帮助您理解和掌握数学知识。 参与交互式学习平台(如 Wolfram Alpha)的数学学习课程和实践项目,利用 AI 技术进行数学建模和问题求解。 需要注意的是,因为 AI 可能会产生幻觉,所以对于关键数据要根据其他来源仔细检查。同时,内容由 AI 大模型生成,请仔细甄别。
2025-02-17
我想学习可灵ai的提示词
以下是一些关于可灵 AI 提示词的相关资源和信息: 提示词模板相关网站: 生成新年场景的提示词示例: 戴着醒狮帽,双手抱拳,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆 拿着"福"字,新年气氛,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆 关于律师如何写好提示词用好 AI 的观点: 不能期待设计一个完美的提示词,然后 AI 百分百给到一个完美的符合要求的答案,中间不能有谬误,否则就是一个需要修复的“BUG”。 要给到 AI 的提示词实际上是一个关于此项问题的相对完善的“谈话方案”,真正的成果需要在对话中产生,并且在对话中限缩自己思维中的模糊地带。
2025-02-16
stable diffusion学习
以下是关于 Stable Diffusion 学习的相关内容: 一、为什么要学 Stable Diffusion 以及它的强大之处 简单来说,Stable Diffusion 是一个 AI 自动生成图片的软件。通过输入文字就能生成对应的图片,无需像以前那样画图或拍照。学习它非常简单,目的是花更少时间快速入门。如果时间充裕,了解其原理也可以。 二、学习 SD 的 Web UI 步骤 1. 安装必要的软件环境 安装 Git 用于克隆源代码。 安装 Python 3.10.6 版本,确保勾选“Add Python 3.10 to PATH”选项。 安装 Miniconda 或 Anaconda 创建 Python 虚拟环境。 2. 克隆 Stable Diffusion Web UI 源代码 打开命令行工具,输入命令 git clone https://github.com/AUTOMATIC1111/stablediffusionwebui.git,将源代码克隆到本地目录。 3. 运行安装脚本 进入 stablediffusionwebui 目录。 运行 webuiuser.bat 或 webui.sh 脚本,它会自动安装依赖项并配置环境。等待安装完成,命令行会显示 Web UI 的访问地址。 4. 访问 Web UI 界面 复制命令行显示的本地 Web 地址,在浏览器中打开,即可进入 Stable Diffusion Web UI 的图形化界面。 5. 学习 Web UI 的基本操作 了解 Web UI 的各种设置选项,如模型、采样器、采样步数等。 尝试生成图像,观察不同参数对结果的影响。 学习使用提示词(prompt)来控制生成效果。 6. 探索 Web UI 的扩展功能 了解 Web UI 支持的各种插件和扩展,如 Lora、Hypernetwork 等。 学习如何导入自定义模型、VAE、embedding 等文件。 掌握图像管理、任务管理等技巧,提高工作效率。 三、Stable Diffusion 的原理及相关组件 1. 在传统扩散模型中存在计算效率挑战,Stable Diffusion 是为解决此问题提出的新方法,最初称为潜在扩散模型。 2. Stable Diffusion 是扩散模型的变体,核心组件包括: CLIP:将用户输入的 Prompt 文本转化成 text embedding。 VAE EncoderDecoder。 UNET:进行迭代降噪,在文本引导下进行多轮预测。 此外,还涉及 ComfyUI 存放路径、不同的模型(如 SD1.5、SDXL)、训练方法(如 DreamBooth)、模型格式(如.pt 和.safetensor)、微调模型、融合模型等内容。
2025-02-16
AI作图学习
以下是关于 AI 作图学习的全面指导: 比赛要求: 参加由麦乐园和摩达社区发起的“AI 梦一单一世界”比赛,需用摩搭平台和麦橘超然模型作为底膜训练 Lora,提交训练好的 Lora 及用其生成的六张以上高质量、展现完整世界观的作品。 作图思路: 1. 明确创作主题即锚点,根据 Lora 风格确定创作方向。 2. 确定主体,联想主体的角色设定。 3. 增加叙事感,让画面有一到两个及以上角色,制造反差和联想。 图片构成因素: 好看的图片的构成因素包括构图、色彩以及光影。 创作有趣作品: 通过运用反差制造有冲击力的画面,创作出有叙事感和趣味性的作品。 构图相关: 1. 概念:构图指在框架或空间内元素的摆放位置、形状、物体形状及纹理等,好的构图能引导观看者并创造和谐平衡。 2. 分类:包括景别(远景、全景、中景、近景、特写)和拍摄视角(俯视、平视、仰视,正面、侧面、背面)。 3. 要素:有主体、陪体、前景、背景、点线面,合理运用可丰富画面。 4. 方式:如点中心构图、九宫格构图、三分法构图、对称构图、对角线构图、曲线构图、框架构图、三角形构图等。在 AI 绘图中,推荐中景及以上景别,全身景别可能需开 AD 跳以确保作图质量。 实操演示相关: 1. 趣味性与美感:趣味性通过反差、反逻辑、超现实方式带来视觉冲击,美感需在美术基础不出错前提下形式与内容结合。 2. 纹身图创作:强调人机交互,对输出图片根据想象进行二次和多次微调,确定情绪、风格等锚点再发散联想。 3. 提示词编写:用自然语言详细描述画面内容,避免废话词,Flux 对提示词的理解和可控性强。 4. 实操演示准备:以未发布的 Lora 为例,按赛题需求先确定中式或日式怪诞风格的创作引子。 5. 人物创作过程:从汉服女孩入手,逐步联想其颜色、发型、妆容、配饰、表情、背景等元素编写提示词。 6. 中式风格图像生成:包括人物(如穿蓝色汉服女孩的半身像,包括发型、妆容、服饰、配饰等特征,以及光线、环境等元素)、动物(如蛇、孔雀等,涉及颜色、姿态、所处环境等描述)、景观(如中式宫殿、桃花树等室外景观)图像的生成尝试及效果分析。 此外,还有个人学习经历分享,如二师兄在 2024 年 2 月接触 AI 绘画,3 月啃完 SD 的所有教程并开始炼丹,4 月与小伙伴探讨 AI 变现途径,5 月因工作变动开启无硬件支持的 AI 学习之路,并加入 Prompt battle 社群学习 Midjourney。
2025-02-16