Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

小白如何用ai开始学习图片设计

Answer

对于小白如何用 AI 开始学习图片设计,以下是一些建议:

  1. 图像流搭建
    • 创建第一个图像流:由于文本类型大语言模型无法直接生成图片,需要通过【技能】部分的图像流为文本大模型提供图像生成能力。为 bot 加入图像流时,要设定图像流名称以及描述(名称只能是英文)。
    • 了解图像流节点的意义:图像流编辑界面左侧的工具栏集合了所有可能用到的功能,大致可分为智能处理工具(如“智能生成”“智能抠图”“画质提升”等)、基础编辑工具(如画板、裁剪、调整、添加文字等)和风格处理类工具(如风格迁移、背景替换等)。从基础编辑工具开始尝试,熟悉后再探索其他功能。右侧类似画布,可拖拽左侧工具或点击“+”拖放各种工具模块,工具之间可连接形成工作流程。
    • 根据需求进行图像流设计:例如生成海报功能,在总结故事后,将完整的故事作为输入,对输入的故事进行一轮提示词优化,从自然语言转变为更符合文生图大模型的提示词,将优化后的提示词输入生图大模型,调整生图的基础风格和信息,输出最终的配图海报。
    • 测试图像流。
  2. 利用即梦 AI 生成海报
    • 提示词:皮克斯风格,三宫格漫画:一只小狗,坐在办公桌前,文字“KPI 达标了吗?”。一只小狗,拿着一个写满计划的大本子,微微皱着眉头,文字“OKR 写好了吗?”。一只小狗坐在电脑前,文字“PPT 做好了吗?”。
    • 实操教程:
      • 打开即梦 AI:https://jimeng.jianying.com/ai-tool/home 。
      • 点击 AI 作图中的图片生成。
      • 填写绘图提示词,选择生图模型 2.1,点击立刻生成。
  3. 进阶技巧和关键词
    • 图片内容一般分为二维插画以及三维立体两种主要表现形式。
    • 主题描述:可以描述场景、故事、元素、物体或人物细节、搭配等。描述场景中的人物时,最好独立描述,不要用一长串文字,否则 AI 可能识别不到。
    • 设计风格:可找风格类关键词参考或垫图/喂图,让 AI 根据给出的图片风格结合主题描述生成图片。对于某些材质的描述,关键词的运用有很多门道,需要针对某一种风格单独进行“咒语测试”。
Content generated by AI large model, please carefully verify (powered by aily)

References

Yeadon:写给小小白的-从游戏入手学习搓图像流bot

由于文本类型大语言模型无法直接生成图片,但是我们设计的智能体需要有对应的功能,因此我们要通过【技能】部分的图像流,为文本大模型提供图像生成能力。比如我们的marvin机器人需要有个生成海报的能力,所以我们需要为bot加入图像流,按照下面步骤创建图像流并设定图像流名称以及描述(注意名称只能是英文)[heading3]步骤二:了解图像流节点的意义[content]在图像流编辑界面,左侧的工具栏集合了所有你可能用到的功能。这些工具大致可以分成几类,让我们先了解最常用的部分。智能处理工具包括"智能生成"、"智能抠图"和"画质提升"等,它们可以帮你快速完成一些复杂的图片处理任务。比如你想要去除图片背景,用智能抠图就能一键完成。基础编辑工具则是我们最常用到的。画板、裁剪、调整、添加文字这些功能可以满足日常图片编辑需求。像调整图片大小、裁切形状、加个文字说明这些都可以轻松搞定。如果你想让图片更有创意,可以试试风格处理类的工具。风格迁移能让照片秒变艺术画,背景替换能帮你换个好看的背景,这些都是让图片与众不同的好帮手。别被这么多工具吓到,你不需要一次就掌握所有功能。建议从基础编辑工具开始尝试,熟悉了再去探索其他有趣的功能。每个工具点开就能看到详细设置,同时你可以尝试动手操作看看效果。右侧看起来像一个画布,拖拽左侧的工具或点击+在可以在这里拖放各种工具模块,工具之间可以连接,形成工作流程[heading3]步骤三:根据需求进行图像流设计[content]1.生成海报功能在总结故事后,将完整的故事作为输入2.输入的故事进行一轮提示词优化从自然语言转变为更符合文生图大模型的提示词3.将优化后的提示词输入生图大模型,调整生图的基础风格和信息,输出最终的配图海报[heading3]步骤四:测试图像流[content]

烧拍:探索AI-23 | 即梦 2.1 登场,海报设计师为何 “瑟瑟发抖”?

提示词:皮克斯风格,三宫格漫画:一只小狗,坐在办公桌前,文字“KPI达标了吗?”。一只小狗,拿着一个写满计划的大本子,微微皱着眉头,文字“OKR写好了吗?”。一只小狗坐在电脑前,文字“PPT做好了吗?”。-实操教程-1️⃣打开即梦AI:https://jimeng.jianying.com/ai-tool/home2️⃣点击AI作图中的图片生成,如下👇3️⃣填写绘图提示词,选择生图模型2.1,点击立刻生成。三步轻松上手,设计从未如此简单!释放你的创造力,成为自己心中的设计大师!快来一起玩AI,探索AI的无限可能!👋关注「烧拍AI」了解更多AI资讯!

进阶技巧和关键词大全总结

这个周末尝试了很多种风格的AI出图,一般图片内容我们会分为二维插画以及三维立体两种主要表现形式。为了生成自己想要的图,上面说的3个结构确实可以帮我们大致输出想要的图片:1.1.主题描述:可以描述一个场景和故事以及其组成的元素、一个物体或者人物的细节、搭配。比如一个动物园,里面有老虎、狮子、长颈鹿、大树、围栏等等或者一个小女在森林里搭帐篷,她穿着红色的裙子以及戴着白色的帽子,但是有时候AI不一定能识别每一个描述的元素,如果要描述一个场景中的人物,大家记得进行独立描述,不要用一长串文字去表达,AI会识别不到,比如一个穿着红色盔甲的男孩站在山顶,那么我们最好把他拆分以下:一个男孩、穿着红色盔甲、站在山顶,这样会更加接近我们想要的场景。但是一个大场景中有多个角色的细节就不太容易通过关键词去生成了。1.2.设计风格:设计风格其实很多设计师没有办法直接表达出来,所以我们在这个步骤会去找一些风格类的关键词参考或者是你找到一张想要的风格的图片,放进去,这种我们就称之为垫图/喂图,让AI根据我们给出的图片风格,结合我们的主题描述生成该风格的图片。还有我研究了一下玻璃、透明塑料、霓虹色彩以及一些透明、反射等材质的关键词,比如你想让一个物体表面透明,但是不要把物体里面的机械结构体现出来,可能需要加一些[设计师](https://www.uisdc.com/tag/%e8%ae%be%e8%ae%a1%e5%b8%88)风格,单纯的控制材质很难达到要求,因为系统判断你表面透明了肯定能看到里面的结构,但是有了结构的话物体就会很复杂,不高级。所以这里面关键词的道道非常多,目前也只能通过大家针对某一种风格单独去进行“咒语测试”。未加风格只描述材质

Others are asking
AI基础
以下是关于 AI 基础的知识: 一、背景知识 了解人工智能、机器学习、深度学习的定义及其之间的关系,简要回顾 AI 的发展历程和重要里程碑。 二、数学基础 1. 统计学基础:熟悉均值、中位数、方差等统计概念。 2. 线性代数:了解向量、矩阵等线性代数基本概念。 3. 概率论:掌握基础的概率论知识,如条件概率、贝叶斯定理。 三、算法和模型 1. 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 2. 无监督学习:熟悉聚类、降维等算法。 3. 强化学习:了解强化学习的基本概念。 四、评估和调优 1. 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 2. 模型调优:学习如何使用网格搜索等技术优化模型参数。 五、神经网络基础 1. 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 2. 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 六、学习建议 1. 了解 AI 基本概念:阅读相关部分,熟悉术语和基础概念,了解主要分支及联系,浏览入门文章。 2. 开始学习之旅:在入门课程中学习生成式 AI 等基础知识,推荐李宏毅老师的课程,通过在线教育平台按自己节奏学习。 3. 选择感兴趣模块深入:AI 领域广泛,可根据兴趣选择特定模块,如掌握提示词技巧。 4. 实践和尝试:理论学习后进行实践,巩固知识,使用各种产品创作作品,并分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等互动,了解工作原理和交互方式。 此外,为您推荐三本神经科学相关的基础学科书籍: 1. 《认知神经学科:关于心智的生物学》(作者:Michael S.Gazzaniga;Richard B.Lvry;George R.Mangun):世界权威的认知神经科学教材,系统了解认知神经科学的多方面内容。 2. 《神经科学原理》(作者:Eric R.Kandel;James H.Schwartz):让您系统了解神经元的相关知识。 3. 《神经生物学:从神经元到脑》(作者:John G.Nicholls 等著):神经生物学领域的名著,涵盖神经科学的方方面面。
2025-02-26
AI介入设计的相关案例
以下是大淘宝设计部 2023 年度 AI 设计实践的相关案例: 1. 在工作流方面: 主要工具为 Midjourney 和 Stabel Diffusion,辅助工具有 RUNWAY 和 PS beta 等。 在营销设计中,AI 设计使整体项目设计时间大约减少 18%左右,其中在创意阶段丰富性提升 150%左右、时间节省 60%左右。 创意多样,项目中不同创意概念的提出数量增加了 150%。 执行加速,设计师在创意生成阶段的时间缩短了平均 60%。 整体提效,从创意发散到落地执行品效都有显著提升。 2. 具体应用场景案例: 大促营销:通过 AI 生成图像或素材,再结合平面合成及修正,确保符合品牌形象,更精准表达营销活动主题,如淘宝天猫大促视觉、双 11 大促横向会场版头模板化应用、天猫小黑盒新品联名等。 AI 布景:对于定制化真人模特实景素材的主题活动,通过 AI 完成页面所有素材的生产和输出,如七夕主题活动页面、超级品类日传播拍摄创意等。 产品营销视觉:在 UI 设计场景中,采用 AI 能力快速定制多种用户需要的视觉效果,如 88VIPAI 定制皮肤。 品牌超级符号映射:根据品牌符号的模型训练和结构控制,用户输入丰富关键词即可快速完成准确的超级符号主视觉,如双 11AI 创作赢红包、双 11 联合传播猫头海报&花车大巡游、超级品类日品牌符号系列海报等。 品牌 IP 形象 AI 生成:训练特定的天猫/淘宝/营销 IP 公仔模型,稳定输出定制化 IP 形象,如天猫 AI 玩行动品牌联合海报、天猫双 11出游主题喵卡、淘宝天猫一起冲亚、天猫 U 先公仔三视图生成及应用等。 传播&投放:如双 11 超级发布品牌联合海报、媒介投放开屏海报。
2025-02-26
ai产品经理
以下是为您整合的关于 AI 产品经理的相关信息: 北京分队中有一位叫 Kelton 的成员,是一位 AI 产品经理,深耕 NLP 方向 2 年,作为 Owner 从 0 1 打造过两款 AIGC 产品,也完成过 LLM 评测体系的从零搭建。技术出身,还曾在云计算、元宇宙领域工作过 2 年,坐标在海淀(北四环)。 银海是一位 AI 产品经理,是通往 AGI 之路社区共建者,5 + 大模型厂商资深讲师,全网粉丝量 3W + ,在 AI Agent、多模态大模型、企业级 AI 应用等多领域具备丰富实战经验。 特看科技正在招聘 AI 产品经理,岗位要求:负责 AI 视频工具方向产品工作,对生成式 AI 产品有一定研究,熟悉 Transformer 和 Diffusion 模型的优先;英文好,有海外产品经验优先,有内容工具或 SaaS 产品经验优先;2 年以上产品岗位经验,职级根据经验能力制定,对标阿里 P6 P8 区间。该公司专注于 AI 视频和直播应用,在国内和海外市场服务众多头部品牌。能提供确定性的商业化应用场景、初创公司充沛的早期期权池、强大的工程师团队等。有电子商务、企业服务、人工智能、海外产品等行业经验为加分项。欢迎推荐或自荐简历至 qingshen@tabcut.com,或飞书与清慎联系。
2025-02-26
ai产品经理
以下是为您整合的关于 AI 产品经理的相关信息: 北京分队中有一位叫 Kelton 的成员,是一位 AI 产品经理,深耕 NLP 方向 2 年,作为 Owner 从 0 1 打造过两款 AIGC 产品,也完成过 LLM 评测体系的从零搭建。技术出身,还曾在云计算、元宇宙领域工作过 2 年,坐标在海淀(北四环)。 银海是一位 AI 产品经理,是通往 AGI 之路社区共建者,5 + 大模型厂商资深讲师,全网粉丝量 3W + ,在 AI Agent、多模态大模型、企业级 AI 应用等多领域具备丰富实战经验。 特看科技正在招聘 AI 产品经理,岗位要求:负责 AI 视频工具方向产品工作,对生成式 AI 产品有一定研究,熟悉 Transformer 和 Diffusion 模型的优先;英文好,有海外产品经验优先,有内容工具或 SaaS 产品经验优先;2 年以上产品岗位经验,职级根据经验能力制定,对标阿里 P6 P8 区间。该公司专注于 AI 视频和直播应用,在国内和海外市场服务众多头部品牌。能提供确定性的商业化应用场景、初创公司充沛的早期期权池、强大的工程师团队等。有电子商务、企业服务、人工智能、海外产品等行业经验为加分项。欢迎推荐或自荐简历至 qingshen@tabcut.com,或飞书与清慎联系。
2025-02-26
PDF 转 word AI 公交
以下是一些将 PDF 转换为 Word 的 AI 工具和方法: 1. DeepL(网站):点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 此外,对于美国电工教材 PDF 的翻译,推荐策略为: 1. 将 PDF 转 Markdown,人工校验后再分页翻译。 2. 无合适工具时,可用 AI 协助:将 PDF 转为图片,再用 Gemini Flash 2.0 转成英文 Markdown。推荐工具:Microsoft Markitdown,工具地址:
2025-02-26
python程序员 学习AI
对于 Python 程序员学习 AI,以下是一些建议和基础内容: AI 背景知识: 基础理论:理解人工智能、机器学习、深度学习的定义及相互关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:掌握向量、矩阵等基本概念。 概率论:了解基础的概率论知识,如条件概率、贝叶斯定理。 算法和模型: 监督学习:熟悉常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:了解聚类、降维等算法。 强化学习:知晓其基本概念。 评估和调优: 性能评估:掌握如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学会使用网格搜索等技术优化模型参数。 神经网络基础: 网络结构:理解神经网络的基本结构,如前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:熟悉常用的激活函数,如 ReLU、Sigmoid、Tanh。 此外,还有相关的课程内容,如“和 Cursor AI 一起学 Python 编程”: 第一节:Python 是什么、Cursor 使用、notebook 远程编程。包括熟悉 Cursor 界面,安装和设置,指导下载安装 Cursor 编辑器,了解界面布局和基本功能,编写第一个程序,体验 AI 辅助功能,如代码自动补全和错误提示,使用 Bohrium 进行远程编程,注册和登录,在线编写和运行代码等。课程时间为 45 分钟,教学内容涵盖 Python 简介、发展历史和特点、在数据分析和人工智能领域的优势、在人文学科的应用、在语言教学和研究中的实际案例,以及对 Cursor 编程环境和 Bohrium 在线编程平台的介绍。
2025-02-26
我是一名AI工具使用小白,渴望快速掌握AI工具,在电子表格制作、ppt制作、公文写作、文案写作等方面提升应用能力,请问应该学习哪些入门课程。
以下是一些适合您入门学习的 AI 课程: 1. 工具入门篇(AI Tools): 数据工具多维表格小白之旅:适合 Excel 重度使用者、手动数据处理使用者、文件工作者。通过表格+AI 进行信息整理、提效、打标签,满足 80%数据处理需求。 文章链接: 视频链接: 2. 工具入门篇(AI Code): 编程工具Cursor 的小白试用反馈:适合 0 编程经验、觉得编程离我们很遥远的小白。通过 AI 工具对编程祛魅,降低技术壁垒。 文章链接: 3. 工具入门篇(AI Music): 音乐工具Suno 的小白探索笔记:适合 0 乐理知识、觉得作词作曲和我们毫不相关成本巨大的小白。AI 赋能音乐创作,无需乐理知识即可参与音乐制作。 文章链接: 此外,还有以下相关内容供您参考: 1. 关于 AI 视频制作的交流与答疑: 视频流表格制作:在知识库的 AI 视频专栏中有相关教程和模板。 Copy UI 社区:微推有专门研究 Copy UI 的社区,相关内容有趣但本次未展开讲。 SD 类图片作用:国内大厂很卷,一般需求吉梦等产品可完成,特殊精细要求才用 SD,不了解可在微推加 AI 会话中找。 图片视角转移:使用 P 模型,上传图片并告知镜头移动方向和相关内容。 PNG 与背景融合:Recraft 产品目前不太擅长 PNG 与背景的特别好的融合,可通过合并方式处理。 保证文字不崩:使用吉梦的 2.1 模型效果较好。 新手 AI 视频制作:纯小白参与项目时,项目组会做好部分准备工作,上手难度不高,专注出图和出视频,用好相关技术。 关于利用 AI 工具创作北京宣传片相关问题的探讨。 AI 工具使用思路:对于如何利用 AI 工具创作,建议直接上手尝试,通过试错和与 AI 交流获取反馈,遇到具体问题再向社区请教。 素材处理方法:若有故宫相关照片素材,可采用导入参考图生图、让实拍素材动起来等方式,还可通过抠图、融图等操作将素材与虚拟背景融合。 创作需先构思:创作时不能仅考虑如何连接已有素材,而应先构思剧本和想要表达的内容,再合理运用素材。 2. 入门工具推荐: Kimi 智能助手:Chatgpt 的国产平替,实际上手体验最好,推荐新手用 Kimi 入门学习和体验 AI。不用科学🕸️、不用付费、支持实时联网。是国内最早支持 20 万字无损上下文的 AI,也是目前对长文理解做的最好的 Ai 产品。能一次搜索几十个数据来源,无广告,能定向指定搜索源。 PC 端: 移动端 Android/ios: 您还可以通过「飞书」这款工具,浏览其社区的精选课程、先进客户实践。下载飞书:
2025-02-26
零代码基础的业务小白如何搭建自己的AI自动化工作流,方便提升效率
对于零代码基础的业务小白搭建自己的 AI 自动化工作流以提升效率,您可以参考以下步骤: 1. 利用 Comfyui 界面: 打开 Comfyui 界面后,右键点击,找到 Comfyui LLM party 的目录。 您可以学习手动连接节点来实现最简单的 AI 女友工作流,也可以将工作流文件拖拽到 Comfyui 界面中一键复刻提示词工程实验。 2. 启动 ollama: 从 ollama 的 github 仓库找到对应版本并下载。 启动 ollama 后,在 cmd 中输入 ollama run gemma2 将自动下载 gemma2 模型到本地并启动。将 ollama 的默认 base URL=http://127.0.0.1:11434/v1/以及 api_key=ollama 填入 LLM 加载器节点即可调用 ollama 中的模型进行实验。 如果 ollama 连接不上,很可能是代理服务器的问题,请将 127.0.0.1:11434 添加到不使用代理服务器的列表中。 3. 对于图片相关的工作流,比如 0 基础手搓 AI 拍立得: 上传输入图片。 理解图片信息,提取图片中的文本内容信息。 进行场景提示词优化/图像风格化处理。 返回文本/图像结果。 为了简化流程,可以选择 Coze 平台实现零代码版本的工作流。搭建流程时,主要关注以下几个步骤: 上传图片:将本地图片转换为在线 OSS 存储的 URL,以便在平台中进行调用。 插件封装:将图片理解大模型和图片 OCR 封装为工作流插件,实现便捷调用,如果市场里面有可以直接使用。 4. Coze 的工作流是一种可视化的方式,允许用户组合各种功能模块,如插件、大语言模型、代码块等,从而实现复杂和稳定的业务流程编排。具体来说: 工作流由多个节点组成,包括 Start 节点和 End 节点。用户可以在这些节点之间添加各种功能模块,构建出所需的业务流程。 工作流支持丰富的功能模块,包括调用大语言模型进行文本生成、调用插件进行数据处理等。用户可以根据需求灵活组合这些模块。 工作流的创建和编辑都可以通过可视化的拖拽界面完成,无需编写代码。这大大降低了工作流搭建的门槛。 创建好的工作流可以直接集成到 Coze 的聊天机器人中使用,实现复杂的业务逻辑。 总的来说,Coze 的工作流为用户提供了一种可视化、低代码的方式,来快速搭建满足业务需求的 AI 应用和服务。这极大地降低了开发门槛,让更多人可以利用 AI 技术来提升工作效率。但请注意,上述内容由 AI 大模型生成,请仔细甄别。
2025-02-26
我是一个ai零基础小白,你需要基于当前知识库内容,帮我规划学习该知识库的学习计划,请详细明确
以下是为您规划的学习 AI 的详细计划: 一、基础概念学习 1. 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 2. 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、正式学习 1. 在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程,学习生成式 AI 等基础知识。 2. 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,包括图像、音乐、视频等。您可以根据自己的兴趣选择特定的模块进行深入学习。同时,一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 1. 理论学习之后,实践是巩固知识的关键。尝试使用各种产品做出您的作品。 2. 在知识库中查看大家实践后的作品、文章分享,并在自己实践后也进行分享。 五、体验 AI 产品 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,知识库中还提到了以下内容: 1. 博主会精美地解释六大策略,小七姐在社区带来共学课程并有直播分享及回放,像喂饭教程般帮助理解 prompt。每个板块下有共学快闪,社区老师会带着大家动手操作并讲解思路,还提到官方最佳 prompt 有 6 个实践办法,看熟任意一个即可。 2. 智能体由大语言模型衍生而来,因提示词不太可控才有此进阶。还讲述了智能体进阶案例拆解,推荐景淮老师的相关成果。然后阐述扣子、千帆百炼属于智能体范畴,扣子更偏 ToC 应用,所以有专门讲解扣子相关内容。 3. 学习 AI agent 可能较痛苦,建议先吃透 prompt 再看相关内容。官方文档内容很全面,包含市面上 cos 的教程等。社区小伙伴参加 cos 比赛常拿大奖,有共学活动,获奖小伙伴会分享经验。cos 平台可用于工作生产,有很多功能,感兴趣可体验其官网,能进行对话感受功能。 4. 关于 AI 知识库使用及 AIPO 活动的介绍:讨论了 AI 知识库的使用情况、AIPO 活动的发起背景、内容安排及相关资源等。 5. AIPO 线下活动及 AI 相关探讨:讨论了 AIPO 线下活动的规则和玩法,以及 AI 在科技发展中的重要地位和相关研究方向。 6. way to AGI 社区活动与知识库介绍:讨论了 way to AGI 社区活动的安排、材料准备以及知识库的使用和相关内容更新等情况。 7. AI 相关名词解释:包括 AGI、AIGC、agent、prompt 等,建议通过与 AI 对话或李继刚老师的课程来理解。 8. 知识库的信息来源:有赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等,推荐大家订阅获取最新信息并投稿。 9. 社区共创项目:如 AIPU、CONFIUI 生态大会,每月有切磋大会等活动,还发起了新活动 AIPO。 10. 学习路径:有李弘毅老师的生成式 AI 导论等高质量学习内容,可系统化学习或通过社区共创活动反推学习,鼓励整理学习笔记并分享交流。 11. 经典必读文章:如介绍 GPT 运作原理、Transformer 模型、扩散模型等的文章,还包括软件 2.0 时代相关内容。 12. 初学者入门推荐:推荐看 open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。 13. 历史脉络类资料:整理了 open AI 的发展时间线和万字长文回顾等。 您可以根据自己的需求和兴趣,有针对性地深入学习这些内容。
2025-02-24
我是一个ai小白,想要从头开始学ai,请帮我列一个学习计划
以下是为您制定的从零基础开始学习 AI 的计划: 一、了解 AI 基本概念 1. 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 2. 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 1. 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 2. 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。同时,建议您掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键。尝试使用各种产品做出您的作品,在知识库中也有很多大家实践后的作品、文章分享,欢迎您实践后进行分享。 五、体验 AI 产品 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 六、设计自己的学习路径 完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法。 七、参考他人学习经验 您可以参考《雪梅 May 的 AI 学习日记》,了解作者从零基础到逐渐掌握 AI 的过程和方法。但需要注意,其中的学习内容可能因 AI 发展而有所变化,您可以在 waytoAGI 社区发现自己感兴趣的 AI 领域,学习最新的内容。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。
2025-02-24
我是一个什么都不懂的小白,但是我想通过ai弄出一个应用,我该怎么做?
对于纯小白想要通过 AI 开发应用,您可以参考以下步骤: 1. 从基础小任务开始: 让 AI 按照最佳实践为您写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以此学会必备的调试技能。 比如在学习写 chrome 插件时,可以要求 AI 选择适合小白上手的技术栈生成简单的示范项目,并包含尽可能全面的典型文件和功能,同时讲解每个文件的作用和程序运行的逻辑。 如果使用 o1mini,还可以在提示词最后添加“请生成 create.sh 脚本,运行脚本就能直接创建插件所需要的所有文件。请教我如何运行脚本。”(windows 机器则是 create.cmd),从而一次性生成多个目录和文件。 2. 明确项目需求: 通过和 AI 的对话,逐步明确项目需求。 可以让 AI 像高级别的懂技术的产品经理那样向您提问,帮助梳理产品功能,尤其注意涉及技术方案选择的关键点。 来回对话后,让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知正在做的功能点。 需要注意的是,虽然 AI 能提供帮助,但对于复杂的应用开发,仍需要您在过程中逐渐学习一些编程知识。目前像字节 Coze 这样的工具本质上是「AIfirst aPaaS」,它把实现应用所需的不同类型代码用不同可视化工具实现,生成的是「配置」,且开发和运行阶段都有大模型的支持。
2025-02-24
我是0基础代码小白,我希望快速编写一款APP,满足我所需要的要求,我用deepseek生产app开发者文档,然后用bolt.new工具开发,开发到一半,发现要收费,给我中断了,我该怎么办
对于您这种 0 基础代码小白在开发 APP 过程中遇到收费中断的情况,以下是一些建议: 1. 重新评估您的需求和能力:像案例中的白九龄一样,思考您的想法是否过于复杂,是否可以先从简单的插件开发入手,降低开发难度。 2. 学习基础知识:包括代码环境安装、终端操作等,通过基础实践教程资料来弥补知识短板。 3. 借鉴他人成功经验:仔细研究别人的项目,按照成功的案例原封不动地去实现,从中领悟开发的要点。 4. 清晰描述需求:在开发前与工具充分沟通,明确需求和实现步骤,避免盲目开发。 5. 寻找免费替代工具:既然当前使用的工具收费中断,您可以寻找其他类似的免费工具来继续您的开发工作。 6. 做好项目记录:让工具帮忙写一个 README 文档,记录项目进展、下一步计划以及如何开启和关闭项目,方便后续跟进。
2025-02-23
你好,我想用ai将一张图片形式的数字表格转换成excel,应该使用哪款模型?
很抱歉,上述提供的内容中没有直接提及将图片形式的数字表格转换成 Excel 可用的具体模型。但您可以尝试以下几种常见的方法和工具: 1. 一些 OCR(光学字符识别)软件,如 ABBYY FineReader、Adobe Acrobat Pro 等,它们通常具有将图片中的表格转换为可编辑文本的功能,然后您可以将其粘贴到 Excel 中进行整理。 2. 在线 OCR 服务,例如百度 OCR、腾讯 OCR 等,操作相对便捷。 3. 某些专门用于表格处理的 AI 工具,您可以通过在相关的技术论坛、社区或专业的软件评价网站上进一步搜索和了解。
2025-02-26
图片的提示词的精准度
以下是关于图片提示词精准度的相关内容: 画面精度提示词: high detail(高细节) hyper quality(高品质) high resolution(高分辨率) FHD, 1080P, 2K, 4K, 8K 8k smooth(8K 流畅) 渲染效果提示词: Unreal Engine(虚幻引擎) octane render(渲染器) Maxon Cinema 4D 渲染器 architectural visualisation(建筑渲染) Corona Render(室内渲染) Quixel Megascans Render(真实感) VRay(V 射线) Behance C4D 3D blender surreal photography(超现实摄影) realistic 3D(真实 3D) zbrush 在描述图片提示词时,通常的逻辑包括:人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。通过这些详细的提示词,能更精确地控制绘图。 对于新手而言,有以下辅助书写提示词的方法和网站: 下次作图时,先选择模板,点击倒数第二个按钮快速输入标准提示词。 功能型辅助网站,如:http://www.atoolbox.net/,通过选项卡方式快速填写关键词信息。 https://ai.dawnmark.cn/,每种参数有缩略图参考,方便直观选择提示词。 去 C 站(https://civitai.com/)抄作业,每一张图都有详细参数,可点击复制数据按钮,粘贴到正向提示词栏,Stable Diffusion 会自动匹配参数,但要注意图像作者使用的大模型和 LORA,不然即使参数一样,生成的图也会不同。也可以只取其中较好的描述词,如人物描写、背景描述、小元素或画面质感等。 提示词所做的工作是缩小模型出图的解空间,即缩小生成内容时在模型数据里的检索范围,而非直接指定作画结果。提示词的效果受模型影响,不同模型对自然语言、单词标签等语言风格的反应不同。 提示词中可以填写以下内容: 自然语言:可以使用描述物体的句子作为提示词,大多数情况下英文有效,也可用中文,避免复杂语法。 单词标签:使用逗号隔开的单词作为提示词,一般使用普通常见单词,单词风格要和图像整体风格搭配,避免拼写错误,可参考 Emoji、颜文字:Emoji 表情符号准确且在语义准确度上表现良好,对构图有影响。关于 emoji 确切含义,可参考。对于使用 Danbooru 数据的模型,西式颜文字可在一定程度上控制出图的表情。
2025-02-26
文字生图片
文字生图片是通过文字描述来生成图片的一种技术。以下是一些相关信息: 在离谱村,通过 midjourney 可以实现文生图,具体操作方式暂未详细说明。 LayerStyle 副本中的 TextImage 支持从文字生成图片以及遮罩,具有多项可设置的参数,包括字间距、行间距、横排竖排调整、侧边边距、顶部边距、文字总体大小、字符随机变化范围、随机变化的种子、文字排版、画面宽度和高度、文字颜色、背景颜色等。 在《促进创新的人工智能监管方法》中提到了文字到图片生成器的相关内容,如适应性(使用大量在线内容根据简短的文字提示学习创建丰富、高度特定的图像)和自主性(基于文字输入生成模仿人类创作艺术品质的图像,无需用户持续监督),同时也提到了可能存在的如训练数据中的偏差或刻板印象导致的冒犯性语言或内容等监管影响。
2025-02-26
配置“DeepSeek-R1”模型的 API key:基础 URL:https://ark.cn-beijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。添加“DeepSeek-R1”模型。这个行为在Macbook中怎么操作,请进行指导,通过图片、文字、数据、网址等形式
在 Macbook 中配置“DeepSeekR1”模型的 API key 及添加模型的操作步骤如下: 1. 获取 DeepSeekR1 满血版密钥: 注册并登录火山引擎,点击立即体验进入控制台:https://zjsms.com/iP5QRuGW/ 。 创建一个接入点,点击在线推理创建推理接入点。 为接入点命名为 DeepSeekR1。若提示“该模型未开通,开通后可创建推理接入点”,点击“立即开通”,勾选全部模型和协议一路开通(免费)。 确认无误后,点击“确认接入”按钮。 自动返回创建页面,复制多出的接入点名称“DeepSeekR1”。 点击【API 调用】按钮,进入后点击【选择 API Key 并复制】,若没有则点击【创建 API key】,复制并保存。 2. 配置“DeepSeekR1”模型的 API key: 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 。 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 配置 API key:基础 URL:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 添加“DeepSeekR1”模型。 3. 环境配置指南: 首先到 deepseek 的官网(https://www.deepseek.com/),进入右上角的 API 开放平台。若没有赠送余额,可选择充值,支持美元和人民币两种结算方式及各种个性化充值方式,并创建一个 API key(注意及时保存,只会出现一次)。 以 cursor 作为代码编辑器为例,下载安装后,在插件页面搜索并安装 Roocline 。安装完后,打开三角箭头,选中 RooCline 并点击齿轮,进入设置,依次设置: API Provider:选择 DeepSeek 。 API Key:填入已创建的 key 。 模型:选择 DeepSeekreasoner 。 语言偏好设置。 记得把 HighRisk 选项都打开,最后点击 Done 保存修改。 在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。
2025-02-26
图片去水印工具
以下是一些常见的图片去水印工具: 1. AVAide Watermark Remover:在线工具,使用 AI 技术,支持多种图片格式(如 JPG、JPEG、PNG、GIF 等)。操作简单,上传图片、选择水印区域,保存并下载处理后的图片,还提供去除文本、对象、人物、日期和贴纸等功能。 2. Vmake:提供 AI 去除图片水印功能,可上传最多 10 张图片,AI 自动检测并移除水印,处理完成后可保存生成的文件,适合需快速去水印并在社交媒体分享图片的用户。 3. AI 改图神器:提供 AI 智能图片修复去水印功能,可一键去除图片中多余物体、人物或水印,不留痕迹。支持直接粘贴图像或上传手机图像,操作简便。 此外,还有以下工具可供选择: 对于去除图片中特定物体(如右手的手串),除了 PS,PS 的 AI 版、SD 局部重绘、Firefly、canva、Google photo 都有局部重绘功能,微软 Designer 也免费。 ProPainter:一键移除视频内物体或水印,基于 E2FGVI 实现。 收费但效果较好的工具如:https://anieraser.media.io/app。 效果一般的免费工具:https://onlinevideocutter.com/removelogo。 您可以根据具体需求选择最适合您的去水印工具。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-25
图片生成
图像生成是 AIGC 的一个重要领域,它离不开深度学习算法,如生成对抗网络(GANs)、变分自编码器(VAEs)以及 Stable Diffusion 等,以创建与现实世界图像视觉相似的新图像。图像生成可用于数据增强以提高机器学习模型的性能,也可用于创造艺术、生成产品图像,如艺术作品、虚拟现实场景或图像修复等。 一些具有代表性的海外图像生成项目包括: Stable Diffusion:文本生成图像模型,主要由 VAE、UNet 网络和 CLIP 文本编码器组成。首先使用 CLIP 模型将文本转换为表征形式,然后引导扩散模型 UNet 在低维表征上进行扩散,之后将扩散之后的低维表征送入 VAE 中的解码器,从而实现图像生成。 DALLE 3(Open AI):OpenAI 基于 ChatGPT 构建的一种新型神经网络,可以从文字说明直接生成图像。 StyleGAN 2(NVIDIA):一种生成对抗网络,可以生成非常逼真的人脸图像。 DCGAN(Deep Convolutional GAN):一种使用卷积神经网络的生成对抗网络,可生成各种类型的图像。 在实际应用中,如生成 Jellycat 风的毛茸茸玩偶,操作步骤如下: 1. 打开即梦 AI,选择图片生成。(https://jimeng.jianying.com/) 2. 输入提示词,格式为“Jellycat 风+毛茸茸的 XXX”,发挥创意。 3. 选择最新的模型,将精细度拉到最大值,点击生成。 此外,还有景淮镜子画布小游戏中的图片生成需求,例如生成可爱画风、左右对称结构、线条简单且只有唯一主人公的机器人图片。还可以通过输入不同的提示词进行测试,如“一只小猫”。在图片处理方面,也有基于中轴线裁剪、增加空白图片、添加辅助线等不同的需求和处理方式。
2025-02-25
如何利用ai提高学习能力
利用 AI 提高学习能力可以从以下方面入手: 英语学习: 1. 智能辅助工具:如 Grammarly 可进行英语写作和语法纠错,改进表达和写作能力。 2. 语音识别和发音练习:使用 Call Annie 进行口语练习和发音纠正,获取实时反馈和建议。 3. 自适应学习平台:Duolingo 能利用 AI 技术量身定制学习计划,提供个性化内容和练习。 4. 智能导师和对话机器人:ChatGPT 可用于英语会话练习和对话模拟,提高交流能力和语感。 数学学习: 1. 自适应学习系统:Khan Academy 结合 AI 技术提供个性化学习路径和练习题,精准推荐。 2. 智能题库和作业辅助:Photomath 通过图像识别和数学推理技术提供问题解答和解题步骤。 3. 虚拟教学助手:Socratic 利用 AI 技术解答数学问题、提供教学视频和答疑服务。 4. 交互式学习平台:参与 Wolfram Alpha 的学习课程和实践项目,利用 AI 技术进行数学建模和问题求解。 学习一门外语的通用方法: 1. 设定目标:明确学习目标和时间表,分阶段完成任务。 2. 多样化练习:结合听、说、读、写多种方式全面提升语言技能。 3. 模拟真实环境:多与母语者交流,或用 AI 对话助手模拟真实对话场景。 4. 定期复习:使用 AI 工具的复习功能,根据记忆曲线定期复习已学内容巩固记忆。 在医疗保健领域,鉴于人工智能依赖的神经网络基础,专家 AI 可能通过元学习更快地获得知识,并带着人类一同进步。AI 的特性使我们能将其一部分一部分地拆解研究,构建系统深入探索其内部工作机制,创造学习的飞轮,最终可能成为下一代专家(无论是人类还是 AI)的教师。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-26
我想学习制作机器人 机器狗等的原理及方法,给我一份理论指导和操作指南吧。
以下是关于制作机器人和机器狗的理论指导和操作指南: 具身智能是将机器学习算法适配至物理实体,与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”通过网页端、手机 APP 与用户交互,能接受多种模态指令实现复杂任务。具身智能体则将大模型嵌入物理实体,通过传感器与人类交流,强调与物理环境交互。人形机器人是具身智能的代表产品。 具身智能有三要素: 1. 本体:即硬件载体,不同环境有不同形态的硬件本体适应,如室内平地适用轮式机器人,崎岖地面适用四足机器人(机器狗)。 2. 智能:包括大模型、语音、图像、控制、导航等算法。 3. 环境:本体所交互的物理世界,本体、智能、环境高度耦合是高级智能基础。 具身智能还有四个模块:感知决策行动反馈。一个具身智能体的行动分为这四个步骤,分别由四个模块完成并形成闭环。在具身智能体与环境的交互中,智能算法通过本体传感器感知环境,做出决策操控本体执行动作任务影响环境,还可通过“交互学习”和拟人化思维学习适应环境实现智能增长。
2025-02-26
那普通人要研发机器狗从哪方面开始学习?
对于普通人想要研发机器狗,以下这些 AI 相关的基础知识是很有帮助的: 1. 了解 AI 的概念:AI 即人工智能,是让计算机模拟人类智能的技术。 2. 掌握机器学习:这是电脑找规律学习的方式,包括监督学习、无监督学习和强化学习。 监督学习:使用有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归任务。 无监督学习:处理没有标签的数据,让算法自主发现规律,例如聚类任务,像将一堆新闻文章按主题或内容特征分组。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训练小狗。 3. 深度学习:这是一种参照人脑构建神经网络和神经元的方法,由于有很多层所以称为深度。神经网络可用于监督学习、无监督学习和强化学习。 4. 熟悉生成式 AI:能够生成文本、图片、音频、视频等内容形式。 5. 了解 LLM(大语言模型):对于生成式 AI,生成图像的扩散模型不属于大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解,像上下文理解、情感分析、文本分类等,但不太擅长文本生成。 6. 关注技术里程碑:例如 2017 年 6 月谷歌团队发表的论文《Attention is All You Need》,首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖循环神经网络或卷积神经网络。 这些基础知识能为您研发机器狗提供理论支持和技术思路。
2025-02-26
怎么学习提示词 prompt
以下是关于如何学习提示词(prompt)的全面指导: 一、理解提示词的作用 提示词向模型提供上下文和指示,其质量直接影响模型输出的质量,能让模型更准确地理解并完成所需任务。 二、学习提示词的构建技巧 1. 明确任务目标,用简洁准确的语言描述。 2. 给予足够的背景信息和示例,帮助模型理解语境。 3. 使用清晰的指令,如“解释”“总结”“创作”等。 4. 对特殊要求应给予明确指示,如输出格式、字数限制等。 三、参考优秀案例 研究和学习已有的优秀提示词案例,可在领域社区、Github 等资源中找到大量案例。 四、实践、迭代、优化 多与语言模型互动,根据输出提高提示词质量。尝试各种变体,比较分析输出差异,持续优化提示词构建。 五、活用提示工程工具 目前已有一些提示工程工具可供使用,如 Anthropic 的 Constitutional AI。 六、跟上前沿研究 提示工程是当前最前沿的研究领域之一,持续关注最新的研究成果和方法论。 七、具体学习步骤 1. 拥有一个大模型帐号,并熟悉与之对话的方式。推荐 ChatGPT4 及国产平替:。 2. 阅读 OpenAI 的官方文档:。 精心设计的提示词能最大限度发挥语言模型的潜力,多实践、多学习、多总结,终可掌握窍门。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-26