Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

提示词的常见结构

Answer

提示词常见的结构包括以下几种:

  1. 视频模型 Vidu 的提示词结构:
    • 基本构成:主体/场景——场景描述——环境描述——艺术风格/媒介。需调整句式和语序,避免主体物过多/复杂、分散的句式描述,避免模糊术语表达,使用流畅准确的口语化措辞,避免过度文学化叙述,丰富、准确和完整的描述以生成特定艺术风格、满足需求的视频。
    • 与画面联想程度的说明:以单帧图像为例,通过具体详实的位置描述/环境描述进行构图,帮助构建画面基本呈现效果;通过艺术风格描述进一步提升效果和氛围,统一画面风格。
  2. DALL·E 自动优化提示词结构:
    • 提示词生成指南:强调使用精确、视觉化的描述而非难以捉摸的概念,清晰明确的指示有助于生成高质量图像。
    • 提示词结构:是一个包括媒介、主题、背景、风格特点等多个元素的模板。媒介指定图像应模仿的艺术形式;主题是图像焦点,包括颜色、姿势和视角等;背景描述主题与环境的关系,包括时间、光线方向等;风格特点包括图像的独特艺术特点。还提供了生成图像和提出新想法的具体步骤和要求,默认设置除非另有说明会使用默认宽高比和风格,同时提醒避免使用违反服务条款的词语或概念。
  3. Runway 提示词结构:
    • 基本提示:纯文本提示遵循清晰结构,将相机运动、场景和主题的细节划分为单独部分时最有效。非纯文本提示为图片+基本提示词结构,使用输入图像时应专注描述希望在输出中看到的动作,而非图像内容。
Content generated by AI large model, please carefully verify (powered by aily)

References

视频模型:Vidu

主体/场景——场景描述——环境描述——艺术风格/媒介调整句式和语序,避免主体物过多/复杂,主体物分散的句式描述;避免模糊的术语表达,尽可能准确;使用更加流畅准确的口语化措辞,避免过度文学化的叙述;丰富、准确和完整的描述才能生成特定艺术风格、满足需求的视频。[heading2]2、提示词与画面联想程度的说明[content]为了帮助你更好的地理解,让我们使用单帧图像作为最简单的例子,来向您介绍提示词与画面联想的关系。示例图如下:基础词:玻璃桌上的咖啡杯,杯子外面写着单词LOVE。适度联想扩充:花园里(具体的位置描述)的透明(材质描述)玻璃桌上的咖啡杯,杯子外面写着单词LOVE,周围满是盛开的鲜花(具体的位置描述/环境描述),和煦的阳光洒满整个花园(环境描述),Claude Monet(艺术家风格),印象派风格(艺术流派风格)。联想关键点:1.具体详实的位置描述/环境描述:笼统来讲就是在进行构图,可以帮助构建画面的基本呈现效果;2.艺术风格描述:进一步提升效果和氛围,统一画面风格。

DALL·E 自动优化提示词

1.提示词生成指南:这部分强调使用“精确、视觉化的描述”而不是“难以捉摸的概念”。清晰、明确的指示来生成图像有助于DALLE-3生成更高质量的图像。2.提示词结构:这是一个模板,包括媒介、主题、背景等多个元素,用于创建详细的提示词。媒介:指定图像应模仿的艺术形式。主题:图像的焦点,包括颜色、姿势和视角等。背景:描述主题与环境的关系,包括时间、光线方向等。风格特点:包括图像的独特艺术特点,如使用的技术、影响等。生成图像和新想法:提供了生成图像和提出新想法的具体步骤和要求。默认设置:除非另有说明,否则会使用默认的宽高比和风格。重要注意事项:提醒DALLE-3避免使用违反服务条款的词语或概念。[heading2]总结[content]可以看出,这个提示词大概率是由具备摄影专业知识的人编写的,其中涉及的元素、用词都很全面且专业,所以这个提示词的效果才会这么好。但是生成的图像也一般有一个通病就是:乍一看好像都很好,但是细节上会有瑕疵,这类问题多见于涉及到人物图像的时候,上面的天使有几张的脸就是有些微的问题的。实物画就会好很多。不过总体来说生成的图像质量还是非常高的!都颇具想象力!而且就算有些微的瑕疵,也可以通过后期改一下,办法总比困难多!大家也快去试一试吧~

Runway提示词

提示词结构1.纯文本提示:当它们遵循一个清晰的结构,将[相机运动]、[场景]和[主题]的细节划分为单独的部分时,它们最有效。[camera movement]:[establishing scene].[][相机运动方式]:[场景].[添加细节]注意:重复或加强在不同部分中关键想法可以帮助提高输出的遵守度。例如,你可能会注意到摄像机在超速镜头中快速穿越场景。1.非纯文本提示:Image+Text Base Prompt图片+基本提示词结构注意:使用-*-输入图像时,请专注于描述您希望在输出中看到的动作,而不是图像的内容。

Others are asking
怎么写好提示词
写好提示词(prompt)需要注意以下几点: 1. 明确任务:清晰地定义任务,比如写故事时包含故事背景、角色和主要情节。 2. 提供上下文:若任务需要特定背景知识,要提供足够信息,如写历史事件报告时提供基本信息。 3. 使用清晰语言:尽量用简单、清晰的语言描述任务,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,在提示词中明确指出,如文章需遵循特定格式或引用特定文献。 5. 使用示例:如有特定期望结果,提供示例帮助 AI 模型理解需求。 6. 保持简洁:提示词简洁明了,过多信息可能导致 AI 模型困惑,生成不准确结果。 7. 使用关键词和标签:有助于 AI 模型理解任务主题和类型。 8. 测试和调整:生成文本后仔细检查结果,根据需要调整提示词,可能需要多次迭代达到满意结果。 在星流一站式 AI 设计工具中: 1. 输入语言方面,通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),支持中英文输入。 2. 写好提示词的方法包括: 预设词组:小白用户可点击提示词上方官方预设词组进行生图。 提示词内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质,如一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可帮助 AI 理解不想生成的内容,如不好的质量、低像素、模糊、水印。 利用“加权重”功能:在功能框增加提示词并进行加权重调节,权重数值越大越优先,还可对已有提示词权重进行编辑。 辅助功能:有翻译功能可一键将提示词翻译成英文,还有删除所有提示词和会员加速等功能。 此外,宝玉日报提到提示词应清晰明确,避免模糊不清的指令,因为 AI 无法理解用户的背景和想法,不会读心术。工作或恋爱中常见的误区同样适用于 AI 交互,要提供足够的背景信息和清楚的需求描述,以确保模型给出准确结果。
2025-02-04
提示词
以下是关于提示词的相关知识: 艺术字生成: 模型选择图片 2.1,输入提示词(可参考案例提示词)。 案例参考: 金色立体书法,“立冬”,字体上覆盖着积雪,雪山背景,冬季场景,冰雪覆盖,枯树点缀,柔和光影,梦幻意境,温暖与寒冷对比,静谧氛围,传统文化,唯美中国风。 巨大的春联,金色的书法字体,线条流畅,艺术美感,“万事如意”。 巨大的字体,书法字体,线条流畅,艺术美感,“书法”二字突出,沉稳,大气,背景是水墨画。 巨大的奶白色字体“柔软”,字体使用毛绒材质,立在厚厚的毛绒面料上,背景是蓝天。 星流一站式 AI 设计工具: 在 prompt 输入框中可输入提示词,使用图生图功能辅助创作。 提示词相关: 什么是提示词:用于描绘想生成的画面,支持中英文输入。星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发)。 如何写好提示词: 预设词组:小白用户可点击提示词上方官方预设词组进行生图,提示词内容应准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可帮助 AI 理解不想生成的内容,如不好的质量、低像素、模糊、水印。 利用“加权重”功能:可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先,也可对已有的提示词权重进行编辑。 辅助功能:包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 提示词要素: 提示词由一些要素组成,包括指令(想要模型执行的特定任务或指令)、上下文(包含外部信息或额外的上下文信息,引导语言模型更好地响应)、输入数据(用户输入的内容或问题)、输出指示(指定输出的类型或格式)。 示例:在一个旨在完成文本分类任务的提示中,指令是“将文本分类为中性、否定或肯定”,输入数据是“我认为食物还可以”部分,输出指示是“情绪:”。提示词所需的格式取决于想要语言模型完成的任务类型,并非所有要素都是必须的。
2025-02-04
提示词定义 思维链
提示词是设计和优化输入到 AI 系统的指令的艺术和科学,就像是与 AI 对话的语言。提示词本质上是逻辑思维和表达能力,只不过交互对象从人变成了大模型。最终要面对的问题包括知识储备不足、业务 know how 不扎实、语言逻辑有缺陷。 思维链(Chain of Thought,CoT)是一种提示技巧,使用 CoT 来指导 AI 就像进行一次探险,尽管有一条指引的路径,但每一步都需要深入的思考和策略,以确定最佳的前进方向。 密度链(Chain of Density,CoD):使用 CoD 来指导 AI 就像按照特定的顺序和结构建造一座积木塔。每一步都必须精确和有组织,以确保整体的稳定性和连续性。 在撰写提示词时,输出结果的好坏与“连续提示”息息相关,特别在“目标明确、逻辑性、分步骤、考虑变量”这四方面。随着企业面临的挑战日益复杂,简单的提示词往往无法满足需求,推动了更先进提示技巧如思维链、思维树和思维图等的发展,这些高级技巧能够引导 AI 进行更深入的分析、探索多种可能性,并处理复杂的推理任务。
2025-02-04
提示词定义
提示词(Prompt)是给大语言模型的输入文本,用于指定模型执行的任务和生成的输出。它发挥“提示”模型的作用,设计高质量的提示词需根据目标任务和模型能力精心设计,良好的提示词能让模型正确理解人类需求并给出符合预期的结果。 提示词由一些要素组成,包括指令(想要模型执行的特定任务或指令)、上下文(包含外部信息或额外的上下文信息,引导语言模型更好地响应)、输入数据(用户输入的内容或问题)、输出指示(指定输出的类型或格式)。但提示词所需的格式取决于想要语言模型完成的任务类型,并非所有要素都是必须的。 在星流一站式 AI 设计工具的 prompt 输入框中可以输入提示词、使用图生图功能辅助创作。输入语言方面,不同基础模型有不同要求,支持中英文输入。写好提示词要做到内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等;可调整负面提示词,帮助 AI 理解不想生成的内容;利用“加权重”功能让 AI 明白重点内容;还可使用预设词组、辅助功能如翻译、删除所有提示词、会员加速等。
2025-02-04
为本地部署的stable diffusion增加中文提示词支持
要为本地部署的 Stable Diffusion 增加中文提示词支持,可以采取以下方法: 1. 如果使用的秋叶整合包,里面包含提示词联想插件。输入简单字符如“1”,能看到下方联想热门提示词,适合英文不好、记不住单词的朋友。 2. 一般情况可使用翻译软件,如 DeepL 翻译(网址:https://www.deepl.com/translator ,可下载客户端)或网易有道翻译(可通过 ctrl+alt+d 快速截图翻译),但复制粘贴来回切换较麻烦。 3. 介绍自动翻译插件 promptallinone,安装方式:在扩展面板中搜索 promptallinone 直接安装,或把下载好的插件放在“……\\sdwebuiakiv4\\extensions”路径文件夹下。安装完成后重启 webUI,可看到提示词区域变化。 一排小图标中,第一个用来设置插件语言,直接设为简体中文。 第二个图标是设置,点开后点击第一个云朵图标可设置翻译接口,点击第一行下拉菜单能选择翻译软件,有一些免费软件可任意选择并试验哪款翻译准确。 关于 Stable Diffusion 文生图写提示词: 1. 下次作图时,先选模板,点击倒数第二个按钮可快速输入标准提示词。 2. 描述逻辑通常包括人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)等,通过这些详细提示词能更精确控制绘图。 3. 新手可借助功能型辅助网站写提示词,如: http://www.atoolbox.net/ ,通过选项卡方式快速填写关键词信息。 https://ai.dawnmark.cn/ ,每种参数有缩略图参考,更直观选择提示词。 还可去 C 站(https://civitai.com/)抄作业,每张图有详细参数,点击复制数据按钮,粘贴到正向提示词栏,点击生成按钮下第一个按键,Stable Diffusion 可自动匹配所有参数,但要注意图像作者使用的大模型和 LORA,也可取其中较好的描述词使用。
2025-02-03
提示词
以下是关于提示词的相关知识: 艺术字生成: 模型选择图片 2.1,输入提示词(可参考案例提示词)。 案例参考: 金色立体书法,“立冬”,字体上覆盖着积雪,雪山背景,冬季场景,冰雪覆盖,枯树点缀,柔和光影,梦幻意境,温暖与寒冷对比,静谧氛围,传统文化,唯美中国风。 巨大的春联,金色的书法字体,线条流畅,艺术美感,“万事如意”。 巨大的字体,书法字体,线条流畅,艺术美感,“书法”二字突出,沉稳,大气,背景是水墨画。 巨大的奶白色字体“柔软”,字体使用毛绒材质,立在厚厚的毛绒面料上,背景是蓝天。 星流一站式 AI 设计工具: 在 prompt 输入框中可输入提示词,使用图生图功能辅助创作。 提示词相关: 用于描绘想生成的画面。 输入语言: 星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),支持中英文输入。 提示词优化:启用后可扩展提示词,更生动地描述画面内容。 写好提示词的方法: 预设词组:小白用户可点击提示词上方官方预设词组进行生图。 内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质,如一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可帮助 AI 理解不想生成的内容,如不好的质量、低像素、模糊、水印。 利用“加权重”功能:可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先;也可对已有的提示词权重进行编辑。 辅助功能:翻译功能可一键将提示词翻译成英文;删除所有提示词可清空提示词框;会员加速可加速图像生图速度,提升效率。 提示词要素: 提示词由一些要素组成,包括指令(想要模型执行的特定任务或指令)、上下文(包含外部信息或额外的上下文信息,引导语言模型更好地响应)、输入数据(用户输入的内容或问题)、输出指示(指定输出的类型或格式)。 示例:在文本分类任务的提示中,指令是“将文本分类为中性、否定或肯定”,输入数据是“我认为食物还可以”,输出指示是“情绪:”。提示词所需格式取决于语言模型要完成的任务类型,并非所有要素都是必须的。
2025-02-01
常见的AI变现途径有哪一些
常见的 AI 变现途径主要包括以下几种: 1. 开发智能体:例如像 May 用 coze 捏了一个口语陪练 bot,并在豆包 APP 上随时使用。 2. AI 绘画相关: 用 AI 制作服装,如单价 239 元的 AI 小绿裙卖了 1160 多份,销售额达 27 万。熟练者可用 sd 或 mj 制作,新手可用 mewxai 或幻火。 用 AI 定制萌娃的头像,单价 19.9 元,卖了 2675 份,销售额达 5 万。 3. 针对特定群体的服务:如针对宝妈群体的婴儿四维彩超 AI 预测,后续还包括头像定制、绘画收徒、宝宝起名字、售胎毛纪念品、母乳纪念品、宝宝出生后的相关产品等。如果懂得私域的精细化运营,做好朋友圈运营,宝妈群体具有超高经济价值。
2025-01-15
常见GPU卡介绍与比较
以下是常见 GPU 卡的介绍与比较: 在选择 GPU 作为 AI 基础设施时,需要考虑多个因素: 训练与推理方面:训练大型 Transformer 模型通常需要在机器集群上完成,最好是每台服务器有多个 GPU、大量 VRAM 以及服务器之间的高带宽连接。许多模型在 NVIDIA H100 上最具成本效益,但获取较难且通常需要长期合作承诺。如今,NVIDIA A100 常用于大多数模型训练。对于大型语言模型(LLM)的推理,可能需要 H100 或 A100,而较小的模型如 Stable Diffusion 则对 VRAM 需求较少,初创公司也会使用 A10、A40、A4000、A5000 和 A6000 甚至 RTX 卡。 内存要求方面:大型 LLM 的参数数量众多,无法由单张卡容纳,需要分布到多个卡中。 硬件支持方面:虽然绝大多数工作负载在 NVIDIA 上运行,但也有公司开始尝试其他供应商,如谷歌 TPU 和英特尔的 Gaudi2,但这些供应商面临的挑战是模型性能高度依赖软件优化。 延迟要求方面:对延迟不太敏感的工作负载可使用功能较弱的 GPU 以降低计算成本,而面向用户的应用程序通常需要高端 GPU 卡来提供实时用户体验。 峰值方面:生成式 AI 公司的需求经常急剧上升,在低端 GPU 上处理峰值通常更容易,若流量来自参与度或留存率较低的用户,以牺牲性能为代价使用较低成本资源也有意义。 此外,算力可以理解为计算能力,在电脑中可直接转化为 GPU,显卡就是 GPU,除了 GPU 外,显存也是重要参数。GPU 是一种专门做图像和图形相关运算工作的微处理器,其诞生是为了给 CPU 减负,生产商主要有 NVIDIA 和 ATI。
2025-01-06
常见GPU卡介绍与比较
以下是常见 GPU 卡的介绍与比较: 在 AI 基础设施的考虑因素中,比较 GPU 时需要关注以下几个方面: 训练与推理: 训练 Transformer 模型除了模型权重外,还需要存储 8 字节的数据用于训练。内存 12GB 的典型高端消费级 GPU 几乎无法用于训练 40 亿参数的模型。 训练大型模型通常在机器集群上完成,最好是每台服务器有多个 GPU、大量 VRAM 以及服务器之间的高带宽连接。 许多模型在 NVIDIA H100 上最具成本效益,但截至目前很难找到在 NVIDIA H100 上运行的模型,且通常需要一年以上的长期合作承诺。如今,更多选择在 NVIDIA A100 上运行大多数模型训练,但对于大型集群,仍需要长期承诺。 内存要求: 大型 LLM 的参数数量太多,任何卡都无法容纳,需要分布到多个卡中。 即使进行 LLM 推理,可能也需要 H100 或 A100。但较小的模型(如 Stable Diffusion)需要的 VRAM 要少得多,初创公司也会使用 A10、A40、A4000、A5000 和 A6000,甚至 RTX 卡。 硬件支持: 虽然绝大多数工作负载都在 NVIDIA 上运行,但也有一些公司开始尝试其他供应商,如谷歌 TPU、英特尔的 Gaudi2。 这些供应商面临的挑战是,模型的性能往往高度依赖于芯片的软件优化是否可用,可能需要执行 PoC 才能了解性能。 延迟要求: 对延迟不太敏感的工作负载(如批处理数据处理或不需要交互式 UI 响应的应用程序)可以使用功能较弱的 GPU,能将计算成本降低多达 3 4 倍。 面向用户的应用程序通常需要高端 GPU 卡来提供引人入胜的实时用户体验,优化模型是必要的,以使成本降低到可管理的范围。 峰值: 生成式 AI 公司的需求经常急剧上升,新产品一经发布,请求量每天增加 10 倍,或者每周持续增长 50%的情况并不罕见。 在低端 GPU 上处理这些峰值通常更容易,因为更多的计算节点可能随时可用。如果这种流量来自于参与度较低或留存率较低的用户,那么以牺牲性能为代价使用较低成本的资源也是有意义的。 此外,算力可以直接转化成 GPU,电脑里的显卡就是 GPU。一张显卡除了 GPU 外,显存也是很重要的参数。GPU 的生产商主要有 NVIDIA 和 ATI。GPU 作为一种专门在个人电脑、工作站、游戏机和一些移动设备上做图像和图形相关运算工作的微处理器,其诞生源自对 CPU 的减负,使显卡减少了对 CPU 的依赖,并进行部分原本 CPU 的工作。
2025-01-06
面试AI岗位的,常见面试题
以下是面试 AI 岗位常见的面试题相关内容: 1. 关于 AI 面试官的相关产品: 用友大易 AI 面试产品:具有强大技术底座、高度场景贴合度、招聘全环节集成解决方案、先进防作弊技术和严密数据安全保障,能完成面试、初筛和自动发送面试邀约。 海纳 AI 面试:在线方式自动面试、评估,精准度高达 98%,面试效率提升 5 倍以上,候选人到面率提升最高达 30%。 InterviewAI:在线平台提供面试职位相关问题和 AI 生成的推荐答案,候选人用麦克风回答,会收到评估、建议和得分。使用时需考虑数据安全性和隐私保护问题。 2. 成为“AI 提示词工程师”的岗位技能要求: 市场调研、观察目标群体工作流、创造并拆解需求、选型现有 AI 解决方案做成产品来解决需求、抽象集成互联网 APP 产品、写 PRD、画 APP 产品原型图、组织团队进行 APP 产品开发。 对于零基础小白,建议找网上教程,看科普类教程,阅读 OpenAI 文档,理解参数作用,推荐练手的 Prompt 工具和相关教程文档。 3. AI 产品案例: 销售:话术总结优缺点、定制销售解决方案。 客服:定制客服话术。 HR:团队绩效管理、面试工具。
2024-12-13
AI在办公领域的常见应用有哪些
以下是 AI 在办公领域的一些常见应用: 1. 腾讯文档分类功能:利用数据分析和机器学习,自动分类办公文件,方便管理,市场规模达数亿美元。 2. WPS Office 中的智能排版、语法检查等功能:借助自然语言处理和机器学习,提高办公效率,实现自动化办公流程,市场规模达数十亿美元。 3. 联想设备管理平台:通过数据分析和物联网技术,对企业办公设备进行管理,包括设备状态监测、故障预警、软件更新等,提高设备利用率,市场规模达数亿美元。
2024-11-22
Aigc 常见名词解释
以下是一些 AIGC 常见名词的解释: AIGC:AI generated content,又称为生成式 AI,意为人工智能生成内容。例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等,都属于 AIGC 的应用。类似的名词缩写还有 UGC(普通用户生产),PGC(专业用户生产)等。能进行 AIGC 的产品项目和媒介众多,包括语言文字类(如 OpenAI 的 GPT,Google 的 Bard,百度的文心一言,还有一种国内大佬下场要做的的 LLM)、语音声音类(如 Google 的 WaveNet,微软的 Deep Nerual Network,百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits)、图片美术类(如早期的 GEN 等图片识别/生成技术,去年大热的扩散模型带火的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion)。 SD:是 Stable Diffusion 的简称。是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像。Stable Diffusion 是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model; LDM)。SD 的代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行。当前版本为 2.1 稳定版(2022.12.7)。源代码库:github.com/StabilityAI/stablediffusion 。 chatGPT:是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,于 2022 年 11 月 30 日发布,目前使用的是 GPT4 的 LLM。 AI:人工智能(Artificial Intelligence)。 AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing),就是说人话。 LLM:大型语言模型(Large Language Model),数据规模很大,没钱搞不出来,大烧钱模型。 此外,还有一些相对较难的名词解释: NAI: 咒语:prompts,关键词 施法/吟唱/t2i:Text2Image 魔杖:t2i/i2i 参数 i2i:Image2Image,一般特指全部图片生成 inpaint:i2i 一种 maskredraw,可以局部重绘 ti/emb/炼丹:Train 中的文本反转,一般特指 Embedding 插件 hn/hyper/冶金:hypernetwork,超网络 炸炉:指训练过程中过度拟合,但炸炉前的日志插件可以提取二次训练 废丹:指完全没有训练成功 美学/ext:aesthetic_embeddings,emb 一种,特性是训练飞快,但在生产图片时实时计算。 db/梦展:DreamBooth,目前一种性价比高(可以在极少步数内完成训练)的微调方式,但要求过高 ds:DeepSpeed,微软开发的训练方式,移动不需要的组件到内存来降低显存占用,可使 db 的 vram 需求降到 8g 以下。开发时未考虑 win,目前在 win 有兼容性问题故不可用 8bit/bsb:一般指 Bitsandbyte,一种 8 比特算法,能极大降低 vram 占用,使 16g 可用于训练 db。由于链接库问题,目前/预计未来在 win 不可用
2024-11-08
我是一个小白,想画一个卫生间结构的CAD图,请问用什么AI工具能实现?
对于您想画一个卫生间结构的 CAD 图,以下是一些可以辅助您的 AI 工具: 1. CADtools 12:这是一个 Adobe Illustrator 插件,为 AI 添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:这是 Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,能够帮助您创建复杂的几何形状和优化设计。 3. nTopology:这是一款基于 AI 的设计软件,可以帮助您创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:这是一款基于 AI 的 CAD 软件,可以根据您输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 生成设计工具:一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,这些工具可以根据您输入的设计目标和约束条件自动产生多种设计方案。 需要注意的是,这些工具通常需要一定的 CAD 知识和技能才能有效使用。对于 CAD 初学者,建议您先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。 关于 AI 生成 CAD 图的相关资料,您可以参考以下几个方面: 1. 学术论文:通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库进行搜索。 2. 专业书籍:查找与 AI 在 CAD 领域相关的专业书籍。 3. 在线课程和教程:参加 Coursera、edX、Udacity 等平台上的 AI 和 CAD 相关课程,在 YouTube 等视频平台上查找教程和演示视频。 4. 技术论坛和社区:加入相关的技术论坛和社区,如 Stack Overflow、Reddit 的 r/AI 和 r/CAD 等,与其他专业人士交流和学习。 5. 开源项目和代码库:探索 GitHub 等开源平台上的 AI 和 CAD 相关项目,例如 OpenAI 的 GPT3、AutoGPT 等 AI 模型在 CAD 设计中的应用。 6. 企业案例研究:研究 Autodesk、Siemens 等公司在 AI 在 CAD 设计中的应用案例。 在学习和研究 AI 生成 CAD 图的过程中,了解相关的基础知识和技术细节是非常重要的。通过阅读学术论文、参加在线课程、观看教程视频和交流学习,您可以逐步掌握 AI 在 CAD 领域的应用和实现。随着 AI 技术的不断发展,AI 在 CAD 设计中的应用将会越来越广泛,为设计师和工程师提供更多的辅助和支持。
2025-02-02
非结构化数据治理
以下是关于非结构化数据治理的相关信息: 在 AI 新产品方面: JamGPT AI Debug 小助手:https://jam.dev/jamgpt ChatGPT2D 用于生成二维知识图谱:https://www.superusapp.com/chatgpt2d/ Motörhead by metal 是用于 LLM 的开源内存和信息检索服务器:https://github.com/getmetal/motorhead 在网页抓取工具方面: Hexomatic:https://hexomatic.com/ WebscrapeAI:https://webscrapeai.com/ Kadoa:https://www.kadoa.com/ 在个人数据处理方面: Bloks 可自动处理个人笔记、任务列表和会议记录:https://www.bloks.app/ Lettria 用于处理个人文本材料:https://www.lettria.com/ Quadratic 可使用 AI、Python、SQL 和公式分析个人数据:https://www.quadratichq.com/?ref=producthunt 在向量数据库方面,以电影网站为例,传统搜索在处理语义搜索和对非结构化数据(如图像、音频等)的相似性搜索时存在问题,比如用户输入“电影像《星球大战》一样令人兴奋”或上传一张电影《银翼杀手》的海报,传统关系数据库或 Excel 难以理解和返回相关搜索结果。 在金融行业,非结构化数据主要涉及报告(如年度报告、季度报告等公司财务报告)、公告(如董事会公告、监事会公告、股东大会公告等)、上市资料(如招股说明书等公司上市相关文件)。
2025-01-24
非结构化数据
非结构化数据是指缺乏预定义格式的数据,如文本、图像和音频等。为在人工智能和机器学习应用中利用这些数据,需使用嵌入技术将其转换为数字表示。嵌入就像给每个项目赋予独特的代码以捕捉其含义或本质,通常通过特殊神经网络实现,例如单词嵌入将单词转换为向量,使含义相似的单词在向量空间中更接近,从而让算法了解项目间的关系和相似性,将非数字数据转换成机器学习模型可处理的形式,以辨别数据中的模式和关系。 在金融行业中,非结构化数据主要涉及报告(年度报告、季度报告等公司财务报告)、公告(董事会公告、监事会公告、股东大会公告等)、上市资料(如招股说明书等公司上市相关文件)。 向量数据库处理的是称为向量的复杂非结构化数据,其存储过程为:若为文本,通过模型转换成向量对象后存入数据库,再进行使用。传统数据库以表格形式存储简单数据,而向量数据库使用独特方法搜索,如近似近邻(ANN)搜索,包括散列搜索和基于图的搜索等方法,且使用特定的相似性度量来寻找最接近的匹配。要理解向量数据库的工作原理及与传统关系数据库的不同,需先理解嵌入的概念。
2025-01-24
我想系统性的了解AI,你能为我画一个思维导图吗,或者结构性的帮我介绍。譬如:第一级:人工智能,第二级人工智能下的所有分支
以下是为您系统性介绍 AI 的结构内容: 第一级:人工智能 第二级: 1. 基本概念 术语和基础概念 主要分支(机器学习、深度学习、自然语言处理等) 分支之间的联系 2. 学习之旅 入门课程推荐(李宏毅老师的课程等) 在线教育平台课程 3. 特定模块 图像 音乐 视频等 4. 提示词技巧 5. 实践尝试 实践巩固知识 作品分享 6. 体验产品 ChatGPT Kimi Chat 智谱 文心一言等 此外,为您推荐三本神经科学书籍: 1. 《认知神经学科:关于心智的生物学》(作者:Michael S.Gazzaniga;Richard B.Lvry;George R.Mangun) 2. 《神经科学原理》(作者:Eric R.Kandel;James H.Schwartz) 3. 《神经生物学:从神经元到脑》(作者:John G.Nicholls 等著) 还有《雪梅 May 的 AI 学习日记》中提到的学习经验,如第一阶段迈出第一步,看书听课进社区,包括系统性学习、初步探索、加入 AI 社区等。
2025-01-21
给我一个能生成结构图的软件推荐
以下是一些能够生成结构图的软件推荐: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,可通过拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,如逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图的创建,可与 Archi 工具配合使用,该工具提供图形化界面创建模型。 4. Enterprise Architect:强大的建模、设计和生成代码的工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 6. draw.io(现称为 diagrams.net):免费的在线图表软件,允许创建各种类型的图表,包括逻辑视图和部署视图等。 7. PlantUML:文本到 UML 的转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 9. Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 需要注意的是,虽然这些工具可以辅助创建架构视图,但它们不都是基于 AI 的。AI 在绘图工具中的应用通常涉及智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,应考虑您的具体需求,比如是否需要支持特定的建模语言、是否需要与特定的开发工具集成、是否偏好在线工具或桌面应用程序等。
2025-01-19
发生器智能系统内部电路及结构介绍
智能代理系统的内部电路及结构包括以下方面: 功能结构: 数据驱动协作:卖点提炼模块提取核心卖点,并将其直接传递给买点转化模块,确保信息准确传递和一致。 信息流转换:买点经过转化后,进入可视化展示模块,通过信息卡片和交互设计直观呈现,增强可视性和理解度。 文案优化:视觉化信息后,文案改写模块对内容进行优化调整,确保与目标受众需求高度相关。 集成内容管理:所有处理后的内容被存储和管理,保存到飞书文档,以支持未来策略优化。 这种模块之间的协同作用,使智能代理系统能够高效转化初始数据为有价值的市场信息,确保每一步骤都最大化发挥效能。 任务的处理流程: 核心任务:卖点提炼并转化为买点。 处理流程: 信息收集:首先,全面收集用户的产品基本信息,确保数据的完整性和准确性。 卖点提炼:根据收集到的信息,分别提炼出通用性卖点、描述性卖点和保障性卖点,涵盖产品多个维度,全面展示产品优势。 交互优化:通过交互式反馈机制,对提炼出的卖点进行修改和补充,提高市场适应性和吸引力。 买点转化:将优化后的卖点转化为用户视角的买点,确保信息更具吸引力和说服力。 可视化展示:最终,经过修改和补充的买点被进行可视化展示,使信息更加直观和易于理解。这一流程确保了信息在传递过程中的高效性和影响力。
2025-01-18