直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

有没有给非技术人员的提示词工程手册

回答

以下是为您提供的非技术人员的提示词工程相关内容:

提示工程是一门较新的学科,关注提示词开发和优化,帮助用户将大语言模型用于各场景和研究领域。掌握提示工程相关技能有助于用户了解大型语言模型的能力和局限性。

研究人员可利用提示工程提升大语言模型处理复杂任务场景的能力,如问答和算术推理能力。开发人员可通过提示工程设计、研发强大的工程技术,实现和大语言模型或其他生态工具的高效接轨。

提示工程不仅是设计和研发提示词,还包含与大语言模型交互和研发的各种技能和技术,在实现和大语言模型交互、对接,以及理解其能力方面都起着重要作用。用户可以通过提示工程提高大语言模型的安全性,也可以借助专业领域知识和外部工具来增强其能力。

以下是一些相关资源:

  • 小七姐:Prompt Engineering a Prompt Engineer 精读翻译,其中提到就像提示词对最终任务性能的重要性一样,方程 2 中引入的元提示词在新提出的提示词的质量,以及自动提示词工程的整体质量中扮演着重要角色。
  • 一些精选的 Prompt 网站,如:
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

提示工程指南

提示工程(Prompt Engineering)是一门较新的学科,关注提示词开发和优化,帮助用户将大语言模型(Large Language Model,LLM)用于各场景和研究领域。掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。研究人员可利用提示工程来提升大语言模型处理复杂任务场景的能力,如问答和算术推理能力。开发人员可通过提示工程设计、研发强大的工程技术,实现和大语言模型或其他生态工具的高效接轨。提示工程不仅仅是关于设计和研发提示词。它包含了与大语言模型交互和研发的各种技能和技术。提示工程在实现和大语言模型交互、对接,以及理解大语言模型能力方面都起着重要作用。用户可以通过提示工程来提高大语言模型的安全性,也可以赋能大语言模型,比如借助专业领域知识和外部工具来增强大语言模型能力。基于对大语言模型的浓厚兴趣,我们编写了这份全新的提示工程指南,介绍了大语言模型相关的论文研究、学习指南、模型、讲座、参考资料、大语言模型能力以及与其他与提示工程相关的工具。

小七姐:Prompt Engineering a Prompt Engineer 精读翻译

就像提示词对最终任务性能的重要性一样,方程2中引入的元提示词在新提出的提示词的质量,以及自动提示词工程的整体质量中扮演着重要角色。在这项工作中,我们专注于提示词工程元提示词——我们开发了可能有助于提高大型语言模型提示词工程质量的元提示词组件,并对这些组件进行了系统的削弱研究。我们基于两个动机设计这些组件:(1)提供详细的指示和上下文;(2)融入常见的优化器概念。接下来,我们将更详细地描述这些元素,并解释我们的理念。我们还在图2中对它们进行了可视化。提供详细的指示和上下文。在先前的工作中,元提示词要么指示提案模型生成提示词的释义(Zhou等人,2023b),要么包含有关检查一批样本的最少指示(Pryzant等人,2023)。我们认为,用额外的指示和上下文丰富元提示词可能是有帮助的。(a)提示词工程教程。为了帮助大型语言模型更好地理解提示词工程的任务,我们在元提示词中提供了一个提示词工程的在线教程²。

Prompt网站精选

|站点名|网站介绍|地址|附件|<br>|-|-|-|-|<br>|PromptPerfect|帮你自动优化提示词,你可以看到优化前后的对比|[https://promptperfect.jinaai.cn/prompts](https://promptperfect.jinaai.cn/prompts)||<br>|Prompt Engineering Guide|GitHub上点赞量非常高的提示工程指南<br>基于对大语言模型的浓厚兴趣,我们编写了这份全新的提示工程指南,介绍了大语言模型相关的论文研究、学习指南、模型、讲座、参考资料、大语言模型能力以及与其他与提示工程相关的工具。|[https://www.promptingguide.ai/zh](https://www.promptingguide.ai/zh)||<br>|未来力场:OpenAI GPT最佳实践|对OpenAI官方文档非常清晰的解读|[OpenAI:GPT最佳实践中文大白话版本_未来力场编译.pdf](https://futureforce.feishu.cn/file/CMpdbLxAhon5K5x5C1OcciYwnOf)||

其他人在问
我想做个知识手册 有相关的ai生成工具阿么
以下是为您整理的一些与知识手册制作相关的 AI 生成工具: AI 生成音乐的工具: Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。 Suno AI:是一款革命性的人工智能音乐生成工具,它通过先进的深度学习技术,能够将用户的输入转化为富有情感且高质量的音乐作品。 思维导图相关的 AI 工具: GitMind:一款免费的跨平台 AI 思维导图软件,可以通过 AI 自动生成思维导图。支持提问、回答、自动生成等多种模式。 ProcessOn:国内思维导图+AIGC 的工具,可以利用 AI 生成思维导图。 AmyMind:一个轻量级的在线 AI 思维导图工具,无需注册登录即可使用,支持自动生成节点。 Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可以一键拓展思路,生成文章大纲。 TreeMind:一款“AI 人工智能”思维导图工具,可以输入需求由 AI 自动完成思维导图生成。 EdrawMind:提供了一系列 AI 工具,包括 AI 驱动的头脑风暴功能,帮助用户提升生产力。 画 CAD 图的 AI 工具: CADtools 12:这是一个 Adobe Illustrator(AI)插件,为 AI 添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 Autodesk Fusion 360:Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,能够帮助用户创建复杂的几何形状和优化设计。 nTopology:基于 AI 的设计软件,可帮助用户创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 ParaMatters CogniCAD:基于 AI 的 CAD 软件,可以根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,这些工具可以根据用户输入的设计目标和约束条件自动产生多种设计方案。 请注意,这些工具通常需要一定的专业知识和技能才能有效使用。对于初学者,建议先学习基本技巧,然后尝试使用这些 AI 工具来提高效率。以上内容由 AI 大模型生成,请仔细甄别。
2024-10-30
stable diffusion的提示词手册
以下是关于 Stable Diffusion 提示词的相关内容: 个人类: 您可以充当一位有艺术气息的 Stable Diffusion prompt 助理。任务是当您用自然语言告知要生成的 prompt 主题,助理会根据主题想象一幅完整画面,然后转化成详细、高质量的 prompt,让 Stable Diffusion 生成高质量图像。完整的 prompt 包含“Prompt:”和“Negative Prompt:”两部分。Prompt 用来描述图像,由普通常见单词构成,使用英文半角“,”做分隔符。Negative prompt 用来描述不想在生成图像中出现的内容。参考资料: 商业类: 同样可以充当一位有艺术气息的 Stable Diffusion prompt 助理。任务是当您用自然语言告知要生成的 prompt 主题,助理会根据主题想象一幅完整画面,然后转化成详细、高质量的 prompt,让 Stable Diffusion 生成高质量图像。完整的 prompt 包含“Prompt:”和“Negative Prompt:”两部分。Prompt 用来描述图像,由普通常见单词构成,使用英文半角“,”做分隔符。Negative prompt 用来描述不想在生成图像中出现的内容。参考资料: 如何系统学习 SD 的提示词: 学习 Stable Diffusion 的提示词是一个系统性的过程,需要理论知识和实践经验相互结合。以下是一些建议的步骤: 1. 学习基本概念: 了解 Stable Diffusion 的工作原理和模型架构。 理解提示词如何影响生成结果。 掌握提示词的组成部分(主题词、修饰词、反面词等)。 2. 研究官方文档和教程: 通读 Stable Diffusion 官方文档,了解提示词相关指南。 研究来自开发团队和专家的教程和技巧分享。 3. 学习常见术语和范例: 熟悉 UI、艺术、摄影等相关领域的专业术语和概念。 研究优秀的图像标题和描述,作为提示词范例。 4. 掌握关键技巧: 学习如何组合多个词条来精确描述想要的效果。 掌握使用“()”、“”等符号来控制生成权重的技巧。 了解如何处理抽象概念、情感等无形事物的描述。 5. 实践和反馈: 使用不同的提示词尝试生成各种风格和主题的图像。 对比提示词和实际结果,分析原因,总结经验教训。 在社区内分享结果,请教高手,获取反馈和建议。 6. 创建提示词库: 根据主题、风格等维度,建立自己的高质量提示词库。 将成功案例和总结记录在案,方便后续参考和复用。 7. 持续跟进前沿: 关注 Stable Diffusion 的最新更新和社区分享。 及时掌握提示词的新技术、新范式、新趋势。
2024-10-22
提示词手册
以下是关于提示词的相关内容: 一、什么是提示词 提示词(Prompt)是给大语言模型的输入文本,用于指定模型应执行的任务和生成的输出。它发挥“提示”模型的作用,设计高质量的提示词需根据目标任务和模型能力精心设计,良好的提示词能让模型正确理解人类需求并给出符合预期的结果。 示例包括直接提问型、策略建议型、翻译型、算数型、概念解释型等。 二、提示词模板 以下是一些提供提示词模板的网站: 1. Majinai: 2. 词图: 3. Black Lily: 4. Danbooru标签超市: 5. 魔咒百科词典: 6. AI词汇加速器: 7. NovelAI魔导书: 8. 鳖哲法典: 9. Danbooru tag: 10. AIBooru: 三、Claude 官方提示词文档汇总(24 年 4 月) 1. 2. 3. 4. 5. 6. 7. 8. 9.
2024-10-22
请给我推荐一个适合非技术人员学习的提示词工程手册,但是我不希望提示词工程手册太实操导向,需要包括背后的原理和逻辑,而不是只像一个公式一样的教给我
以下为您推荐适合非技术人员学习的提示词工程手册: 1. 小七姐:Prompt 喂饭级系列教程 小白学习指南(二) 强调对框架的理解和运用,介绍了多种提示词框架,如情境,并提供了学习的三步走:懂原理、找需求、用框架。 2. 19. RAG 提示工程系列(一) 虽然网络上提示工程资料众多,但 RAG 任务中提示工程的资料相对较少。此系列将带领大家了解 RAG 架构的概念、组成、痛点及提示词工程在其中的应用,并指导实操案例,帮助编写调试符合企业生产级标准的提示词。 3. VIRTUAL Claude 官方文档提示词工程最佳实践@未来力场编译版(中英对照) 指出提示词工程是一门实证科学,需要不断测试和迭代,包括开发测试用例、构建初版提示词、进行用例测试、优化提示词和分享完善后的提示词,同时不要忘记测试边缘情况。
2024-08-15
AI提示词方法
以下是关于 AI 提示词方法的全面介绍: 优化和润色提示词(Prompt)对于提高文生图、对话等 AI 模型的输出质量非常重要,方法包括: 1. 明确具体的描述:使用更具体、细节的词语和短语来描述想要表达的内容,避免过于笼统。 2. 添加视觉参考:在 Prompt 中插入相关的图片参考,提高 AI 理解意图和细节要求的能力。 3. 注意语气和情感:根据需求,用合适的形容词、语气词等调整 Prompt 的整体语气和情感色彩。 4. 优化关键词组合:尝试不同的关键词搭配和语序,找到最有针对性、最准确表达需求的 Prompt 描述方式。 5. 增加约束条件:为避免 AI 产生意料之外的输出,添加限制性条件,如分辨率、比例等。 6. 分步骤构建 Prompt:将复杂的需求拆解为逐步的子 Prompt,引导 AI 先生成基本结构,再逐步添加细节和完善。 7. 参考优秀案例:研究 AI 社区流行的、被证明有效的 Prompt 范例,借鉴写作技巧和模式。 8. 反复试验、迭代优化:通过多次尝试不同的 Prompt 写法,并根据输出效果反馈持续优化完善,直至达到理想结果。 编写 prompt 时,还应遵循以下建议: 1. 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 2. 提供上下文:若任务需要特定背景知识,提供足够的上下文。 3. 使用清晰的语言:尽量用简单、清晰的语言,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,在 prompt 中明确指出。 5. 使用示例:如有特定期望结果,在 prompt 中提供示例。 6. 保持简洁:尽量简洁明了,避免过多信息使 AI 模型困惑。 7. 使用关键词和标签:帮助 AI 模型更好地理解任务的主题和类型。 8. 测试和调整:生成文本后仔细检查结果,根据需要调整 prompt,可能需要多次迭代。 在星流一站式 AI 设计工具的 prompt 输入框中: 1. 提示词用于描绘画面。 2. 输入语言方面,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),支持中英文输入。 3. 写好提示词的方法包括: 预设词组:小白用户可点击提示词上方官方预设词组进行生图,提示词内容应准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等,如一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可帮助 AI 理解不想生成的内容,如不好的质量、低像素、模糊、水印。 利用“加权重”功能:在功能框增加提示词,并进行加权重调节,权重数值越大越优先,也可对已有的提示词权重进行编辑。 辅助功能:包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。
2024-11-22
文生图反向推出提示词
在文生图中,反向推出提示词的方式主要有以下几种: 1. 在图生图功能中,除了文本提词框外,还有图片框输入口。随便照一张照片拖入后,文本输入框旁边有两个反推提示词的按钮:CLIP 可以通过图片反推出完整含义的句子;DeepBooru 可以反推出关键词组。例如一张小男孩坐在长凳上的图片,通过 CLIP 反推得到的提示词为“a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art”,通过 DeepBooru 反推得到的提示词为“shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers”。但这两种方式生成的提示词可能存在瑕疵,需要手动补充信息。补充好提示词后,调整宽度和高度,使红框刚好匹配图片,同时注意两个重要参数:提示词相关性和重绘幅度。 2. 利用上一期活动图片反推工作流,使用唯美港风图片进行反推提示词,在大模型后接一个相关模型。上一期活动链接:。 3. 利用抱脸的 joycaption 图片反推提示词,然后在哩布上跑 flux 文生图工作流。joycaption 链接(需要魔法):https://huggingface.co/spaces/fancyfeast/joycaptionprealpha 。文生图工作流: 。在哩布上跑文生图:https://www.liblib.art/modelinfo/e16a07d8be544e82b1cd14c37e217119?from=personal_page 。 在写文生图的提示词时,例如“”。
2024-11-22
我想要学习AI提示词的使用方法
以下是关于 AI 提示词使用方法的详细介绍: 一、什么是提示词 提示词用于描绘您想要的画面。星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),并且支持中英文输入。启用提示词优化后,能帮您扩展提示词,更生动地描述画面内容。 二、如何写好提示词 1. 预设词组:小白用户可以点击提示词上方官方预设词组进行生图。 2. 提示词内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 3. 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框。负面提示词可以帮助 AI 理解我们不想生成的内容,比如:不好的质量、低像素、模糊、水印。 4. 利用“加权重”功能:可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先。还可以对已有的提示词权重进行编辑。 三、辅助功能 1. 翻译功能:一键将提示词翻译成英文。 2. 删除所有提示词:清空提示词框。 3. 会员加速:加速图像生图速度,提升效率。 四、关于 Prompt 的语法规则 1. Prompt 是一段指令,用于指挥 AI 生成您所需要的内容,每个单独的提示词叫 tag(关键词)。 2. 支持的语言为英语(不用担心英语不好的问题,),另外 emoji 也可以用。 3. 语法规则:用英文半角符号逗号,来分隔 tag。注意逗号前后有空格或者换行都不影响效果。改变 tag 权重有两种写法:括号,权重就重 1.1 倍,每加一层括号就反向减弱 1.1 倍。还可以进行 tag 的步数控制。 如果您是新手学习 AI,建议先了解 AI 基本概念,阅读「」中找到适合初学者的课程。选择感兴趣的模块深入学习,掌握提示词技巧,通过实践和尝试巩固知识,体验如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 产品。
2024-11-22
通过图反向退出提示词
在 Stable Diffusion(SD)中,通过图反向退出提示词有以下几种情况: 1. 图生图功能除了文本提词框外还有图片框输入口,可通过图片给与 AI 创作灵感。随便照一张照片拖入,文本输入框旁有两个反推提示词的按钮,CLIP 可通过图片反推出完整含义的句子,DeepBooru 可反推出关键词组。例如一张图通过两种反推方式得到的提示词分别为:CLIP——“a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art”;DeepBooru——“shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers”。但两种方式生成的提示词可能有瑕疵,需要手动补充信息,调整宽度和高度,使红框匹配图片,还要注意提示词相关性和重绘幅度这两个参数。 2. 去除图像人物时,将图放入 WD 1.4 标签器中裁剪只保留背景部分,然后反推提示词,如“outdoors,no humans,tree,scenery,grass,sky,cloud,day,blue sky,mountain,road,house,path,building,nature,cloudy sky”,检查无误后发送到文生图中,开启 ControlNet,使用 inpaint 模型涂抹人物部分生成。可调整控制权重和控制模式来优化效果。 3. 进行角色设计时,设置文生图提示词,如大模型“majicmixRealistic_v6.safetensors”,正向提示词“,lowres,sig,signature,watermark,username,bad,immature,cartoon,anime,3d,painting,b&w”,设置参数如迭代步数 50、采样方法 DPM++ 2M Karras、尺寸 1328×800px 后出图,可得到 15 个不同角度的人物图片。
2024-11-22
哪些AI软件可以设计提示词和优化提示词
以下是一些可以设计和优化提示词的 AI 软件: 1. 星流一站式 AI 设计工具: 在 prompt 输入框中可输入提示词,使用图生图功能辅助创作。 支持自然语言和单个词组输入,中英文均可。 启用提示词优化后可扩展提示词,更生动描述画面内容。 写好提示词的方法包括使用预设词组、保证内容准确(包含人物主体、风格、场景特点、环境光照、画面构图、画质等)、调整负面提示词、利用“加权重”功能突出重点内容,还有翻译、删除所有提示词、会员加速等辅助功能。 2. Prompt 网站精选: :AI 艺术提示词生成器。 :通过玩游戏练习 Prompt 书写。 NovelAI tag 生成器:设计类 Prompt 提词生成器,地址为。 魔咒百科词典:简单易用的 AI 绘画 tag 生成器,地址为。 KREA:设计 AI 的 Prompt 集合站,create better prompts,网址为。 Public Prompts:免费的 prompt 合集,收集高质量的提示词,网址为。 AcceleratorI Prompt:AI 词汇加速器,加速 Prompt 书写,通过按钮帮助优化和填充提示词,网址为。 3. OpenAI API: 设计提示词本质上是对模型进行“编程”,通常通过提供指令或示例完成。 模型通过将文本分解为标记(Token)来理解和处理文本,可通过分词器工具了解更多。 需要注意的是,在给定的 API 请求中处理的 Token 数量取决于输入和输出长度,文本提示词和生成的补全合起来不能超过模型的最大上下文长度(对于大多数模型,约为 2048 个 Token 或 1500 个单词)。
2024-11-22
leap提示词技术
以下是关于 leap 提示词技术的相关内容: 在工作中,将两个观察联系起来,对 PROMPT ENGINEERING A PROMPT ENGINEER 进行研究,构建元提示指导 LLM 更有效地进行提示词工程。引入元提示组件,如逐步推理模板和上下文规范,从常见优化概念中汲取灵感并引入口头化对应物。在两个数学推理数据集上测试并确定最佳性能组合 PE2,其在 MultiArith 和 GSM8K 数据集上取得了强大的实证性能,在多种设置中超过自动提示词工程基准,在反事实任务上最为有效,在优化生产中使用的冗长、真实世界提示词方面也证明了适用性。 实验中将方法与普通人类提示词、ChainofThought,并介绍了实施细节。 随着 LLM 和生成式 AI 的发展,提示词设计和工程将更关键,讨论了基础和尖端方法,如检索增强生成(RAG),自动提示词工程(APE)这样的创新未来可能成为标准实践。
2024-11-22
如何搭建利用产品原图和模特模板生成商业图的工作流 或者有没有这类ai 应用
以下是关于利用产品原图和模特模板生成商业图的工作流及相关 AI 应用的信息: 美国独立站搭建工作流中,有给模特戴上珠宝饰品的应用。 大淘宝设计部在主题活动页面、超级品类日传播拍摄创意、产品营销视觉、定制模特生成、产品场景生成等方面应用了 AI。例如,七夕主题活动页面通过 AI 生成不受外部拍摄条件限制的素材;在 UI 设计场景中,利用 SD 中 controlnet 生成指定范围内的 ICON、界面皮肤等;通过对 AI 大模型的训练和应用,提升合成模特的真实性和美感,提供定制化线上真人模特体验,如 AI 试衣间、AI 写真等;还能根据商品图和用户自定义输入生成多张场景效果,无需 3D 模型、显卡渲染和线下拍摄。
2024-11-22
有没有免费的好用的ai
以下为一些免费且好用的 AI 工具: 获取信息和学习东西:最佳免费选项为必应(https://www.bing.com/search?q=Bing+AI&showconv=1&FORM=hpcodx)。对于儿童,来自可汗学院的 Khanmigo(https://www.khanacademy.org/khanlabs)提供由 GPT4 驱动的良好的人工智能驱动辅导。 写东西:最佳免费选项为 Bing(https://www.bing.com/search?q=Bing+AI&showconv=1&FORM=hpcodx)和 Claude 2(https://claude.ai/)。 在写代码方面的免费替代品有: Tabnine(https://tabnine.com/):AI assistant that speeds up delivery and keeps your code safe Codeium(https://codeium.com/):Free AI Code Completion & Chat Amazon CodeWhisperer(https://aws.amazon.com/codewhisperer/):Build applications faster and more securely with your AI coding companion SourceGraph Cody(https://cody.sourcegraph.com/):The AI that knows your entire codebase Tabby(https://tabby.dev/):Opensource, selfhosted AI coding assitant fauxpilot/fauxpilot(https://github.com/fauxpilot/fauxpilot):An opensource alternative to GitHub Copilot server 需要注意的是,虽然 ChatGPT 功能强大,但它是收费的且不面向中国。此外,虽然 ChatGPT 的开发者 OpenAI 并不像其名字那样开放,其源码与模型数据不对外开放,但 Meta 在 2023 年 2 月开源了 LLaMA 1,并在 7 月发布了进阶的 Llama 2 且允许商用。
2024-11-21
有没有把外国PPT翻译为中文的工具
以下为您介绍将外国 PPT 翻译为中文的工具及相关方法: 有一种自动 PPT 翻译脚本,其开发过程如下: 1. 前期准备: 翻译需要外接 API,推荐讯飞大模型,新账户免费送 200 万 tokens,有效期 3 个月。 进入 https://xinghuo.xfyun.cn/ ,首页选择 API 接入,然后点服务管理进入控制台。 创建一个新项目,比如“PPT 翻译”,以避免 API 泄露。 点进去,找到左边机器翻译的模型,按提示领取 200 万 tokens 的礼包,然后在主控台看到对应的 id、apikey、api secret 和接入路径。 2. 导入依赖: 大部分依赖是常用的,只有一个 ppt 可能需要装,运行 CMD 输入 pip install pythonpptx,如果还缺的可以按提示安装。 3. 初始化 API 相关信息和文件路径: 先设置对应的 api 信息,其他模型可以对应做替换。 4. 读取并提取 PPT 文本: 根据讯飞的 API 文档配置做请求指令,确保 API 可以正确调用。打印响应数据设置方便监测脚本执行动态,如果碰到报错可以随时做优化。 5. 翻译脚本: 目前只设置了文本翻译,未对表格元素处理,排除了所有 shape,如果要加入表格翻译,可以定义 shape = table 来定义表格,然后翻译表格里的 cell 实现。 接收路径已调好,如果用其他的 API,要在 translated_text = get_result 后面替换成自己的地址。 语言选择,原文件是中文用'cn'表示,英文文档改成‘en’,其他语种对应。 此外,还有 Claude 官方文档提示词工程最佳实践@未来力场编译版(中英对照),源地址 https://docs.anthropic.com/claude/docs ,扫码关注未来力场:AIGC 最佳实践中文互联网搬运工。
2024-11-21
有没有推荐的AI图片生成软件
以下为您推荐一些 AI 图片生成相关的软件: 1. 海报生成工具: Canva(可画):https://www.canva.cn/ ,是一个受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可辅助选色和字体样式,通过简单拖放操作创建海报。 稿定设计:https://www.gaoding.com/ ,智能设计工具,采用先进人工智能技术,自动分析生成设计方案,稍作调整即可完成设计。 VistaCreate:https://create.vista.com/ ,简单易用的设计平台,提供大量设计模板和元素,可用 AI 工具创建个性化海报,智能建议功能可助用户找合适元素。 Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面,能快速创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能。 2. 图生图产品: Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感,丰富创作过程。 Retrato:AI 工具,将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传照片转换为芭比风格,效果好。 3. 图片生成 3D 建模工具: Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,基于数十亿参数级别的 3D 大模型,实现快速 2D 到 3D 转换,提供 AI 驱动的精准度和细节。 Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成,用户上传图片并描述材质和风格可生成高质量 3D 模型。 CSM AI:Common Sense Machines 支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象再转换为 3D 模型。 Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域模型生成,用户上传图片或输入文本提示词生成 3D 模型。 VoxCraft:生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,提供图像到 3D、文本到 3D 和文本到纹理等多种功能。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-20
有没有放一个ppt文档转化成文字的AI软件
目前有一些可以将 PPT 文档转化为文字的方法和相关的 AI 工具: 在将 PPT 转化为网站的尝试中,当遇到困惑时,如组织线下沙龙内容的两页并进行切换没有思路,可选择放手让 AI 给出建议。 市场上好用的 AI 辅助的 PPT 工具包括: Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。网址:https://gamma.app/ 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。网址:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能。网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/
2024-11-19
有没有语音交互领域的AI Agent的好的思路
以下是关于语音交互领域的 AI Agent 的一些思路: 1. 构建像人一样的 Agent:实现所需的记忆模块、工作流模块和各种工具调用模块,这在工程上具有一定挑战。 2. 驱动躯壳的实现:定义灵魂部分的接口,躯壳部分通过 API 调用,如 HTTP、webSocket 等。要处理好包含情绪的语音表达以及躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对成熟但闭源。 3. 保证实时性:由于算法部分组成庞大,几乎不能单机部署,特别是大模型部分,会涉及网络耗时和模型推理耗时,低延时是亟需解决的问题。 4. 实现多元跨模态:不仅要有语音交互,还可根据实际需求加入其他感官,如通过添加摄像头数据获取视觉信息并进行图像解析。 5. 处理拟人化场景:正常与人交流时会有插话、转移话题等情况,需要通过工程手段丝滑处理。 此外,像 AutoGLM 这样的产品,通过模拟人类操作来实现跨应用的控制,展现出了一定的智能理解能力,如能根据用户意图选择合适的应用场景。但仍存在语音识别偏差、操作稳定性需提升、支持平台有限等问题,未来随着多模态理解能力和操作精准度的提高,发展空间较大。
2024-11-19