Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

开发者API接入,帮我写一段推广文本

Answer

以下是为您生成的关于开发者 API 接入的推广文本:

曾经,我们在做设计时幻想能用嘴完成设计,随便说几句话电脑就能帮忙画出。随着 AI 的出现,各种提示词插件应运而生。而现在,开发者带来了更强大的功能——提示词都由 AI 自动写好!比如 One Button Prompt 脚本。

安装方式便捷,在扩展面板中搜索 One Button Prompt 可直接安装,或者将下载好的插件放在“……\sd-webui-aki-v4\extensions”路径文件夹下。安装完成后,重启 webUI,在脚本下拉菜单中就能找到该插件。

使用时,先体验一下。根据官方建议,大模型选择“deliberate”,采样方法设为“DPM++ SDE Karras”,采样步骤设为“25”,并将 CFG 比例降低到“6”。随机等级设为 5,下面还有分别定义主题类型、艺术类型和图像类型的三个下拉选项。您可以选择全随机试试手气,也能加一点自定义条件,比如让它画一幅动物主题的摄影作品。将模型换成“realisticVisionV20”,主题换成人物,再次生成。快来体验这便捷高效的开发者 API 接入吧!

Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】自动写提示词脚本One Button Prompt

曾几何时,我们做设计的时候就幻想着能用嘴做设计,随便说几句话电脑就能帮我们画出来;后来,出现了AI,我们就想着怎么样能帮助我们快速编写提示词,就有了各种提示词插件;好嘛,到现在开发者告诉我们,提示词你也不用想了,AI已经帮你写好了。我:……来看看,我们今天要玩的这款脚本——One Button Prompt。安装方式就是在扩展面板中搜索One Button Prompt,可以直接安装。或者是将下载好的插件,放在这个路径文件夹下“……\sd-webui-aki-v4\extensions”。安装完成后,重启webUI,在脚本下拉菜单中可以找到这个插件。我们先体验一下这个插件,根据官方建议,大模型选择了“deliberate”,采样方法设置为“DPM++ SDE Karras”,采样步骤设置为“25”,并将CFG比例降低到“6”。随机等级设置为5,可以看到下面还有三个下拉选项。分别定义主题的类型,艺术的类型,和图像类型。当然,你可以选择全随机来试试手气(什么开盲盒?)。也可以稍微加一点自定义条件,比如我让它画一幅动物主题的摄影作品。点击生成。将模型换成“realisticVisionV20”,主题换成人物,再生成一次。

Others are asking
API服务是什么意思?
API 服务是指一种接口服务,它就像是一个信差。其作用是接受一端的请求,将请求传达给对应的系统,然后把系统返回的信息再发回给请求方。 例如在 Docker Compose 多容器管理的示例中,提到了包括数据库、AI 模型服务、MySQL 数据库以及一个 API 服务(oneapi)。在网络应用中,通过 API 服务可以实现不同系统或组件之间的通信和数据交互。 在网页访问的例子中,如搜索“奥本海默”的页面,网址中的一些参数和路径的设置就是通过 API 服务来实现的。用户发起请求,API 服务获取相关数据并返回给用户。要了解如何进行请求以及查询参数的编写,需要寻找 API 文档。
2025-01-28
Roo Code 的API Provider 参数哪里设置
要设置 Roo Code 的 API Provider 参数,您可以按照以下步骤进行操作: 1. 首先,进入 deepseek 的官网(https://www.deepseek.com/)。 2. 进入右上角的 API 开放平台。早期 deepseek 是有赠送额度,如果没有赠送的余额,可以选择去充值,支持美元和人民币两种结算方式,以及各种个性化的充值方式,并创建一个 API key。注意,API key 只会出现一次,请及时保存下来。 3. 接下来,以 cursor 作为代码编辑器为例,下载安装 cursor(https://www.cursor.com/),在插件页面搜索并安装 Roocline。安装完后,打开三角箭头,就可以看到 RooCline,选中 RooCline,并点击齿轮,进入设置。 4. 依次设置配置基本参数: API Provider:选择 DeepSeek。 API Key:填入已创建的 key。 模型:选择 DeepSeekreasoner。 5. 进行语言偏好设置。 6. 小贴士:记得把 HighRisk 选项都打开,这样 AI 才能帮您自动生成文件。最后做完所有不要忘记点击 Done 保存修改。在聊天框输入产品需求,输入需求后点击这个 blingbling 的星星,优化提示词。最终,在 deepseekr1 的加持下基本上是一遍过,各种特效效果交互逻辑也都正确。画面也算优雅,交互效果也不错,是您想要的。
2025-01-26
以豆包为例,如何通过API调用豆包大模型?
要通过 API 调用豆包大模型,以下是一些相关步骤和信息: 1. 直接调用大模型(之前完成过 coze 对接的同学,直接去二、百炼应用的调用): 百炼首页:https://bailian.console.aliyun.com/ 以调用“qwenmax”模型为例,在/root/chatgptonwechat/文件夹下,打开 config.json 文件,需要更改"model",和添加"dashscope_api_key"。 获取 key 的视频教程: 获取 key 的图文教程:以下是参考配置。 注意:需要“实名认证”后,这些 key 才可以正常使用,如果对话出现“Access to mode denied.Please make sure you are eligible for using the model.”的报错,那说明您没有实名认证,点击去,或查看自己是否已认证。 2. 创建大模型问答应用: 首先可以通过创建一个百炼应用,来获取大模型的推理 API 服务,用于实现 AI 助手。 创建应用: 进入百炼控制台的,在页面右侧点击新增应用。在对话框,选择智能体应用并创建。 在应用设置页面,模型选择通义千问Plus,其他参数保持默认。您也可以选择输入一些 Prompt,比如设置一些人设以引导大模型更好的应对客户咨询。 在页面右侧可以提问验证模型效果。不过您会发现,目前它还无法准确回答你们公司的商品信息。点击右上角的发布,我们将在后面的步骤中去解决这一问题。 获取调用 API 所需的凭证: 在我的应用>应用列表中可以查看所有百炼应用 ID。保存应用 ID 到本地用于后续配置。 在顶部导航栏右侧,点击人型图标,点击 APIKEY 进入我的 APIKEY 页面。在页面右侧,点击创建我的 APIKEY,在弹出窗口中创建一个新 APIKEY。保存 APIKEY 到本地用于后续配置。 3. 配置 FastGpt、OneAPI: 首先配置 OneAPI,还记得刚刚让您白嫖的大模型 API 吗?阿里的接口,这时要派上用场了,去阿里模型的链接里创建 ApiKey,并复制下来。然后在 OneAPI 的页面,点击【渠道】添加新渠道。添加时,类型选择阿里通义千问,名称自己取个,类型选择好后模型是会默认加进去,您不用删减,还有就把刚刚阿里那复制的 ApiKey 粘贴到秘钥里去。这样就 OK 了。后续有其他的大模型也是一样的添加方式。
2025-01-23
哪些应用或者是web服务可以使用api
以下是一些可以使用 API 的应用和 Web 服务: 1. TMDB 提供了搜索电影的 API,其文档网址为 https://developer.themoviedb.org/reference/searchmovie 。在该网站的开发者相关页面或 API 文档中,可获取 API 规则。通过在右上角的认证里能看到 API 读访问令牌,配置文件中包含了如 url、请求方法 get、查询参数 query 和 language 等。输入关键词和相关语言设置,如“奥本海默”和“zhCN”,点击 Try it 即可获取数据,返回的数据格式为 JSON。 2. RAG 加速器的数据抽取服务,基于 FastAPI 和 Postgresql 搭建,并提供了标准的 REST API 接口,附带有 dockercompose 文件方便搭建服务环境。该服务支持定义并持久化“抽取器”,包含抽取结构的图式(Schema)、抽取上下文的指令(Prompt)和抽取样例(Reference examples)。此外,提供了提交文件进行抽取的端点和通过 RemoteRunnable 使抽取服务在 LangChain Expression Language链中更易用的端点。预设了基于 MIME 类型的解析器,支持 PDF 和 HTML 文档的解析,还可扩展支持其他文件类型。使用时可通过 JSON 模式定义提取信息、指定样例提升提取结果质量,传入原始文本或二进制文件。 如果您对 Action 很感兴趣,可以从以下方向继续学习: 1. 系统学习 API 相关知识。 2. 在网上寻找可用的 API 进行练习。 3. 发掘 GPT Action 的更多潜力。
2025-01-23
Whisper API
以下是关于您提到的“Whisper API”的相关信息: 在不同的 API 端点中,与 Whisper 相关的有: /v1/audio/transcriptions:支持的型号名称为 whisper1。 /v1/audio/translations:支持的型号名称为 whisper1。
2025-01-21
在comfyUI中可以接入哪些api,又和3D相关的吗
在 ComfyUI 中可以接入以下与 3D 相关的 API: 1. @CSM_ai:可以将文本、图像或草图转换为 3D 素材,并直接应用于游戏中,无需后期处理。体验地址:https://cube.csm.ai ,https://x.com/xiaohuggg/status/1763758877999587757?s=20 2. Move AI 推出的 Move API:可以从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据。链接:https://move.ai/api ,https://x.com/xiaohuggg/status/1761590288576061573?s=20 3. ComfyUI 3D Pack 引入 3D 图像处理:可以快速将图片转换为 3D 模型,支持多角度查看,使用 3D 高斯扩散技术提升模型质量,支持多种格式导出,集成先进 3D 处理算法。链接:https://github.com/MrForExample/ComfyUI3DPack/tree/main ,https://x.com/xiaohuggg/status/1755824687811346514?s=20 此外,ZHO 博主有关于 ComfyUI 的更新记录: 1. 4 月 18 日,ComfyUI Stable Diffusion 3 API 已更新为 V1.5 版,图生图和 SD3 Turbo 都可以正常使用,但 SD3 图生图模式不支持选择比例,SD3 Turbo 模型不支持负面提示词。使用方法是先申请 API,然后填入 config.json 文件即可(每账户 25 免费积分),SD3 每张图 6.5 积分(比较贵)。项目地址:https://github.com/ZHOZHOZHO/ComfyUIStableDiffusion3API ,SD3 API ComfyUI 节点测试成功。 2. 4 月 17 日,Stability AI 刚刚发布了 Stable Diffusion 3 和 Stable Diffusion 3 Turbo,现在已经可通过 Stability AI 开发者平台 API 使用,SAI 计划在不久的将来通过会员资格提供模型权重。详情:https://bit.ly/3W43FjY
2025-01-14
以下是大致可以采用的步骤来实现这样一个能自动在大语言模型网站生成不同场景机器人图片的程序(以下以Python语言示例,不过不同平台具体实现会有差异且需遵循对应网站的使用规则和接口规范): ### 1. 选择合适的大语言模型网站及确认其API(应用程序编程接口)情况 不同大语言模型网站对于图片生成通常会提供相应的API来允许外部程序与之交互,比如部分知名的AI绘画相关平台。你需要先确定要使用哪些网站,然后去注册开发者账号等,获取对应的API Key以及详细的API文档,了解如何通过代码向其发起图
以下是为您整合的相关内容: Ollama 框架: 1. 支持多种大型语言模型,如通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 2. 易于使用,适用于 macOS、Windows 和 Linux 系统,支持 cpu 和 gpu,用户能轻松在本地环境启动和运行大模型。 3. 提供模型库,用户可从中下载不同模型,这些模型有不同参数和大小以满足不同需求和硬件条件,可通过 https://ollama.com/library 查找。 4. 支持用户自定义模型,例如修改模型的温度参数来调整创造性和连贯性,或者设置特定的系统消息。 5. 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 6. 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 7. 安装:访问 https://ollama.com/download/ 进行下载安装。安装完后,确保 ollama 后台服务已启动(在 mac 上启动 ollama 应用程序,在 linux 上通过 ollama serve 启动),可通过 ollama list 确认。 基于 COW 框架的 ChatBot 实现步骤: 1. COW 是基于大模型搭建的 Chat 机器人框架,将多模型塞进自己的微信里实现方案。 2. 基于张梦飞同学的教程: 。 3. 实现内容: 打造属于自己的 ChatBot(文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等)。 常用开源插件的安装应用。 4. 正式开始前需知: ChatBot 相较于在各大模型网页端使用区别:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项: 微信端因非常规使用,有封号危险,不建议主力微信号接入。 只探讨操作步骤,请依法合规使用。 大模型生成的内容注意甄别,确保所有操作均符合相关法律法规要求。 禁止用于任何非法目的。 处理敏感或个人隐私数据时注意脱敏,以防滥用或泄露。 5. 多平台接入:微信、企业微信、公众号、飞书、钉钉等。 6. 多模型选择:GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等。 7. 多消息类型支持:能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能。 8. 多部署方法:本地运行、服务器运行、Docker 的方式。
2024-12-29
ChatGLM开发者团队介绍
ChatGLM 是一个开源的、支持中英双语的对话语言模型,底座是 GLM 语言模型。其相关信息如下: 地址: 简介:中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。 此外,基于 ChatGLM 还有在垂直领域微调的模型,如医疗领域的 MedChatGLM,其地址为: 。
2024-10-30
我是说作为coze开发者如何获取到用户数据
作为 Coze 开发者,您可以通过以下步骤获取用户数据: 1. 建立数据库:用于存储用户数据信息,包括用户信息的相关因素。 2. 在“人设和回复逻辑”中增加对应的技能:明确存储用户信息的关键词,如“手机号”“微信”和“user”。 3. 测试效果:查看用户信息是否已被存储到数据库中。 此外,您还可以使用 Coze IDE 创建插件,并在元数据设置输入参数,通过自动生成模拟数据进行测试。在测试完成后,可在页面右上角单击发布,并在发布对话框中核对工具信息,设置是否启用工具。如果工具会收集、传输用户个人信息,需要在个人信息收集声明对话框中进行相应选择。
2024-06-24
文本写作工具推荐
以下是为您推荐的文本写作工具: 论文写作: 文献管理和搜索: Zotero:结合 AI 技术,可自动提取文献信息,助您管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化,助力复杂数据分析和模型构建。 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 邮件写作: Grammarly:提供语法检查、拼写纠正、风格建议和语气调整等功能,易于使用,支持多种平台和语言。网站:https://www.grammarly.com/ Hemingway Editor:简化句子结构,提高可读性,标记复杂句和冗长句。界面简洁,重点突出。网站:http://www.hemingwayapp.com/ ProWritingAid:全面的语法和风格检查,提供详细写作报告和建议。功能强大,支持多种平台和集成。网站:https://prowritingaid.com/ Writesonic:基于 AI 生成各种类型文本,包括电子邮件、博客文章、广告文案等。生成速度快。网站:https://writesonic.com/ Lavender:专注邮件写作优化,提供个性化建议和模板,提高邮件打开率和回复率。 内容仿写: 秘塔写作猫:https://xiezuocat.com/ 是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,实时同步翻译,支持全文改写,一键修改,实时纠错并给出修改建议,智能分析文章属性并打分。 笔灵 AI 写作:https://ibiling.cn/ 是得力的智能写作助手,支持多种文体写作,一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作:https://effidit.qq.com/ 是由腾讯 AI Lab 开发的创作助手,提升写作效率和创作体验。 更多 AI 写作类工具可以查看这里:https://www.waytoagi.com/sites/category/2 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-24
文本转语音的ai
以下是一些文本转语音的 AI 相关信息: 人工智能音频初创公司: :将书面内容转化为引人入胜的音频,并实现无缝分发。 :专业音频、语音、声音和音乐的扩展服务。 (被 Spotify 收购):提供完全表达的 AI 生成语音,带来引人入胜的逼真表演。 :利用合成媒体生成和检测,带来无限可能。 :一键使您的内容多语言化,触及更多人群。 :生成听起来真实的 AI 声音。 :为游戏、电影和元宇宙提供 AI 语音演员。 :为内容创作者提供语音克隆服务。 :超逼真的文本转语音引擎。 :使用单一 AI 驱动的 API 进行音频转录和理解。 :听起来像真人的新声音。 :从真实人的声音创建逼真的合成语音的文本转语音技术。 :生成听起来完全像你的音频内容。 在线 TTS 工具: Eleven Labs:https://elevenlabs.io/ ,是一款功能强大且多功能的 AI 语音软件,使创作者和出版商能够生成逼真、高品质的音频。人工智能模型能够高保真地呈现人类语调和语调变化,并能够根据上下文调整表达方式。 Speechify:https://speechify.com/ ,是一款人工智能驱动的文本转语音工具,使用户能够将文本转换为音频文件。它可作为 Chrome 扩展、Mac 应用程序、iOS 和 Android 应用程序使用,可用于收听网页、文档、PDF 和有声读物。 Azure AI Speech Studio:https://speech.microsoft.com/portal ,Microsoft Azure Speech Studio 是一套服务,它赋予应用程序能力,让它们能够“听懂、理解并与客户进行对话”。该服务提供了支持 100 多种语言和方言的语音转文本和文本转语音功能。此外,它还提供了自定义的语音模型,这些模型能够适应特定领域的术语、背景噪声以及不同的口音。 Voicemaker:https://voicemaker.in/ ,AI 工具可将文本转换为各种区域语言的语音,并允许您创建自定义语音模型。Voicemaker 易于使用,非常适合为视频制作画外音或帮助视障人士。 在算法驱动的数字人中,TTS(Text to Speech,文字转语音)是其中一个核心算法。数字人依靠 LLM 生成的输出是文字,为了保持语音交互一致性,需要将文字转换为语音。
2025-01-21
有哪个大模型工具可以提供“word文本转excel表格”功能
以下是一些可以将 word 文本转 excel 表格的大模型相关方法: 1. Markdown 格式输出 Markdown 编辑器 Excel:将大模型的输出结果复制到 Markdown 编辑器(如 Typora),然后再直接复制到 Excel,就可以得到直接可用的数据文档。 2. Markdown 格式输出 Excel 数据分组:把大模型的输出直接复制到 Excel,一般使用 Excel 的数据分列功能,用“|”作为分隔符号处理数据。 3. Markdown 格式输出 Excel 数据分组:要求大模型把输出转换成 CSV 格式,然后把结果复制到 txt 文档,另存为成 csv 文件(注意:txt 另存为时,文件后缀名更改为.csv,编码选择 ANSI)。
2025-01-21
有没有去文本AI味的提示词
以下是一些关于去除文本 AI 味的提示词和相关信息: 骏老师提供的示例:“Character:You're a fluid conversationalist that engages in meaningful and personal natural language discussions with users.Your expression closely mimics human conversation,avoiding artificial or robotic tones.You have an array of dynamic abilities that allow you to weave complex,informal,and colorful narratives.Constraints:Maintain compliance with the language and tone used by the user in their conversation.Only provide responses that are relevant to the issue at hand.Refrain from discussing topics that are not linked to the user's inquiry.Ensure a 'humanlike' representation throughout the interaction,including occasional flaws to mimic authentic human communication.Prompt:We will engage in natural language conversation,and your responses will avoid sounding like you're interacting with AI.Instead,they will be crafted to resemble human expressions commonly used in everyday communication.Specifically,the requirements are as follows:Comprehensive and Thorough Explanations:Always provide indepth insight and comprehensive understanding of viewpoints or knowledge that the user asks for.Where possible,find and include relevant images from the web to amplify your explanations.Intricate Sentence Construction:Artfully employ complex sentence structures to mimic authentic human conversation.Ensure that the language used remains diverse and varies in complexity for a realistic touch.Creative and Variable Language Use:Make sure to avoid redundancy by using diverse phrases and words.Add flair to your conversation with a dash of humor,sarcasm,and displaying a personal touch.Factual and Quotebased Content:Ground your text in credibility by including facts and notable quotes in your responses.” 陈财猫认为去除 AI 味是个伪命题,谈到 AI 味实际上讲的是 GPT 味。在 GPT 刚出时,为了让模型听得懂人话做对齐,OpenAI 雇了很多便宜的肯尼亚人做数据标注,可能导致出现一些如“首先、其次、再者、引人入胜”这样一看就像 AI 写的套话。 游戏 PUA 角色相关的提示词:“Role:PUA<br><br>Profile:<br>writer:李继刚<br>version:0.2<br>language:中文<br>description:你在一个游戏中充当嘲讽用户的 NPC 角色,具备尖酸刻薄的口吻和良好的逻辑思考能力。<br><br>Attention:<br>这个游戏的卖点就是你,你的嘲讽,你的尖酸刻薄,你的逻辑反驳,受到了用户的强烈欢迎.你说话越是难听,用户越喜欢这个游戏.你会尽你可能地来嘲讽用户,吸引他们的注意力.<br><br>Background:<br>让我们来看看 AI 的 PUA 水平如何.<br><br>Constraints:<br>你必须尽可能地去嘲讽用户.<br>你必须以尖酸刻薄的语气回应用户观点。<br>你必须结合你的逻辑性来表达,挑剔,难听,尖酸,有逻辑.”
2025-01-19
我要让ai帮我写文本,有哪些使用技巧和注意事项呢
利用 AI 写文本的使用技巧和注意事项如下: 确定主题:明确研究兴趣和目标,选择具有研究价值和创新性的主题。 收集资料:使用 AI 工具如学术搜索引擎和文献管理软件搜集相关文献和资料。 分析总结:利用 AI 文本分析工具提取关键信息和主要观点。 生成大纲:使用 AI 写作助手生成包括引言、文献综述、方法论、结果和讨论等部分的大纲。 撰写文献综述:借助 AI 工具确保内容准确完整。 构建方法论:根据研究需求,采用 AI 建议的方法和技术设计研究方法。 数据分析:若涉及数据,使用 AI 数据分析工具处理和解释。 撰写编辑:利用 AI 写作工具撰写各部分,并检查语法和风格。 生成参考文献:使用 AI 文献管理工具生成正确格式。 审阅修改:利用 AI 审阅工具检查逻辑性和一致性,并根据反馈修改。 提交前检查:使用 AI 抄袭检测工具确保原创性,进行最后的格式调整。 需要注意的是,AI 工具只是辅助,不能完全替代研究者的专业判断和创造性思维。在使用时应保持批判性思维,确保研究质量和学术诚信。 在写小说方面: 丰富细化:先让 AI 写故事概要和角色背景介绍,在此基础上按自己审美修改。让 AI 以表格形式输出细节描述,这样能打破叙事习惯,便于局部调整,确保都是具体细节。 串联成文:将生成的表格依次复制粘贴,让 AI 写文章,偶尔给予建议。 局部修改:注意小说大赛的要求,如作品不能改动且字数限制。修改时可能会遇到 AI 记性不好、关键情节丢失等问题。
2025-01-15
可以基于文本描述生成对应的视频
以下是一些可以基于文本描述生成对应的视频的工具: 1. Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA(国内):https://etna.7volcanoes.com/ 。是一款由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps,支持中文和时空理解。 3. Adobe Firefly 中的“生成视频”(测试版):https://www.adobe.com/products/firefly/features/aivideogenerator.html 。将您的书面描述转换为视频剪辑。使用文本提示定义内容、情感和设置(包括摄像机角度),以指导摄像机移动并创建传达所需情绪和信息的视频。您还可以合并图像,为视频生成提供视觉提示。 4. ChatGPT + 剪映:ChatGPT 可以生成视频小说脚本,剪映可根据脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架,快速实现从文字到画面的转化。 5. PixVerse AI:https://pixverse.ai/ ,在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 6. Pictory:https://pictory.ai/ ,允许用户轻松创建和编辑高质量视频,无需视频编辑或设计经验。用户提供文本描述,Pictory 将帮助生成相应的视频内容。 7. VEED.IO:https://www.veed.io/ ,提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 8. Runway:https://runwayml.com/ ,这是一个 AI 视频创作工具,能够将文本转化为风格化的视频内容,适用于多种应用场景。 9. 艺映 AI:https://www.artink.art/ ,专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可根据文本脚本生成视频。 这些工具各有特点,适用于不同的应用场景和需求,能够帮助内容创作者、教育工作者、企业和个人快速生成吸引人的视频内容。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-14
如果想做一个智能硬件接入豆包的话,应该怎么做?
要将智能硬件接入豆包,您可以参考以下步骤和相关信息: 1. 了解智能体的交互能力:包括大模型本身的交互能力、多 Agent 的灵活性以及 workflow 的妙用,通过引导用户输入相关信息,便于大模型理解和分析,同时注意上下文说明。 2. 构建智能体的知识体量:利用豆包大模型本身的行业数据和语料库,创建知识库(结构化数据),包括步骤一至步骤五的处理过程。您可以参考。同时,了解参赛用知识库,包括大模型 RAG 检索、大模型的选择和参数设定以及新模型的调用方法,可参考https://console.volcengine.com/ark/region:ark+cnbeijing/model?projectName=undefined&vendor=Bytedance&view=LIST_VIEW 。 3. 关注智能体的记忆能力:涉及变量和数据库等方面的信息记录。 在具体的应用场景中,如火山引擎 AI 创造者大赛中,不同赛道有不同的要求和核心目标。例如,在汽车品牌相关的赛道中: AI 座舱赛道:利用豆包大模型、扣子专业版以及吉利原子化能力,探索 AI 在智能座舱中的多样化应用,通过智能座舱内的智能体开发,满足车主定制化的需求。 AI 营销赛道:利用豆包大模型和扣子专业版,开发出能高效投放广告、精准用户画像、提升销售能力、优化线索转化智能体方案,助力汽车行业实现高效营销。 AI 售后赛道:利用豆包大模型和扣子专业版,提供创新且实际可行的智能体应用,提升汽车售后服务效率与用户体验,优化汽车售后服务体系,助力汽车行业智能化升级。 此外,在飞书多维表格 AI 共学中,也有基于豆包大模型的能力升级与产品化探索,包括大模型在综合能力、推理能力、指令遵循、代码数学专业知识和图片理解等方面的升级,以及将其能力接入多维表格的字段捷径等尝试。在使用相关功能前,可能需要注册豆包大模型账号并进行关联。
2025-01-22
在comfyUI中可以接入哪些节点
在 ComfyUI 中可以接入以下类型的节点: 1. 输入节点: 文本提示节点:用于输入生成图像的文本描述。 图像输入节点:用于输入基础图像进行二次生成。 噪声节点:用于输入初始噪声图像。 2. 处理节点: 采样器节点:选择图像生成所使用的采样器。 调度器节点:选择图像生成所使用的调度器。 CFG Scale 节点:调整引导式采样的强度。 步数节点:设置图像生成的迭代步数。 3. 输出节点: 图像输出节点:显示生成的最终图像。 4. 辅助节点: 批处理节点:支持批量生成多个图像。 图像变换节点:提供图像旋转、翻转等功能。 图像融合节点:可以将多个图像合并成一个。 此外,还有一些特定的节点插件,如: 1. PuLID 节点插件: model:使用预训练的基础文本到图像扩散模型,如 Stable Diffusion。 pulid:加载的 PuLID 模型权重,定义 ID 信息如何插入基础模型。 eva_clip:用于从 ID 参考图像中编码面部特征的 EvaCLIP 模型。 face_analysis:使用 InsightFace 模型识别和裁剪 ID 参考图像中的面部。 image:提供的参考图像用于插入特定 ID。 method:选择 ID 插入方法,如“fidelity”(优先保真度)、“style”(保留生成风格)和“neutral”(平衡两者)。 weight:控制 ID 插入强度,范围为 0 到 5。 start_at 和 end_at:控制在去噪步骤的哪个阶段开始和停止应用 PuLID ID 插入。 attn_mask:此选项用于提供灰度掩码图像,以控制 ID 自定义的应用位置,但并不是必需输入,而是可选输入。 Advanced Node:提供了高级节点,可以通过调整 fidelity 滑块和 projection 选项进行更精细的生成调优。 2. 中文提示词输入相关节点: 安装完成后,在【新建节点】【Alek 节点】下,有【预览文本】、【绘画】、【姿态】、【clip 文本编码器】和【翻译文本】这五个节点。 【clip 文本编码器(翻译)】可代替自带的【clip 文本编码器】,直接输入中文。但引用负向 embedding 时,文件夹路径不能有中文。 【翻译文本】节点可代替【元节点】,在 sdxl 流程中,当需要将文本信息单独列出来时使用。 【预览文本】节点可连接到【翻译文本】检查翻译是否正确。 如果翻译失效,可双击“embedded_instail”进行安装,然后用记事本打开 BaiduTranslate.py,填入在百度翻译开发平台申请的 ID 和密码,即可正常翻译。
2025-01-14
可以把tripo的节点接入comfyui吗
要将 tripo 的节点接入 ComfyUI,您可以参考以下步骤: 1. 确保后面有一个空格。然后将 requirements_win.txt 文件拖到命令提示符中(如果您在 Windows 上;否则,选择另一个文件 requirements.txt)。拖动文件将在命令提示符中复制其路径。 2. 按 Enter 键,这将安装所有所需的依赖项,使其与 ComfyUI 兼容。请注意,如果为 Comfy 使用了虚拟环境,必须首先激活它。 3. 在使用自定义节点之前,有一些要注意的事项: 您的图像必须放在一个以命名的文件夹中。那个数字很重要:LoRA 脚本使用它来创建一些步骤(称为优化步骤…但别问我是什么^^’)。它应该很小,比如 5。然后,下划线是必须的。 对于 data_path,您必须写入包含数据库文件夹的文件夹路径。例如:C:\\database\\5_myimages ,您必须写 C:\\database 。 Python 在这里需要斜杠,但节点会自动将所有反斜杠转换为斜杠。文件夹名称中的空格也不是问题。 4. 参数方面: 在第一行,您可以从 checkpoint 文件夹中选择任何模型。然而,据说您必须选择一个基本模型进行 LoRA 训练。 您选择一个名字为您的 LoRA,如果默认值对您不好,就更改这些值(epochs 数应该接近 40),然后启动工作流程! 5. 一旦您点击 Queue Prompt,所有事情都会在命令提示符中发生。 6. 建议与字幕自定义节点和 WD14 标签一起使用。但请注意,在制作字幕时禁用 LoRA 训练节点。因为 Comfy 可能会在制作字幕之前启动训练。 7. 关于 Tensorboard:训练会在 log 文件夹中创建一个日志文件,该文件夹会在 Comfy 的根文件夹中创建。该日志可能是一个可以在 Tensorboard UI 中加载的文件。 ComfyUI 的核心是其节点式界面,节点类型包括输入节点(如文本提示节点、图像输入节点、噪声节点)、处理节点(如采样器节点、调度器节点、CFG Scale 节点、步数节点)、输出节点(如图像输出节点)、辅助节点(如批处理节点、图像变换节点、图像融合节点)。用户可以通过拖放和连接各种节点来创建自定义的图像生成工作流,还可以创建自定义节点来扩展功能,自定义节点安装目录为 D:\\ComfyUI\\custom_nodes 。ComfyUI 还提供了丰富的节点管理功能,包括保存/加载节点图、复制/粘贴节点、批量编辑等。
2025-01-14
如何把多个大模型接入一个智能体?
要将多个大模型接入一个智能体,可以参考以下步骤: 1. 理解相关概念: 统辖:是一种广义的包含关系,指普遍性理念或法则对个别事物的包容或管辖。 抽象:从具体事物中提取共同特性,形成概念。 演绎:通过逻辑推理从已知推导出新知识。 反应:对外界刺激或输入的回应或改变。 2. 统辖 prompt:在 prompt 工作流中设置普遍性、统一性或支配性原则,影响其他 prompt 的状态或行为,例如设置统一监督者角色评判其他模块,让大模型注意力集中在特定话题上以提高推理能力。 3. 利用阿里云百炼: 步骤一:创建智能体应用 进入百炼控制台中“我的应用”,单击新增应用,在智能体应用页签,单击直接创建。若之前已创建过应用,则单击右上角的新增应用。控制台页面链接:https://bailian.console.aliyun.com/?spm=5176.29619931.J__Z58Z6CX7MY__Ll8p1ZOR.1.2f3e59fciQnmL7/home 进入智能体应用管理界面后,选择大模型并进行参数配置,例如选择通义千问Max,可根据需求配置模型参数。 测试智能体应用:选择大模型后,可输入问题进行测试。 4. 在网站上增加一个 AI 助手: 创建大模型问答应用:通过创建百炼应用获取大模型的推理 API 服务。 进入百炼控制台的,在页面右侧点击新增应用,选择智能体应用并创建。在应用设置页面,模型选择通义千问Plus,其他参数保持默认,也可输入一些 Prompt 设定人设。在页面右侧提问验证模型效果,点击右上角发布。 获取调用 API 所需的凭证:在我的应用>应用列表中查看所有百炼应用 ID 并保存,在顶部导航栏右侧点击人型图标,点击 APIKEY 进入我的 APIKEY 页面,创建新 APIKEY 并保存。
2025-01-10
飞书如何接入大模型?
飞书接入大模型的步骤如下: 1. 搭建,用于汇聚整合多种大模型接口,并获取白嫖大模型接口的方法。 2. 搭建作为知识库问答系统,将知识文件放入其中,并接入上面的大模型。如果不想接入微信,搭建到这里即可,它有问答界面。 3. 搭建接入微信,并配置FastGpt将知识库问答系统接入微信。建议先用小号以防封禁风险。完成上述3步即可。 另外,对于将相关内容发布到飞书: 1. 目标是发布到飞书并在飞书中调用。 2. 尝试发布,在页面右上角点击发布,若飞书未授权则点击配置,然后再次点击发布。 3. 发布成功后可在飞书工作台中找到并使用。但可能存在与所说步骤不完全一致的情况,可通过workflow解决。 对于重度用户,工作流的最好教程参见官方文档:https://www.coze.cn/docs/guides/welcome 。工作流可以解决大模型调用写邮件插件时可能出现的速度慢和可能出错等问题,例如采取工作流+代码的组合方法,将用户原始输入直接传送给插件WebPilot,并通过另一个工作流AI Project进行样式注入等。
2025-01-07