Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有哪些平台提供文生图API

Answer

以下是一些提供文生图 API 的平台:

  • Coze:在国内低代码 Agent 平台中体验较好,即使即将收费但仍具性价比。其 API 更新开放了多模态对话和知识库修改能力,可玩性增强。通过 API 可在微信中实现多种图片功能,如重绘风格、微调内容等。使用时需在 chatgpt-on-wechat 中的 config.json 中配置自己的 Coze API Key 和 Coze Bot ID。
  • Stability AI:发布了 Stable Diffusion 3 和 Stable Diffusion 3 Turbo,可通过其开发者平台 API 使用。ComfyUI 中的 Stable Diffusion 3 API 已更新,目前支持多种比例的 SD3 文生图,使用时先申请 API 再填入 config.json 文件,每账户有 25 免费积分,SD3 每张图 6.5 积分。项目地址:https://github.com/ZHO-ZHO-ZHO/ComfyUI-StableDiffusion3-API 。需注意 SD3 图生图模式不支持选择比例,SD3 Turbo 模型不支持负面提示词。
Content generated by AI large model, please carefully verify (powered by aily)

References

通过 Coze API 打造强大的微信图片助手

🚄作者:彬子[heading1]前言[content]Coze在目前国内低代码Agent平台中,仍是体验最好的。即使Coze即将收费,出于国内版低廉的计费方法和推出的【[一元套餐玩一年】](https://mp.weixin.qq.com/s/jLLAFkuKXONmM_4jjEGiyQ),仍具备较为理想的性价比。尤其最近发布的API更新中将多模态对话和知识库修改能力开放出来,让通过API接入其他场景中的可玩性极大增强。本次重点实践通过对话的多模态方式,来给接入微信的Bot增加几个好用常用的图片功能~比如:给小猫换个重绘风格,甚至换掉里面的小猫线框画的各种涂鸦涂色包括但不限于:1.总结图片内容2.重绘图片风格3.微调图片内容4.分析图表类图片数据5.解答图中题目6.更强大的文生图微信中使用效果,在最后的测试效果中展示。注意:该教程默认你已经掌握通过COW接入微信机器人的方式了。如需补课请先前往:[【共学最全版本】微信机器人跟学教程](https://waytoagi.feishu.cn/wiki/NB3nwtUC0iDLYxkIkSYc0WRznGg)在chatgpt-on-wechat中config.json中配置了你自己的Coze API Key和Coze Bot IDcoze_api_key:"你创建的Coze API Key"coze_bot_id:"你对应微信Bot的Coze Bot的id"

爆肝博主 ZHO

[heading2]4月18日[content]【Zho】ComfyUI Stable Diffusion 3 API已更新为V1.5版:图生图和SD3 Turbo都可以正常使用了!注意:1)SD3图生图模式不支持选择比例2)SD3 Turbo模型不支持负面提示词【Zho】🤣来了朋友们!Stable Diffusion 3(API)已经可以在ComfyUI中使用了!✅目前支持多种比例的SD3文生图(turbo和图生图还调试中)🚗使用方法:先申请API,然后填入config.json文件即可(每账户25免费积分),SD3每张图6.5积分(比较贵)项目地址:https://github.com/ZHO-ZHO-ZHO/ComfyUI-StableDiffusion3-APISD3 API ComfyUI节点测试成功[heading2]4月17日[content]卧槽!!!!!!SD3率先通过API来了!!!!!!!!!!!Stability AI刚刚发布了Stable Diffusion 3和Stable Diffusion 3 Turbo!现在已经可通过Stability AI开发者平台API使用SAI计划在不久的将来通过会员资格提供模型权重详情:https://bit.ly/3W43FjY

爆肝博主 ZHO-绘画

[heading2]4月18日[content]【Zho】ComfyUI Stable Diffusion 3 API已更新为V1.5版:图生图和SD3 Turbo都可以正常使用了!注意:1)SD3图生图模式不支持选择比例2)SD3 Turbo模型不支持负面提示词【Zho】🤣来了朋友们!Stable Diffusion 3(API)已经可以在ComfyUI中使用了!✅目前支持多种比例的SD3文生图(turbo和图生图还调试中)🚗使用方法:先申请API,然后填入config.json文件即可(每账户25免费积分),SD3每张图6.5积分(比较贵)项目地址:https://github.com/ZHO-ZHO-ZHO/ComfyUI-StableDiffusion3-APISD3 API ComfyUI节点测试成功[heading2]4月17日[content]卧槽!!!!!!SD3率先通过API来了!!!!!!!!!!!Stability AI刚刚发布了Stable Diffusion 3和Stable Diffusion 3 Turbo!现在已经可通过Stability AI开发者平台API使用SAI计划在不久的将来通过会员资格提供模型权重详情:https://bit.ly/3W43FjY

Others are asking
文生图在线工具
以下是一些常见的文生图在线工具: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 在 WaytoAGI 网站(https://www.waytoagi.com/category/104),可以查看更多文生图工具。 Stability AI 推出的基于 Discord 的媒体生成和编辑工具的文生图使用方法: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 2. 进入 ARTISAN 频道,任意选择一个频道。 3. 输入/dream 会提示没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。 4. 输入/dream 提示词,和 MJ 类似。 5. 可选参数有五类: prompt(提示词):正常文字输入,必填项。 negative_prompt(负面提示词):填写负面提示词,选填项。 seed(种子值):可以自己填,选填项。 aspect(长宽比):选填项。 model(模型选择):SD3,Core 两种可选,选填项。 Images(张数):1 4 张,选填项。 Tusiart 文生图的简易上手教程: 1. 定主题:确定需要生成的图片的主题、风格和表达的信息。 2. 选择基础模型 Checkpoint:按照主题找内容贴近的 checkpoint,如麦橘写实、麦橘男团、墨幽人造人等效果较好。 3. 选择 lora:寻找内容重叠的 lora 帮助控制图片效果及质量。 4. ControlNet:控制图片中一些特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语的组合,用英文半角逗号隔开,不用管语法和长句。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,单词和短语组合,用英文半角逗号隔开,不用管语法。 9. 采样算法:一般选 DPM++2M Karras,也可留意 checkpoint 详情页上模型作者推荐的采样器。 10. 采样次数:选 DPM++2M Karras 时,采样次数在 30 40 之间。 11. 尺寸:根据个人喜好和需求选择。
2025-03-03
如何让文生图片保持形象一致
要让文生图片保持形象一致,可以参考以下方法: 1. 首先进入文生图,填写提示词,例如“,一头白发的女孩坐在绿植和鲜花的田野里,温暖的灯光,模糊的前景”,设置常规参数生成一张图。 2. 若想以该人物为主角生成一系列其他图,将图片拖入到 ControlNet 中,预处理器选择 reference only,控制模型选择“均衡”,先将保真度数值设置为 1。 3. 在没有明确指向性提示词的情况下,人物形象能保持一致,但表情、动作、服装可能产生随机变化。 4. 可以通过添加关键词来给人物换装、更改服装和表情、更改动作和表情、更改姿态、环境和表情等,比如添加“红裙子”“黑色校服、哭泣”“抱手、生气”“在花丛中奔跑、开心”“红色棒球帽,时尚卫衣,在商场逛街”。 5. 像制作典籍类作品时,可对主要人物先出一版形象照,后续所有画面用“cref”做人物一致性的操作。 通过以上一系列操作和测试,可以发现这些功能在绘制系列插画、漫画、小说插图等工作时,能保持主角形象的统一,也能根据情况做实时的调整,若后期再配合 lora,潜力非常大。
2025-03-02
文生视频怎么使用?
以下是关于文生视频使用的相关信息: Vidu: Web 端访问:https://www.vidu.studio/ 极速生成,实测 30 秒最快推理速度 动漫风格,万物皆可二次元 角色可控,任意场景、任何动作,角色保持一致 精准理解,镜头、文字、动作,理解更准、生成更稳 大片质感,影视级画面和特效一键直出 Vidu 提示词指南: 如何使用“文生视频”: 如何使用“图生视频(用作起始帧)”: 如何使用“参考人物角色生成视频”: PixVerse V2: 单个视频生成(8s):8s 的视频生成需要花费 30Credits,5s 的视频生成需要花费 15Credits,且只能使用 PixVerse V2 模型,生成时请注意模型选择。目前仅支持 16:9 画面比例的视频生成。 文生视频:点击“Text to Video”,在“Model”选择“PixVerse V2”,视频时长。支持多风格的视频生成,您可以通过在提示词中加入“Anime”,“Realistic”等词语做到这点。 图生视频:点击“Image to Video”,在“Model”选择“PixVerse V2”,视频时长。图生视频暂不支持“Magic Brush”、“Camera Motion”、“Motion Strength”等功能,如需要使用上述功能,请将模型切换至“PixVerse V1”。 文字生成视频的 AI 产品: Pika:一款非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,不过是收费的。 Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看这里: 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-02
文生音乐的app
以下是一些关于文生音乐的 App 相关信息: 目前龙头的文生音乐软件如 Suno、Uido 等,对于简单的广告 BGM、游戏配乐等使用场景有较大价值,但在音乐创作上仍有不足。例如 Suno 除歌词部分外,音乐风格提示词只有 120 个字符,能描述和理解的关键词有限,创作丰富度也有限,旋律较单调。 Colab 上有一个增强音质的脚本,但不如现有的音频处理工具,调参较难。 一些相关工具和网站: Audiobox:https://audiobox.metademolab.com/ ,是 Meta 的新音频生成基础研究模型,可结合语音输入和自然语言文本提示生成语音和声音效果。 Stable Audio:https://www.stableaudio.com/ ,可使用对应的 GPTs 生成提示词:https://chat.openai.com/g/gjAr0hpLsLstableaudiogpt 。 图像生成配乐模型(MAGNet,AudioLDM,audiogen):https://huggingface.co/spaces/fffiloni/Image2SFXcomparison ,audiogen 可文生音乐、文生拟音,在 discord 上使用但效果不稳定:https://discord.gg/wUuF5Uh2pR 。 音乐生成使用的文生音乐模型 Suno 相关教程: 在自定义模式(Custom Mode)下,有音乐风格(Style of Music)与歌词(Lyrics)两个主要输入窗口,音乐风格需填写多个描述整首音乐风格和感觉的 tag 进行分隔,可识别的 tag 包括音乐类型/流派、人声/乐器、情绪/氛围、节奏、场景、混响、其他和声/音效等。
2025-03-01
强大好用的文生视频AI
以下是一些强大好用的文生视频 AI 工具: 1. Pika:是一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 这些工具适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。 基于 MiniMax 海螺 AI 优质的 Prompt 响应能力,可以使用文生进行特定性外形保持。通过测试外形描述 Prompt 的保持情况,确定响应较为稳定的外形要素,反复使用以保持一定程度的稳定性。外形要素包括发型、年龄性别、衣物颜色、环境等。发型和衣物能基本稳定角色头部形象,年龄能生成相近年龄角色,相同的环境空间,尤其是光环境,可以增加观众对于形象认识的“一致性”认知,例如较大明暗对比的环境,保留较少的角色面部信息,有助于角色“一致性”。 文生视频具有制作便捷高效、提供多元创作思路的优势,但较难保证主体/风画面格的稳定性。实际使用场景更多是作为空镜头/非叙事性镜头/大场面特效镜头的制作。例如: 1. 《科幻预告片》:传统科幻类型影像具有相近的视觉元素,通过对于同类型视觉元素的空镜头制作,构成具有类似场景和美学风格的画面,利用“爆破”等优质表现的画面作为主要节奏点,制作出充满紧张感的科幻电影伪预告片。 2. 《雪崩灾难片预告》:根据“雪崩”这一主题,设计多组空镜头/大场面镜头组合,最大程度利用海螺 AI 文生视频的优异表现力,通过节奏感较强的剪辑,制作出一个以简单的故事线串联而成的预告片。
2025-02-28
国内文生视频
以下是一些国内的文生视频工具及相关信息: Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频。提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 ETNA(国内):https://etna.7volcanoes.com/ 。Etna 是一款由七火山科技开发的文生视频 AI 模型,它可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps,文生视频支持中文,时空理解。 以下是一些文字生成视频的 AI 产品推荐: Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 以下是一些文生视频模型的排序及特点(从高到低): |排序|模型|特点(优缺)| |||| |1|海螺|语意遵循不错,模型解析有待提高,自带电影滤镜,但有些用力过猛,得益于海量的影视数据| |2|可灵 1.5|颜色失真,缺少质感,偏科严重,物理规律和提示词遵循较强| |3|智谱|语意遵循,质感较差,画质一言难尽| |4|mochi|动态丰富,想象力丰富,美学质感较好| |5|pd 2.0 pro|PPT 效果,训练数据较少,但是联想启发性很好| |6|runway|空间感强,语意遵循较差,流体效果一绝| |7|Seaweed 2.0 pro|质感略弱于可灵 1.5,整体感觉师出同门| |8|sora|运镜丰富,物理逻辑混乱| |9|Pixverse v3|动态稳,丝滑,整体美学强于可灵 1.5| |10|luma 1.6|语意遵循差,提示词随便,动起来算我输| 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-27
怎么部署GPTs的api?
部署 GPTs 的 API 可以参考以下步骤: 1. 参考文章,了解之前的部署情况。 2. 登录地址,点击 Copy Link 进行复制 Actions API 链接。 3. 配置 GPTs Actions API: 打开 ChatGPT,点击创建 GPTs>Configure>Create new action。 输入来自 Gapier 的 Actions API 并点击 Import。 4. 授权: 在 Gapier 复制授权码。 在 Authentication 下选择配置图标,进入授权页面。 按照以下设置进行配置: Authentication Type:选择 API Key。 Auth Type:选择 Basic。 输入从网站上复制的授权码并点击 Save。 5. 引用 Action: 确定调用的 Action,并在 Prompt 中引用。 查看 Action 的方式分为两种: GPTs>Configure>Actions 页面。 网页查看,地址为。 另外一种引用的方式是:只要在 Instructions 中申明清楚需求,GPT 会自动选择合适的 API。 此外,还需注意以下几点: 1. 了解 OpenAPI 规范,通过 Schema 让 ChatGPT 懂这个 API。 2. 对于带参数的 Post 请求,需要创建规范文件、修改 GPTs 的 Action、调整 Prompt 等。 3. 注意如果不和说传入中文,它会给我们翻译了再传。
2025-03-01
基础搭建的知识库效果很差,模型答案的幻觉很严重,我应该怎么改进?(Deepseek调用api接入本地faiss的rag库)
以下是一些改进基础搭建的知识库效果、减轻模型答案幻觉问题的建议: 1. 更换大模型:例如从 ChatGLM26B 替换成 baichuan213b,针对您的场景,后者的性能可能提升一倍左右。 2. 更换 embedding 模型:将 embedding 模型从 LangChain Chatchat 默认的 m3ebase 替换为 bgelargezh,后者可能更优。 3. 测试不同 Top k 的值:比较 Top 5、Top 10、Top 15 的结果,发现 Top 10 时效果可能最优。 4. 对文档名称进行处理:人工对文件进行重命名,上传相同文件构建知识库,同时在构建知识库时勾选【开启中文标题加强】选项,虽然重命名文件对结果的提升效果不明显,但勾选该选项后,回答的无关信息可能减少,效果有所提升。 RAG(RetrievalAugmented Generation)即检索增强生成,由检索器和生成器两部分组成。检索器从外部知识中快速找到与问题相关的信息,生成器利用这些信息制作精确连贯的答案,适合处理需要广泛知识的任务。 在大模型中,向量可想象成空间中的点位,每个词或短语对应一个点。系统通过查看词在虚拟空间中点的位置,寻找直线距离最近的点来检索语义上接近的词语或信息。理解向量后,当收到一个对话时,RAG 的完整工作流程为:检索器从外部知识中检索相关信息,生成器利用这些信息生成答案。 要优化幻觉问题和提高准确性,需要了解从“问题输入”到“得到回复”的过程,针对每个环节逐个调优,以达到最佳效果。
2025-02-27
Claude3/grok3/Gemini使用API调用时消耗token的价格是?
Claude 3 的 API 调用价格为:每百万输入 token 0.25 美元,每百万输出 token 1.25 美元。可以处理和分析 400 起最高法院案件或 2500 张图片只需 1 美元。相关链接:https://x.com/imxiaohu/status/1768284259792691366?s=20
2025-02-27
请介绍Coze开发平台中,扣子API有什么功能?怎么用它?
在 Coze 开发平台中,扣子 API 具有以下功能和使用方法: 获取 accessToken: 在 coze 界面右侧的扣子 API 授权,或者打开链接 https://www.coze.cn/open/oauth/pats 。 添加令牌,设置 token 的名称和过期时间(为安全起见,最多 1 个月)。 设置权限,可选择会话管理和对话,拿不准可全部选择,完成后点击“确定”按钮。 最后一定要点击按钮复制下拉获取令牌,此令牌只会出现一次。 获取 botid: 从“工作空间”打开一个 bot,点击商店按钮,查看地址栏中“bot/”之后的数字。 发布为 bot api: 注意在前端使用 bot 必须发布成为 API,点击发布,选择 API,等待审核通过。 此外,智能体沟通页面在 Zion 中采用 OAuth 鉴权机制,准备工作包括: 获取 Coze bot 应用鉴权密钥:在 Coze 主页点击左下方扣子 API,选择 Oauth 授权模式,添加新令牌并配置基本信息,创建 Key 过程中会生成公钥和私钥(私钥需单独下载保存),最后勾选全部权限。 获取 Bot ID:进入自己的智能体在地址栏内复制“bot/”之后的数字,且 bot 发布时要选择 Agent as API。 在 Coze 上发布 bot:发布时记得勾选 API 及 WEB SDK,Coze bot 发布有审核周期(1 30 分钟),需确认发布成功。 在扣子中手搓插件方面: Body:用于传递请求主体部分,GET 方法中通常不使用来传递参数。 Path:定义请求路径部分,GET 方法中可编码为 URL 一部分传递参数。 Query:定义请求查询部分,是 GET 方法中常用的参数传递方式。 Header:定义 HTTP 请求头信息部分,GET 方法中通常不用于传递参数。 配置输出参数:填对信息后可点击自动解析,若成功会显示并填好输出参数,然后保存并继续,建议填写参数描述。 调试与校验:测试工具能否正常运行,运行后查看输出结果,点击 Response 可看到解析后的参数。
2025-02-27
配置“DeepSeek-R1”模型的 API key:基础 URL:https://ark.cn-beijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。添加“DeepSeek-R1”模型。这个行为在Macbook中怎么操作,请进行指导,通过图片、文字、数据、网址等形式
在 Macbook 中配置“DeepSeekR1”模型的 API key 及添加模型的操作步骤如下: 1. 获取 DeepSeekR1 满血版密钥: 注册并登录火山引擎,点击立即体验进入控制台:https://zjsms.com/iP5QRuGW/ 。 创建一个接入点,点击在线推理创建推理接入点。 为接入点命名为 DeepSeekR1。若提示“该模型未开通,开通后可创建推理接入点”,点击“立即开通”,勾选全部模型和协议一路开通(免费)。 确认无误后,点击“确认接入”按钮。 自动返回创建页面,复制多出的接入点名称“DeepSeekR1”。 点击【API 调用】按钮,进入后点击【选择 API Key 并复制】,若没有则点击【创建 API key】,复制并保存。 2. 配置“DeepSeekR1”模型的 API key: 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 。 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 配置 API key:基础 URL:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 添加“DeepSeekR1”模型。 3. 环境配置指南: 首先到 deepseek 的官网(https://www.deepseek.com/),进入右上角的 API 开放平台。若没有赠送余额,可选择充值,支持美元和人民币两种结算方式及各种个性化充值方式,并创建一个 API key(注意及时保存,只会出现一次)。 以 cursor 作为代码编辑器为例,下载安装后,在插件页面搜索并安装 Roocline 。安装完后,打开三角箭头,选中 RooCline 并点击齿轮,进入设置,依次设置: API Provider:选择 DeepSeek 。 API Key:填入已创建的 key 。 模型:选择 DeepSeekreasoner 。 语言偏好设置。 记得把 HighRisk 选项都打开,最后点击 Done 保存修改。 在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。
2025-02-26
有哪些AI工具具备文案写作、代码生成、API接口功能
以下是一些具备文案写作、代码生成、API 接口功能的 AI 工具: 1. OpenAI API:可以应用于几乎所有涉及生成自然语言、代码或图像的任务,提供了一系列不同能力级别的模型,适用于不同任务,并且能够微调您自己的自定义模型。 2. Ideogram 2.0:是目前 AI 设计能力较强的工具,文字生成效果好且准确(仅限英文),图像生成效果优于 Flux&Dalle·3,提供 API 接口,方便企业集成高级图像生成功能。 3. Grammarly:提供语法检查、拼写纠正、风格建议和语气调整等功能,易于使用,支持多种平台,适用于多种语言。 4. Hemingway Editor:简化句子结构,提高可读性,标记复杂句和冗长句,界面简洁,重点突出,适用于改善写作风格和简洁性。 5. ProWritingAid:全面的语法和风格检查,提供详细的写作报告和建议,功能强大,支持多种平台和集成,特别适合专业写作者。 6. Writesonic:基于 AI 生成各种类型的文本,包括电子邮件、博客文章、广告文案等,生成速度快,适合需要快速创作和灵感的用户。 7. Lavender:专注于邮件写作优化,提供个性化建议和模板,帮助用户提高邮件打开率和回复率。
2025-02-25
请问下现在最好的ai生成ppt的平台/软件是什么?
目前较好的 AI 生成 PPT 的平台/软件有以下几种: 1. 讯飞智文(https://zhiwen.xfyun.cn/):免费引导较好。 2. Mindshow.fun:支持 Markdown 导入。 3. kimi.ai:选 PPT 助手暂时免费且效果好。 4. Tome.app:AI 配图效果好。 5. Chatppt.com:自动化程度高。 6. 百度文库(https://wenku.baidu.com):付费效果好。 大多数 AI 生成 PPT 按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲。 2. 手动优化大纲。 3. 导入工具生成 PPT。 4. 优化整体结构。 此外,剪映的图文成片功能(只需提供文案,自动配图配音)也可辅助生成 PPT 相关内容。
2025-03-02
艾莉平台所有功能大全
艾莉平台的功能主要包括以下几个方面: 1. 基础能力: 提示词(人设与回复逻辑功能):可设定 Bot 的身份及其目标和技能,如产品问答助手、新闻播报员、翻译助理等,其决定了 Bot 与用户的互动方式。详情请参考。 插件:通过 API 连接集成各种平台和服务,扩展 Bot 能力。平台内置丰富插件,也可创建自定义插件,将所需 API 集成在扣子内作为插件使用。详情请参考。 工作流:一种用于规划和实现复杂功能逻辑的工具,可通过拖拽不同任务节点设计多步骤任务,提升 Bot 处理复杂任务的效率。详情请参考。 记忆库:扣子的记忆库功能可以保留和理解对话细节,并支持添加外部知识库给模型补充知识,使 Bot 与用户的互动更具针对性和个性化。 知识库:支持上传本地或线上内容,然后将这些内容分割成知识分片,通过语义匹配给模型补充知识。详情请参考。 数据库:用来存储和管理结构化数据,并支持用户通过自然语言方式对数据库中的数据进行增删改查。详情请参考。 2. 核心功能详述: 知识库功能: 数据上传与管理:开发者可通过平台界面轻松上传各种形式的数据,如文本、图片、视频等,包括 FAQ 文档、产品手册、行业报告等,并通过直观编辑工具整理和分类数据。 训练与优化:上传的数据用于训练 AI Bot,使其更好地理解用户问题并提供准确回答,平台机器学习算法会分析数据,提高回答准确性和相关性。 实时更新:知识库支持实时更新,对金融、法律等需频繁更新信息的行业尤为重要。 数据库功能: 用户交互记录:平台能够存储用户的交互历史,包括提问、AI Bot 的回答及反馈,这些数据对理解用户需求和优化对话流程至关重要,目前数据库的设置只能在创建 AI bot 时设置和修改,无需懂数据库语法或编程,用自然语言告诉 AI Bot 数据操作即可。 个性化服务:通过分析用户交互历史,AI Bot 能提供更个性化服务,如主动提供产品更新或相关推荐。 错误纠正与学习(进阶玩法):当 AI Bot 回答出错,开发者可利用数据库交互记录进行错误分析并修正,持续学习提高整体性能。
2025-02-28
推荐靠谱的数字人平台
以下为您推荐一些靠谱的数字人平台: 1. 卡尔的 AI 沃茨数字人课程: 这门课程一共 15 节视频课,持续更新,还会不定时增加最新的数字人内容,附赠课外社群辅导,专门解决数字人相关的问题。 课程建立了一套完整的数字人学习体系,涵盖 2023 年数字人领域的破圈事件,如 AI 马斯克对谈 AI 乔布斯超 331.9k 播放、霉霉说中文火遍全网等。 数字人在制作个人 IP 短视频、配音、直播甚至到智能客服、虚拟偶像等各种领域都可以完成赋能。 报名方式:扫码可以查看课程详细内容和介绍。 2. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片,然后按照相关步骤操作。 3. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法:点击上面的网址,点击右上角的 Create vedio,然后按照相关步骤操作。 4. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很 AI。 使用方法:点击上面的网址,注册后获得 120 免费 k 币,选择“照片数字人口播”的功能,然后按照相关步骤操作。 5. XiaoHu.AI 推荐的开源数字人工具: 特点:一键安装包,无需配置环境,简单易用。 功能:生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 下载地址:GitHub:
2025-02-27
使用AI写网络小说,并且通过网络小说平台发布赚钱的可行性及步骤
使用 AI 写网络小说并通过网络小说平台发布赚钱是具有一定可行性的,以下是相关步骤: 一、准备阶段 1. 确定目标读者群体,了解他们的喜好和需求,以便创作出更符合市场的作品。 2. 选择适合的 AI 写作工具,例如 ChatGPT 等。 二、写作阶段 1. 利用 AI 工具生成小说的初步框架和情节,包括角色设定、故事发展等。 2. 对 AI 生成的内容进行修改和完善,使其更具逻辑性、吸引力和独特性。 三、发布阶段 1. 选择合适的网络小说平台,了解其发布规则和要求。 2. 按照平台规定注册账号,并提交小说作品。 四、运营推广阶段 1. 积极与读者互动,回复评论和留言,根据读者反馈改进作品。 2. 利用社交媒体等渠道宣传自己的小说,提高知名度和影响力。 需要注意的是,虽然 AI 可以提供帮助,但最终的作品质量仍取决于作者的修改和完善。同时,不同的网络小说平台可能有不同的审核标准和版权政策,需要仔细了解和遵守。
2025-02-27
dify平台
Dify 是一个开源的大模型应用开发平台: 理念:结合后端即服务和 LLMOps 的理念。 特点:为用户提供直观界面,能快速构建和部署生产级别的生成式 AI 应用。具备强大工作流构建工具,支持广泛模型集成,有功能丰富的提示词 IDE 和全面的 RAG Pipeline 用于文档处理和检索。允许用户定义 Agent 智能体,通过 LLMOps 功能持续监控和优化应用程序性能。 部署选项:提供云服务和本地部署,满足不同用户需求。 优势:开源特性确保对数据完全控制和快速产品迭代。设计理念注重简单性、克制和快速迭代,能帮助用户将 AI 应用创意快速转化为现实。 适用场景:个人研究推荐单独使用,企业级落地项目推荐多种框架结合。 Dify 官方手册:https://docs.dify.ai/v/zhhans
2025-02-27
提供一些思维导图的AI应用
以下是一些思维导图的 AI 应用: 1. GitMind:免费的跨平台思维导图软件,支持多种模式,如提问、回答、自动生成等,可通过 AI 自动生成思维导图。 2. ProcessOn:国内的思维导图+AIGC 工具,能利用 AI 生成思维导图。 3. AmyMind:轻量级在线思维导图工具,无需注册登录,支持自动生成节点。 4. Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路,生成文章大纲。 5. TreeMind:“AI 人工智能”思维导图工具,输入需求即可由 AI 自动完成思维导图生成。 6. EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,有助于提升生产力。 此外,还有一些适用于绘制示意图的 AI 工具: 1. Creately:在线绘图和协作平台,利用 AI 简化图表创建过程,适合绘制流程图、组织图、思维导图等,具有智能绘图、丰富模板库和实时协作等功能。官网:https://creately.com/ 2. Whimsical:专注于用户体验和快速绘图的工具,适合创建线框图、流程图、思维导图等,具有直观界面、拖放操作和协作功能。官网:https://whimsical.com/ 3. Miro:在线白板平台,结合 AI 功能,适用于团队协作和各种示意图绘制,如思维导图、用户流程图等,具有无缝协作、丰富模板和工具以及集成其他项目管理工具的功能。官网:https://miro.com/ 使用 AI 绘制示意图的步骤: 1. 选择工具:根据具体需求选择合适的 AI 绘图工具。 2. 创建账户:注册并登录该平台。 3. 选择模板:利用平台提供的模板库,选择适合需求的模板。 4. 添加内容:根据需求添加并编辑图形和文字,利用 AI 自动布局功能优化图表布局。 5. 协作和分享:如需团队协作,可邀请团队成员一起编辑。完成后导出并分享图表。
2025-03-03
我想用deepseek生成文献综述,请给我提供指令模板
以下是为您提供的 DeepSeek 生成文献综述的指令模板: 一、基础指令框架 1. 四要素模板:示例 2. 格式控制语法 强制结构:使用```包裹格式要求 占位符标记:用{{}}标注需填充内容 优先级符号:>表示关键要求,!表示禁止项 二、进阶控制技巧 1. 思维链引导 分步标记法:请逐步思考:1.问题分析→2.方案设计→3.风险评估 苏格拉底式追问:在得出最终结论前,请先列举三个可能存在的认知偏差 2. 知识库调用 领域限定指令:基于 2023 版中国药典,说明头孢类药物的配伍禁忌 文献引用模式:以 Nature 2022 年发表的论文为参考,解释 CRISPRCas9 最新突破 三、高级调试策略 1. 模糊指令优化 宽泛需求:添加维度约束,例如原句“写小说”→修正“创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构” 主观表述:量化标准,例如原句“写得专业些”→修正“符合 IEEE 论文格式,包含 5 项以上行业数据引用” 2. 迭代优化法 首轮生成:获取基础内容 特征强化:请加强第三段的技术细节描述 风格调整:改用学术会议报告语气,添加结论部分 最终校验:检查时间逻辑一致性,列出可能的事实性错误 希望这些指令模板对您生成文献综述有所帮助。
2025-02-28
为我提供相关的学习课程,方便我可以高效上手学习,零基础代码,开始去学习搭建自己的工作流
以下是为您提供的相关学习课程,方便您零基础代码学习并搭建自己的工作流: 8 月 13 日 ComfyUI 共学: 讨论了 Config UI 的学习需求、教程分享、部署问题、应用场景,以及相关活动的规划。 分享了 Config UI 工作流在不同场景的应用、优势、弊端以及学习方法,还提及了相关的分享会和开源社区的情况。 探讨了 CONFIUI 的使用、工作流分享、报错问题及解决方案,还有相关课程的设计安排。 讨论了郭佑萌在 AI 绘图领域的工作经历,包括项目实践、技术调研、培训以及未来的教学计划等内容。 介绍了 AI 绘图课程的规划。 课程从零基础开始,从认识 config、UI 及行业概念讲起,逐步深入到环境部署、底层技术概念、提示词等内容。 介绍了 config 牛角尖大王系列,包括 control net、IP Adapter、图像放大、mask 等部分,阐述了它们的作用和玩法。 学习相关知识后初步具备搭建复杂工作流能力,会拆解分析网上热门工作流。 报错问题可分为网络、模型、工作流搭建、环境等方面,安装新插件时可参考项目地址的 requirement 文档。 规划了实战案例思路。 ComfyUI 共学快闪: 王蓉🍀🎈Wang Easy 基础搭建和转绘。 唯有葵花向日晴基础教程,工作流开发,实际应用场景。 热辣 HuolarrAI 系统课私聊图生视频。 咖菲猫咪基础教程/工作流搭建思路/各版本模型使用的优缺点。 傅小瑶 Lucky 如何制作多人转绘视频。 云尚工作流节点搭建思路。 FǎFá 热门节点功能,搭建。 森林小羊基本报错解决方式及基础工作流逻辑分析。 苏小蕊基础教程。 Sophy 基础课程。 蜂老六装一百个最新常用插件后如何快速解决冲突问题。 阿苏工作流框架设计。 aflyrt comfyui 节点设计与开发。 老宋&SD 深度解释虚拟环境部署和缺失模型的安装。 Liguo 模型训练。 啊乐福基础课程。 塵优秀案例。 风信基础课程➕平面设计应用场景。 北南基础课程。 视频工作流框架设计。 Damon 基础课程。 渔舟基础课程+工作流搭建思路。 乔木船长工作流。 ☘️基础教程。 ☘基础教程。 工作流设计+典型案例剖析。 麒白掌工作流搭建。 OutSider 风格迁移。 吴鹏基础+工作流搭建。 拾光工作流基础搭建从入门到精通。 茶浅浅。视频转绘/节点工作流介绍。 百废待.新(早睡版)工作流从入门到进阶。 电商应用场景。 AI 女友麦洛薇(0 代码 comfyui 搭建,知识图谱稳定人设,无限上下文,永久记忆,可接入飞书): 打开 Comfyui 界面后,右键点击界面,即可找到 Comfyui LLM party 的目录,您既可以学习如何手动连接这些节点,从而实现一个最简单的 AI 女友工作流,也可以直接将工作流文件拖拽到 Comfyui 界面中一键复刻麦洛薇机器人。 飞书机器人创建: 在中创建自建应用。 进入应用获取 app_id 与 app_secret。 添加应用能力>开启机器人应用能力。 权限管理>消息与群组>选择需要的权限打开。 安全设置>将 comfyUI 运行的电脑 IP 加入白名单。 发布机器人以应用生效。 要先把创建的机器人拉到群组中或者拉进私聊。 飞书开发平台找到发送消息的开发文档。 右侧点击获取 token。 选择 receive id type,chat_id 对应群组,open_id 与 user_id 对应个人,点击选择成员,复制对应的 id 即可。 如果需要让机器人发送语音,需要自行在电脑上安装 ffmpeg。
2025-02-26
那款工具提供了风格迁移
以下是一些提供风格迁移功能的工具: 1. Comfyui flatten 光流重绘:通过改变参数可生成不同视频效果。在使用中,如果遇到人物不能变化,可以加入对应的提示词增强和调整 cfg 的权重。负面提示词一般不填,由 Unsampler 完成。old_qk 参数控制生成过程中保留原始内容的程度,设置为 1 时更多保留原始内容,更贴合提示词;设置为 0 时允许更大变化。add_noise 有助于使用像 IPAdapter 这样的风格迁移工具,因为额外的噪声可提供更多变化空间,使风格转换更显著。采样器选择方面,dpmpp_2m 适合保持视频一致性,LCM(Latent Consistency Model)采样器更适合大幅度的场景改变。 2. 辅助工具:ICLight“重打光”: 体验链接: 控制网作者张吕敏刚放出来的大杀器:https://github.com/lllyasviel/ICLight 体验地址:https://huggingface.co/spaces/lllyasviel/ICLight 可以传一张图,选择光源位置,填上提示词,一张新的有光源角度的融合背景的图就产生了。 【Zho】做好了敏神刚放出的打光模型 ICLight 的 Colab 方案:https://colab.research.google.com/drive/1pXSpTHzNhaAKFmMvhxj7Zp9781L2f?usp=sharing 。敏神这些内容都是开源的,可以在各种 UI 里用(只要有人做插件就行),当然也可以自己做成产品加上自己的一些独门绝技放大、风格迁移、动态变化等。 3. 晨然提到的 IpAdapter:IpAdapter 是风格迁移神器,一张图就可以学到草图。但不建议 weight 开太高,否则生图颜色会太像参考图。noise 可以理解为对 Prompt 放行的程度,noise 越大,提示词的比例越大。
2025-02-25
在短视频制作领域,有哪些AI软件可供使用?可以提供哪些帮助?有没有很好的案例参考?
在短视频制作领域,以下是一些可供使用的 AI 软件及其所能提供的帮助和相关案例参考: 1. ChatGPT + 剪映:ChatGPT 可生成视频脚本,剪映能依据脚本自动分析所需场景、角色、镜头等要素并生成素材和文本框架,实现从文字到画面的快速转化,节省时间和精力。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户轻松创建和编辑高质量视频,用户提供文本描述即可生成相应内容。 4. VEED.IO:提供 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划视频内容。 5. Runway:AI 视频创作工具,能将文本转化为风格化的视频内容,适用于多种场景,但存在爱变色、光影不稳定的问题。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,可根据文本脚本生成视频。 案例参考:在制作 AI 短片时,会根据不同工具对画面的处理能力进行组合使用。例如,Pixverse 擅长物体滑行运动,有手部特殊运动的画面会用 Runway 来辅助完成,需要人物表情自然的画面会用 Pika 来生成。在声音方面,使用 11labs 进行对白制作,但存在 AI 声音没有情绪和情感的问题。在剪辑方面,先进行粗剪确定画面逻辑,再进行定剪调整和替换画面素材。音效和音乐方面,剪映中有简单音效库,复杂音效可能需另外制作,商用音乐要注意版权。特效方面,剪映可添加一些光影效果。包装方面,剪映智能匹配字幕较为方便。
2025-02-25
我是一位短视频AI博主,您能够为我提供哪些帮助呢?
以下是我能为您这位短视频 AI 博主提供的帮助: 1. 为您介绍根据视频脚本生成短视频的工具,例如: ChatGPT 结合剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析并生成素材和文本框架,实现从文字到画面的快速转化。 PixVerse AI:在线 AI 视频生成工具,支持多模态输入转化为视频。 Pictory:允许用户通过提供文本描述轻松创建和编辑高质量视频。 VEED.IO:提供 AI 图像和脚本生成器,帮助规划视频内容。 Runway:能将文本转化为风格化视频内容。 艺映 AI:提供文生视频、图生视频、视频转漫等服务。 2. 为您介绍北京分队中与短视频 AI 相关的人员信息,他们在不同领域具有丰富的经验和技能,可能为您的创作提供灵感或合作机会。例如: wb:对 AI 视频感兴趣,运营私域资源讨论群,关注 AI 前沿动态。 祖海:拥有编导和操盘手资源,从事个人 IP 咨询和陪跑以及 Ai 数字人获客。 宇竹:在多个领域有成功的 IP 操盘经验。 U:业余配音演员和歌手,擅长音频和简单视频剪辑。 萝卜:具备生图和生视频剪辑经验。 李先森:星动 AI 联合创始人,致力于 AI 教育培训和商业应用。 Lucky:在信息技术领域有丰富经验,能提供多种 AI 相关项目服务。 粉仔:抖音上的 AIGC 博主,熟悉主流 AIGC 工具。 sam:热爱互联网和 AI 技术。 海地老师:AI 影视共创社北京分社的负责人。 张帆:产品经理,正在学习 AI,尝试做知识分享。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-24