直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

免费的文字生图工具推荐

回答

以下为一些免费的文字生图工具推荐:

  • DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真图片。
  • StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。
  • MidJourney:因高质量图像生成效果和友好的界面设计受欢迎,在创意设计人群中流行。

您还可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。

另外,为您补充一些文字生成视频的 AI 产品:

  • Pika:出色的文本生成视频 AI 工具,擅长动画制作,支持视频编辑。
  • SVD:若熟悉 Stable Diffusion,可安装其最新插件,在图片基础上生成视频,由 Stability AI 开源。
  • Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频功能,但收费。
  • Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。
  • Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。

更多文生视频的网站可查看:https://www.waytoagi.com/category/38 。

关于 Stability AI 推出基于 Discord 的媒体生成和编辑工具的文生图使用方法:

  1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion
  2. 进入 ARTISAN 频道,任意选择一个频道
    • 输入/dream 会提示没有权限,点击 https://stability.ai/stable-artisan#choose-stable-artisan-plan 链接,注册登录,填写信用卡信息以及地址,点击提交,可免费试用三天,三天后开始收费。
    • 输入/dream 提示词,这部分和 MJ 类似。
    • 和 MJ 手工输入参数不同,可选参数有五类:
      • prompt:提示词,正常文字输入,必填项。
      • negative_prompt:负面提示词,填写负面提示词,选填项。
      • seed:种子值,可以自己填,选填项。
      • aspect:长宽比,选填项。
      • model:模型选择,SD3、Core 两种可选,选填项。
      • Images:张数,1 - 4 张,选填项。完成后选择其中一张。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

问:文生图工具有哪些?

文生图工具是一种利用人工智能技术生成图片的工具。它通过分析输入的文本描述,使用深度学习算法生成相应的图片。目前,市场上有许多文生图工具,其中一些比较受欢迎的工具包括:1.DALL·E:DALL·E是OpenAI推出的一款文生图工具,它可以根据输入的文本描述生成逼真的图片。2.StableDiffusion:StableDiffusion是一款开源的文生图工具,它可以生成高质量的图片,并且支持多种模型和算法。3.MidJourney:MidJourney因其高质量的图像生成效果和用户友好的界面设计而受到广泛欢迎,并且在创意设计人群中尤其流行。以上是一些比较受欢迎的文生图工具,它们都具有不同的特点和优势,可以根据自己的需求选择使用。在WaytoAGI网站,可以查看更多文生图工具:https://www.waytoagi.com/category/104类似问题:文字生成图片的AI有哪些?内容由AI大模型生成,请仔细甄别。

问:文字生成视频的 AI 产品有哪些?

"文生视频"通常指的是使用人工智能技术将文本内容转换成视频的服务。以下是一些国内外提供此类功能的产品推荐:1.Pika:这是一款非常出色的文本生成视频AI工具,擅长动画制作,并支持视频编辑。2.SVD:如果你熟悉Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由Stability AI开源的video model。3.Runway:这是一款老牌AI视频生成工具,提供实时涂抹修改视频的功能,不过需要注意的是,Runway是收费的。4.Kaiber:这是一款视频转视频AI,能够将原视频转换成各种风格的视频。5.Sora:由OpenAI开发,可以生成长达1分钟以上的视频。以上工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。另外,更多的文生视频的网站可以查看这里:[https://www.waytoagi.com/category/38](https://www.waytoagi.com/category/38)内容由AI大模型生成,请仔细甄别。

Stability AI推出基于Discord的媒体生成和编辑工具

1.点击链接进入官方DISCORD服务器:https://discord.com/invite/stablediffusion2.进入ARTISAN频道,任意选择一个频道1.输入/dream会提示你没有权限,点击[https://stability.ai/stable-artisan#choose-stable-artisan-plan](https://stability.ai/stable-artisan#choose-stable-artisan-plan)链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费1.输入/dream提示词,这部分和MJ类似,1.和MJ手工输入参数不同,可选参数有五类|prompt提示词|正常文字输入,必填项|<br>|-|-|<br>|negative_prompt负面提示词|填写负面提示词,选填项|<br>|seed种子值|可以自己填,选填项|<br>|aspect长宽比|选填项|<br>|model模型选择|SD3,Core两种可选,选填项|<br>|Images张数|1-4张,选填项|完成后选择其中一张

其他人在问
文生图?
以下是关于文生图的详细介绍: 定主题:明确您想要生成的图片的主题、风格和表达的信息。 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量,可参考广场上优秀帖子中使用的 lora。 ControlNet:用于控制图片中的特定图像,如人物姿态、生成特定文字或艺术化二维码等,属于高阶技能。 设置 VAE:一般选择 840000 即可。 Prompt 提示词:用英文书写想要 AI 生成的内容,使用单词和短语组合,无需考虑语法,用英文半角逗号隔开。 负向提示词 Negative Prompt:同样用英文书写想要 AI 避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:常用 DPM++ 2M Karras,也可参考 checkpoint 详情页上模型作者推荐的采样器。 采样次数:使用 DPM++ 2M Karras 时,采样次数一般在 30 40 之间。 尺寸:根据个人喜好和需求选择。 对于提示词,分为内容型提示词和标准化提示词,用于描述想要的画面。采样迭代步数通常控制在 20 40 之间,步数越高绘画越清晰但速度越慢。采样方法常用的有 Euler a、DPM++2S a Karras、DPM++2M Karras、DPM++ SDE Karras、DDIM,部分模型有指定算法,搭配效果更佳。比例设置为 800:400,尺寸并非越大越好,模型练图多基于 512x512 框架,过大尺寸可能导致奇怪构图,若想要高清图,可使用高清修复功能放大图像倍率,同时注意控制画面比例。
2024-11-12
国内文生图大模型,有哪些?
以下是一些国内的文生图大模型: 百度的文心一言:https://wenxin.baidu.com 抖音的云雀大模型:https://www.doubao.com 智谱 AI 的 GLM 大模型:https://chatglm.cn 中科院的紫东太初大模型:https://xihe.mindspore.cn 百川智能的百川大模型:https://www.baichuanai.com/ 商汤的日日新大模型:https://www.sensetime.com/ MiniMax 的 ABAB 大模型:https://api.minimax.chat 上海人工智能实验室的书生通用大模型:https://internai.org.cn 此外,真人效果卓绝的大模型 lofi.v2 也可用于生成真实场景下的字体。在使用 SDXL 大模型时,其分为 base+refiner 以及配套的 VAE 模型,base 用于文生图操作,refiner 用于细化生成的模型,VAE 用于调节图片效果和色彩。要在 webUI 中使用,需将秋叶启动器中 webUI 的版本升级到 1.5 以上,并将模型放入对应文件夹。
2024-11-12
类似堆友,吐司这样的国内外AI生图
以下是为您整理的类似堆友、吐司的国内外 AI 生图产品: 国内: 阿里堆友 AI 反应堆:图像生成类产品。 图怪兽:资源类,4 月访问量 48.3 万 Visit,相对 3 月变化 0.299 。 美图秀秀 Meitu:图像编辑类,4 月访问量 47.9 万 Visit,相对 3 月变化 0.061 。 AI 抠图 pixian.ai:图像编辑类,4 月访问量 44 万 Visit,相对 3 月变化 0.176 。 佐糖:图像编辑类,4 月访问量 43.3 万 Visit,相对 3 月变化 0.071 。 我图网:图像生成类,4 月访问量 41.8 万 Visit,相对 3 月变化 0.012 。 文心一格:图像生成类,4 月访问量 41.5 万 Visit,相对 3 月变化 0.086 。 标智客 Ai Logo:图像生成类,4 月访问量 37.8 万 Visit,相对 3 月变化 1 。 可灵:由快手团队开发,主要用于生成高质量的图像和视频,图像质量高,最初采用内测邀请制,现向所有用户开放,价格相对较高,重度用户年费最高可达几千元,临时或轻度使用有免费点数和较便宜包月选项。 通义万相:在中文理解和处理方面表现出色,可从多种艺术和图像风格中选择,生成图像质量高、细节丰富,操作界面简洁直观,用户友好度高,可与阿里其他产品和服务无缝整合,目前免费,每天签到获取灵感值,但存在一定局限性,如某些类型图像因国内监管要求无法生成,处理非中文语言或国际化内容可能不够出色,处理多元文化内容可能存在偏差。 国外:暂无相关具体产品信息。
2024-11-12
有没有免费的文生图
以下为您提供一些免费的文生图工具及相关信息: Stability AI 推出的基于 Discord 的媒体生成和编辑工具: 操作步骤: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 2. 进入 ARTISAN 频道,任意选择一个频道 3. 输入/dream 会提示您没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费 4. 输入/dream 提示词,这部分和 MJ 类似 5. 可选参数有五类: prompt:提示词,正常文字输入,必填项 negative_prompt:负面提示词,填写负面提示词,选填项 seed:种子值,可以自己填,选填项 aspect:长宽比,选填项 model:模型选择,SD3,Core 两种可选,选填项 Images:张数,1 4 张,选填项 完成后选择其中一张 另外,更多关于文生图的信息: 文字生成视频的 AI 产品: Pika:擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看这里: 延伸阅读: 协议、引用、致谢: 协议:Kolors(可图)权重对学术研究完全开放,如需商用请填写,避免将开源模型、代码及其衍生物用于任何可能对国家和社会造成危害的用途,或用于任何未经安全评估和备案的服务。需要注意,尽管模型在训练中我们尽力确保数据的合规性、准确性和安全性,但由于视觉生成模型存在生成多样性和可组合性等特点,以及生成模型受概率随机性因素的影响,模型无法保证输出内容的准确性和安全性,且模型易被误导。本项目不对因使用开源模型和代码而导致的任何数据安全问题、舆情风险或因模型被误导、滥用、传播、不当利用而产生的风险和责任承担任何法律责任。 引用:如果觉得我们的工作对您有帮助,欢迎引用! 致谢:感谢提供的强大中文语言模型。
2024-11-06
有没有文生图的api
目前市场上有许多文生图的工具,一些比较受欢迎的包括: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因其高质量的图像生成效果和用户友好的界面在创意设计人群中流行。 在 WaytoAGI 网站(https://www.waytoagi.com/category/104 ),可以查看更多文生图工具。 国产大模型中,智谱和文心等也可以实现文生图的功能。
2024-11-05
最好用的文生图工具
目前比较好用的文生图工具包括: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 此外,Kolors 也是一款表现不错的开源文生图模型。 您还可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。
2024-11-04
搭建个人知识库,请推荐的免费人工智能软件
以下为您推荐一些可用于搭建个人知识库的免费人工智能软件: 1. AnythingLLM:包含所有 Open WebUI 的能力,额外支持选择文本嵌入模型和向量数据库。安装地址:https://useanything.com/download 。安装完成后需进行配置,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。在 AnythingLLM 中可创建独有的 Workspace 与其他项目数据隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式会综合给出答案,Query 模式仅依靠文档数据给出答案),配置完成后可进行测试对话。 2. Coze 或 FastGPT 等工具可搭建知识库,但当下其 RAG 能力仅对问答场景友好,复杂企业级知识库场景可能需要专业团队,收费几万到几十万不等。若想使用专门搭建个人知识库的软件,可参考文章 ,忽略本地部署大模型环节,直接看其中推荐的软件。 此外,还有一些相关工具和方法: 用通义听悟整理录音笔记:https://tingwu.aliyun.com 用 React 实现选中即解释 定义提示语提取有用信息:https://memo.ac/zh/ 开源免费屏幕录制工具 OBS,下载地址:https://obsproject.com/ Mac 用 Downie,Windows 推荐 IDM 淘宝数码荔枝店购买 用 losslessCut 快速切块:https://github.com/mifi/losslesscut 希望这些信息对您有所帮助。
2024-11-11
有没有国内网络能打开的免费好用的美术类AI工具?
以下为您推荐国内网络能打开的免费好用的美术类 AI 工具: 1. 扣子 + ByteArtist 网址:https://www.coze.cn/home 优点:不需要翻墙,无收费,可以直接生成 注册:手机号、抖音号或飞书号 操作步骤:需要在 coze 的 bot 里面添加绘图插件 时间:5min 2. 无界 AI 网址:https://www.wujieai.cc/ 优点:国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用 希望这些工具能满足您的需求。
2024-11-11
免费制作ppt的ai工具有哪些
以下是一些免费制作 PPT 的 AI 工具: 1. 讯飞智文:由科大讯飞推出,利用其在语音识别和自然语言处理领域的技术优势,提供智能文本生成等功能。网址:http://zhiwen.xfyun.cn 2. Gamma:在线 PPT 制作网站,用户通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。网址:https://gamma.app/ 3. 美图 AI PPT:由“美图秀秀”开发团队推出,用户输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。网址:https://www.xdesign.com/ppt/ 4. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局等智能设计功能,包含互动元素和动画效果。网址:https://www.mindshow.fun/ 另外,推荐 2 篇市场分析的文章供您参考: 1. 《》 2. 《》 需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2024-11-10
国内免费的好用的AI有哪些
以下是一些国内免费且好用的 AI 产品: 1. Kimi 智能助手:是一个有着超大“内存”的智能助手,可以一口气读完二十万字的小说,还会上网冲浪,由 Moonshot AI 出品。不用科学上网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,也是目前对长文理解做得最好的 AI 产品。能一次搜索几十个数据来源,无广告,能定向指定搜索源(如小红书、学术搜索)。PC 端:https://kimi.moonshot.cn/?utm_campaign=TR_LgLmkEor&utm_content=&utm_medium=%E7%BD%91%E7%AB%99&utm_source=CH_tpOYmtV1&utm_term= ;移动端 Android/ios:https://kimi.volctrack.com/a/E3w3Q1xa 。 2. 文心一言:百度出品的 AI 对话产品,定位是智能伙伴,能写文案、想点子,又能陪你聊天、答疑解惑。 3. 通义千问:由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。 4. 可灵:由快手团队开发的 AI 应用,主要用于生成高质量的图像和视频,生成的图像质量非常高。最初采用内测邀请制,现在已向所有用户开放使用。但价格相对较高,对于重度用户,最高档的年费可能达到几千元人民币,若临时或轻度使用,有每日免费点数和 60 多元单月的最便宜包月选项。 5. 通义万相:作为国产 AI 工具,在中文理解和处理方面表现出色,用户可从多种艺术风格和图像风格中选择,生成的图像质量较高、细节丰富,操作界面简洁直观、用户友好度高,且能与阿里其他产品和服务无缝整合。重点是现在免费,每天签到获取灵感值即可。但为符合国内监管要求,某些类型的图像可能无法生成,在处理非中文语言或国际化内容方面可能不如一些国际 AI 图像生成工具出色,处理多元文化内容时可能存在偏差。 内容由 AI 大模型生成,请仔细甄别。
2024-11-10
用 Coze 免费打造自己的图像生成 AI 机器人
以下是用 Coze 免费打造自己的图像生成 AI 机器人的步骤: 1. 注册 Coze 账号 访问 Coze 官网,快速注册,开启智能之旅。 Coze 中文名扣子,字节跳动出品。 中文版:https://www.coze.cn/(支持大模型:kimi、云雀)——本次教程使用中文版 Coze。 英文版:https://coze.com/(支持大模型:chatgpt4) 产品定位:新一代 AI 原生应用开发服务平台,Nextgeneration AI chatbot building platform。 2. 创建你的机器人 登录 Coze,可使用抖音或手机号登陆,登陆后选择“创建 Bot”,然后起一个响亮的名字。 登录页面、首页、创建 Bot 时,工作空间选“个人空间”即可。 小技巧:“图标”AI 可以自动生成,先在“Bot 名称”那里用文字描述你想要的图标,图标生成满意后,再把“Bot 名称”改为简洁版名称。 此外,在实际体验中: 测试 AI Bot 时,可能会出现回答不完整的情况,如部分信息未给出,这是因为 Coze 国内版刚发布不久,有些官方和第三方插件的 API 调用和返回结果不太稳定。但官方会尽快解决。 成功的回答是根据提示词和插件+工作流的组合,结果非常详细。若加上自己的知识库甚至定制化使用数据库功能,AI Bot 的使用场景会更丰富。 国外版有免费的 GPT4 大模型使用,插件和工作流功能更丰富稳定,还有更多自定义插件和工作流功能,能更灵活定制 AI Bot。 作者演示上述步骤后发布的 AI Bot,其 ID 是:7333630516673167394,有兴趣可在 Coze 平台上搜索这个 ID 来体验。
2024-11-09
可以免费生成视频的ai
以下是一些可以免费生成视频的 AI 工具: Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 ETNA(国内):https://etna.7volcanoes.com/ 。Etna 是一款由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps。 Dreamina(国内内测,有免费额度):https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频、视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以。文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持多种尺寸,默认生成 3s 的视频。 可灵(免费):https://klingai.kuaishou.com/ 。支持文生视频、图生视频,支持图生视频首尾帧功能,提示词可使用中文。文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持多种尺寸,默认生成 5s 的视频。 Pika Labs:被网友评价为目前全球最好用的文本生成视频 AI。目前内测免费,生成服务托管在 discord 中。加入方式:在浏览器中打开链接 https://discord.gg/dmtmQVKEgt 点击加入邀请。在 generate 区生成,输入/create,在弹出的 prompt 文本框内输入描述即可生成视频,也可上传本地图片生成对应指令动态效果。对生成的视频不满意可再次生成优化效果。
2024-11-09
幻海映月字体设计文字生成图片
以下是关于幻海映月字体设计文字生成图片的相关内容: Ideogram 2.0 工具教程: 1. 生成图像设置:将魔法提示设置为“关闭”,使用模型 v2.0。 2. 字体版权问题:Ideogram 的 AI 在生成图像时并非使用真实字体,而是通过学习大量文字图像及其外观和风格来生成类似特定风格或字体的文字。 3. 字体生成错误处理: 多次重新生成提示,看是否得到想要的文本。 使用编辑器修改文本、添加或删除部分,然后重新混合图像。 将较长、较复杂的单词更改为较短的同义词。 上传包含所需文本的图像,作为重新混合创建图像的起点和合成源。 4. 版本选择:使用 0.2 或 1.0 版本可能会更稳定。
2024-11-11
用Coze创建AI,能够通过文字生成图片或者视频或者动画或者渲染效果
以下是使用 Coze 创建 AI 的相关信息: 1. 注册 Coze 账号: 访问 Coze 官网,快速注册,开启智能之旅。 Coze 中文名扣子,字节跳动出品。 中文版:https://www.coze.cn/(支持大模型:kimi、云雀)——本次教程使用中文版 Coze。 英文版:https://coze.com/(支持大模型:chatgpt4)。 产品定位:新一代 AI 原生应用开发服务平台,Nextgeneration AI chatbot building platform。 2. 创建机器人: 登录 Coze,可使用抖音或手机号登陆,登陆后选择“创建 Bot”,然后起一个响亮的名字。 工作空间选“个人空间”即可。 小技巧:“图标”AI 可以自动生成,先在“Bot 名称”那里用文字描述想要的图标,图标生成满意后,再把“Bot 名称”改为简洁版名称。 3. 制定任务的关键方法: 在开始设计和开发任何 AI Agent 之前,最关键的第一步是明确定义期望 AI 最终输出的结果。这包括详细描述期望获得的输出内容,如输出是文本、图像、音频还是其他形式的数据,输出的具体格式和结构是什么,确定输出内容的质量标准。 预估任务的可行性。 确定任务的执行形式。以 LearnAndRecord 的一篇文章为例,拆解其结构,基于此进行微调优化。值得注意的是,Coze 支持 Markdown 格式输出 AI 生成的内容,Markdown 作为轻量级文本标记语言,能够有效展示文本、图片、URL 链接和表格等多种内容形式。参照精读结构,评估任务的可行性,生成结果包括文字、图片(思维导图)、音频(原文音频)三类输出格式,前两者可直接用 Markdown 输出/嵌入,音频则需通过 URL 链接跳转外部网页收听。最后结合使用习惯,期望在输入一篇英文原文时,AI Agent 能够按模板要求,直接输出精读结果。
2024-11-09
哪些AI能够根据一段文字自动配图
以下是一些能够根据一段文字自动配图的 AI 工具和方法: 可以让 AI 分析文章内容,给出配图建议和关键词,然后利用这些信息在免费图库中快速找到合适的无版权图片。 有的网站,如 tome、gamma,配图是由 GenAI 根据页面内容生成的。 剪映具有图文成片功能,只需提供文案,就能自动配图配音。
2024-11-08
怎么文字转语音,用自己的音色
要实现文字转语音并使用自己的音色,以下是一些方法和相关信息: ChatTTS 增强版整合包:当文本内容很多时,可以勾选文本切割来处理,默认五十字符切割,还能将音频片段合并为一整段音频。切割的音频片段也支持增强处理。保存后的音频文件结构清晰,包括合成的一整段音频、增强处理后的整段音频、切分的音频片段等。该版本增加了批量处理功能,可上传按句换行格式的 TXT 文本。音色固定,可通过点击随机按钮多尝试找到满意音色,并将设置和音色种子保存到配置文件方便下次使用。 ElevenLabs 工具:能全自动将视频翻译成 29 种语言,更能克隆原视频里的声音来配音。 GPTSoVITS + BertVITS2:一开始可选不同音色,基于网络红人训练,音色与网络红人相像。若没有接近的音色,可自己训练,参考 WaytoAGI 的知识库: 。但实际使用中只改音色可能不够,如说话时的口头禅、重音、停顿等。
2024-11-06
我需要一个能写生成文生视频prompt的机器人,这个机器人只负责生产宠物做饭视频的文字prompt,请学习文生视频prompt写作技巧,并给我写一个这样的机器人
以下是关于文生视频 prompt 写作技巧及为您生成的一个宠物做饭视频的文字 prompt 示例: 文生视频 prompt 写作技巧: 1. 明确视觉样式:要具体描述视频的视觉基调和风格,比如是想要现实的、电影的、动画的还是超现实的。对美学的描述越具体,生成的效果就越接近期望。 2. 考虑视觉风格创意:如电影感要注重戏剧性照明、镜头光晕和高对比度;逼真风格要追求自然光、清晰细节和逼真角色;动画风格可使用卡通、3D 动画或 2D 动画等术语;艺术风格可用印象派、极简主义或抽象等形容词来指导艺术方向。 宠物做饭视频的文字 prompt 示例:“创建一个 2D 动画、色彩鲜艳的视频,一只可爱的猫咪在厨房里熟练地烹饪美味的鱼餐,画面具有温馨的灯光和可爱的卡通风格。”
2024-11-06
如何编辑更改图片中的文字
以下是一些关于编辑更改图片中文字的方法和示例: DALL·E 推出了编辑功能,例如可以添加耳机、去掉错误文字、添加正确文字、修改鹿角等。但对于添加较多区域小的文字识别可能不太好。 Ideogram 2.0 在生成图像时,AI 基于学习内容创造文字,可能存在字体版权、字体生成错误等问题。纠正方式包括多次生成提示、使用编辑器修改文本、更换同义词、上传包含所需文本的图像等。 Midjourney 有新的图片编辑器功能,如增加主体数量(以狐狸为例,涂抹空白区域并修改关键词)、轻松扩图(自由操作图片并点击生成)、扩图并增加主体(缩放原图、涂抹空白区域并修改关键词),还能添加文字。进入 Midjourney 图片编辑器的步骤为:打开 MJ 官网(https://www.midjourney.com),选择要修改的图片,点击图片后再点击右下角的 Editor 按钮。需要注意的是,新生成的主体须与原图一致,且部分操作目前 discord 暂不支持。
2024-11-05
我有一份PPT,我想对这个PPT进行图像设计等美观化处理,怎么来做?使用哪个工具好?
以下为您介绍一些可用于对 PPT 进行图像设计等美观化处理的工具及相关信息: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 在对 PPT 进行排版时,工具的选择可根据个人顺手程度决定,对于打工人来说,PPT 是较为熟练的选择。关于尺寸问题,如果想要打印,4:3 的比例比较适合童书绘本的比例,出图时可按此比例,文字可直接排版到画面上;若出图为 16:9 横板,排版时 4:3 可把文字放在图片下面。若要发小红书或者小绿书,竖版更合适,比例选 3:4,出图也选竖版。制作 H5 时,出图选竖版,比例选 9:16。所有排版尺寸在 PPT 里都可以选。另外,PPT 里的删除背景功能对于基础抠图很有用。用 PPT 另存为图片时,直接选 jpg 或 png 格式会降低图片清晰度,可先另存为“增强型 Windows 源文件”格式,再用画图软件打开另存为 JPG 以得到高清图。
2024-11-12
可以调用不同大预言模型的整合工具推荐
以下是为您推荐的可以调用不同大语言模型的整合工具: 1. Poe:由 Quora 开发,有 APP 版本,支持跨端使用。集成了 Chat GPT、GPT4、Claude+、Claude、Dragonfly 等模型,同时支持用户自建 Chatbot。不同语言模型回复效果有差异,适合需要调用多种大语言模型的用户。访问地址: 。Dragonfly 擅长给出较短的回答,并擅长在输入中给出示例时遵循指示。Claude 更擅长创造性回复,配合 Poe 中的提问引导,非常适合在查阅资料时使用,有时能够给出超越直接使用 Chat GPT 时的体验(但和 Chat GPT 一样,Claude 也时常会给出一些错误回复,一些问题可以尝试在两个模型中都问一遍提升信息准确性)。此外支持分享用户和模型的对话内容,但 GPT4、Claude+产品需要付费订阅使用。 2. 国内的一些模型,如智谱和文心,在文生图方面有一定能力。 另外,大模型工具可根据自身条件准备,推荐顺序为:1. chatGPT 4.0 2. kimichat 3. 智谱清言 4 。
2024-11-12
有哪些工具直接可以调用国外的多个LLM
以下是一些关于能够调用国外多个 LLM 的相关信息: 开源项目作者 ailm 提出一种仅使用提示词工程和精巧的代码设计,让 LLM 获得稳定的 tool calling 能力,使用多个不具备该功能的 LLM 进行实验,成功率达 100%,工作基于 comfyui 开发,适合无代码基础的人员复现和修改。 在高级提示词工程领域,工具、连接器和技能的整合能显著增强 LLM 的能力。工具是指 LLM 可利用的外部功能或服务,扩展任务范围;连接器是 LLM 与外部工具或服务的接口,管理数据交换和通信;技能是 LLM 可执行的专门功能。 目前开源模型与专有产品存在差距但在缩小,如 Meta 的 LLaMa 模型引发一系列变体。当开源 LLM 达到一定准确度水平时,预计会有大量实验等。开发人员对 LLM 操作工具的研究尚不深入,一些工具如缓存(基于 Redis)、Weights & Biases、MLflow、PromptLayer、Helicone 等得到较广泛使用,还有新工具用于验证 LLM 输出或检测攻击。多数操作工具鼓励使用自身的 Python 客户端进行 LLM 调用。
2024-11-12
集成LLM的工具
以下是关于集成 LLM 的工具的相关内容: 一、“手臂和腿部”:赋予模型使用工具的能力 1. 从知识挖掘转向行动导向,增加模型使用工具的能力,有望在消费者和企业领域实现一系列用例。 对于消费者,LLMs 可能给出菜谱建议并订购食材,或推荐早午餐地点并预订餐桌。 在企业领域,创始人可接入 LLMs 使应用程序更易用,如在 Salesforce 等应用中,用户能用自然语言更新,模型自动更改,减少维护 CRM 所需时间。 2. LLM 虽对常见系统有复杂理解能力,但无法执行提取的信息。不过,公司在不断改善其使用工具的能力。 老牌公司如必应、谷歌和初创公司如 Perplexity、You.com 推出搜索 API。 AI21 Labs 推出 JurassicX,解决独立 LLMs 缺陷。 OpenAI 推出 ChatGPT 插件测试版,允许与多种工具交互,在 GPT3.5 和 GPT4 中引入函数调用,允许开发者将 GPT 能力与外部工具链接。 二、无需微调,仅用提示词工程就能让 LLM 获得 tool calling 的功能 1. 提示词工程主要由提示词注入和工具结果回传两部分代码组成。 2. 提示词注入用于将工具信息及使用工具的提示词添加到系统提示中,包含 TOOL_EAXMPLE、tools_instructions、REUTRN_FORMAT 三个部分。 TOOL_EAXMPLE 提示 LLM 如何理解和使用工具,编写时用无关紧要工具作示例避免混淆。 tools_instructions 是通用工具字典转换成 LLM 可读的工具列表,可动态调整。 REUTRN_FORMAT 定义调用 API 格式。 3. 工具结果回传阶段利用正则表达式抓取输出中的“tool”和“parameters”参数,对于 interpreter 工具使用另一种正则表达式提取 LLM 输出的代码,提高使用成功率。通过识别 LLM 返回的调用工具字典,提取对应值传入工具函数,将结果以 observation 角色返回给 LLM,对于不接受某些角色的 LLM 接口,可改为回传给 user 角色。通过以上提示词工程,可让无 tool calling 能力的 LLM 获得稳定的该能力。
2024-11-12
利用gpt-4模型的AI工具有哪些
以下是一些利用 GPT4 模型的 AI 工具: 1. Kickresume 的 AI 简历写作器:使用 GPT4 语言模型自动生成简历,能为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 2. Rezi:受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的各个方面,包括写作、编辑、格式化和优化。 3. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 。您可以根据自己的需要选择最适合的工具。 此外,在生成式人工智能领域,GPT4 有以下突破点: 1. 赋予模型使用工具的能力,如 OpenAI 推出的 ChatGPT 插件测试版,允许与多种工具交互。 2. 在计划和解决问题方面具有一定能力,能通过玩游戏或模拟环境快速学习和从经验中学习。 3. 在许多任务上达到人类水平的表现,对人类的理解有所提升。 4. 但也存在一些限制,如架构中的自回归特性导致缺乏规划能力等。
2024-11-12
用哪个AI工具可以做PPT
以下是一些可以用于制作 PPT 的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 此外,还有一些用户在实践中使用的组合,如 Claude + Gamma.app,以及 GPT4、WPS AI 和 chatPPT 等。
2024-11-11