直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

国内有哪些支持视频生成的产品

回答

以下是国内一些支持视频生成的产品:

  1. 可灵:在视频生成领域表现出色,具有卓越的生成质量、出色的生成速度和良好的国内可访问性。其生成的视频在画面清晰度、连贯性和内容丰富性上可与国际顶级模型媲美,处理效率高,为国内用户提供便捷稳定的使用体验。
  2. Hidreamai:国内产品,有免费额度。支持文生视频、图生视频,提示词使用中文、英文均可,文生视频支持多种控制,可生成 5 秒和 15 秒的视频。网址:https://hidreamai.com/#/AiVideo
  3. ETNA:由七火山科技开发的文生视频 AI 模型,能根据简短文本描述生成相应视频内容,生成视频长度 8 - 15 秒,画质可达 4K,最高 3840*2160,画面细腻逼真,帧率 60fps,支持中文和时空理解。网址:https://etna.7volcanoes.com/

此外,还有 Pika、SVD、Runway、Kaiber、Sora 等工具也可实现文字生成视频的功能,但并非国内产品。更多相关网站可查看:https://www.waytoagi.com/category/38 。需注意,以上内容由 AI 大模型生成,请仔细甄别。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

问:文字生成视频的 AI 产品有哪些?

[title]问:文字生成视频的AI产品有哪些?"文生视频"通常指的是使用人工智能技术将文本内容转换成视频的服务。以下是一些国内外提供此类功能的产品推荐:1.Pika:这是一款非常出色的文本生成视频AI工具,擅长动画制作,并支持视频编辑。2.SVD:如果你熟悉Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由Stability AI开源的video model。3.Runway:这是一款老牌AI视频生成工具,提供实时涂抹修改视频的功能,不过需要注意的是,Runway是收费的。4.Kaiber:这是一款视频转视频AI,能够将原视频转换成各种风格的视频。5.Sora:由OpenAI开发,可以生成长达1分钟以上的视频。以上工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。另外,更多的文生视频的网站可以查看这里:[https://www.waytoagi.com/category/38](https://www.waytoagi.com/category/38)内容由AI大模型生成,请仔细甄别。

给小白的AI产品推荐

AI视频生成领域,有一款国产应用正在崭露头角,引起了业内外的广泛关注——这就是可灵。如果您曾活跃于AI交流群,或者有幸在可灵刚推出时就体验过它的视频生成功能,您就会深刻感受到可灵在这一领域的强悍实力。事实上,可灵生成的视频质量已经达到了一个令人惊叹的水平,足以与国际一些顶尖模型相媲美。可灵的优势主要体现在三个关键方面:首先,是其卓越的视频生成质量。可灵生成的视频无论是在画面清晰度、连贯性还是内容丰富性上,都达到了与国际顶级模型相当的水准。这种高质量的输出不仅满足了普通用户的需求,也为专业创作者提供了强大的工具支持。其次,可灵在生成速度上表现出色。相比国外同类产品,可灵的处理效率更高,能够更快地完成视频生成任务。在当今快节奏的内容创作环境中,这种高效率无疑是一个巨大的优势,能够大大提升用户的工作效率。最后,对于国内用户来说,可灵的可访问性是其一大亮点。相较于一些可能需要特殊访问方式的国外产品,可灵为国内用户提供了更加便捷、稳定的使用体验。这种便利性不仅降低了使用门槛,也为更多人探索AI视频生成技术提供了机会。基于这些显著优势,在国内文生视频领域,我目前毫不犹豫地首推可灵。它为国内用户提供了一个高质量、高效率的视频生成解决方案,满足了从个人创作者到专业团队的各种需求。除了价格因素外,目前可灵在功能和性能上几乎没有太多值得批评的地方。它代表了国内AI视频生成技术的最高水平,为用户提供了优质的服务体验。可灵的出现不仅填补了国内在高端AI视频生成领域的空白,也为整个行业树立了新的标杆。

小歪:AI视频工具合集

https://hidreamai.com/#/AiVideo支持文生视频、图生视频提示词使用中文、英文都可以文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成5s和15s的视频相关界面截图:[heading3]ETNA(国内)[content]https://etna.7volcanoes.com/Etna是一款由七火山科技开发的文生视频AI模型,它可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在8~15秒,画质可达到4K,最高3840*2160,画面细腻逼真,帧率60fps。文生视频,支持中文,时空理解

其他人在问
大模型可以修复老旧的分辨率低的视频吗
大模型在修复老旧低分辨率视频方面是可行的,但具体效果因模型和方法而异。 例如,使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型、StableSR 模块和 VQVAE 等,通过不同的放大方法进行测试。如“Ultimate SD upscale”脚本放大,重绘幅度不同效果有别,重绘幅度大可能导致人物失真。“后期处理”的放大方法能使眼神更锐利,但对模糊的头发改善有限。而 StableSR 的放大则需要进行相应的模型和参数调整。 另外,像 Sora 这样的大型视觉模型,能够在原始尺寸上训练、理解和生成视频及图像。它可以处理不同格式和分辨率的视觉数据,保持原始宽高比,改善生成视频的构图和框架。其基础模型用于低分辨率视频生成,通过级联扩散模型细化提高分辨率,采用 3D UNet 架构,结合多种技术和方法,能生成高保真度且具有可控性的视频。
2024-11-17
如何给不清晰的视频增加清晰度?
以下是给不清晰的视频增加清晰度的一些方法: 1. 使用转绘教程(Ebsynth Utility): 处理素材:一般无需特别处理,但若片子太长或开头结尾有特效,可打开剪影导入视频。将素材拖入轨道,若视频开头有模糊部分,拖动时间轴到正常部分,点击分割按钮或使用快捷键 Ctrl+B 进行分割(MAC 用户需另行查看),然后删除模糊片段。导出新视频时,名称最好使用英文。 注意事项: 校准:下载的视频若比例不标准,需在剪影中处理,否则 SD 图片绘制可能报错。 视频缩小:对于 4K 等大分辨率视频,SD 最大只能完成 20482048 的绘制,且制作时间长。 对于分辨率很模糊的视频,可先提升分辨率再绘制,若仍不行则放弃。提升分辨率可使用插件(TopazVideoAI)。 2. 利用 FMANet:FMANet 能将模糊低分辨率视频恢复为清晰高分辨率,可解决快速移动物体或摄像机引起的视频模糊,智能理解物体运动,改善画质,去除模糊。相关链接:http://kaistviclab.github.io/fmanetsite/ 、https://x.com/xiaohuggg/status/1746160750610075689?s=20
2024-11-17
什么软件可以自动给视频翻译并加字幕
以下是一些可以自动给视频翻译并加字幕的软件: 1. Opusclip:利用长视频剪成短视频。网址:https://www.opus.pro/ 2. Raskai:短视频素材直接翻译至多语种。网址:https://zh.rask.ai/ 3. invideoAI:输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频。网址:https://invideo.io/make/aivideogenerator/ 4. descript:屏幕/播客录制>PPT 方式做视频。 5. veed.io:自动翻译自动字幕。网址:https://www.veed.io/ 6. Reccloud:免费的在线 AI 字幕生成工具,可直接上传视频精准识别,能对识别的字幕进行翻译,自动生成双语字幕。声称已处理 1.2 亿+视频,识别准确率接近 100%。 7. 绘影字幕:一站式专业视频自动字幕编辑器,提供简单、准确、快速的字幕制作和翻译服务。支持 95 种语言,准确率高达 98%,可自定义视频字幕样式。 8. Arctime:对视频语音自动识别并转换为字幕,甚至支持自动打轴。支持 Windows 和 Linux 等主流平台,支持 SRT 和 ASS 等字幕功能。 9. 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 以上工具各有特点,您可以根据自己的需求选择最适合您的视频自动字幕工具。请注意,部分内容由 AI 大模型生成,请仔细甄别。
2024-11-17
图片 视频处理 应用推荐
以下是为您推荐的一些图片和视频处理应用: Runway:具有文生视频、Prompt+图像生成视频、无 Prompt 直接图片转视频等功能。支持 motion 控制和运镜调节,还提供 30 多项图片、视频处理能力,如 Inpainting 视频修复、Motion Tracking 视频主体跟随运动、Remove Any Background 删除视频元素/背景、3D Texture 生成 3D 纹理等。近期控制台上线了 Watch 模块,可查看官方精选的创意案例。 AiLogoArt:将您的 Logo 融入 AI 生成的图象中,能在几分钟内获得专业品牌图片。 PlainScribe:可将大文件转录为完美的文本,上传文件处理完成后可搜索文本或下载 CSV 文件,适用于各种大文件,有灵活的按需付费模式。 RIX:面向开发者的人工智能搜索引擎,可使用 Web 搜索模式查找最新信息或切换到 GPTknowledge 模式获得预先训练的知识即时答案,还能通过流行网站快捷方式简化搜索。 Magic Clips:能让人工智能挑选出录制的最佳时刻,并转化为适合媒体的短视频片段,可添加字幕。 以下是一些从事相关工作的人员: yangzec:学习多模态 AI 的使用和开发应用 凯叔 AI:插画设计 清墨.SALEX:日常工作 above:批量作图 ehhe:绘画,视频,人像,电商背景图 kone:AI 商业应用 xman:自媒体创作 Alan:绘画和视频处理 在野:视频创作 tang:照片处理等 阿鲁:生产 大大大松树:视频工作流 BigPeng:好玩 冻奶味:工作+娱乐休闲 Lily:视频和电商,写真 tim:能用在生产中 木兰:广告推广素材制作 吴:电商 马化腾:Ai 绘画 蔡徐坤:Ai 视频,Ai 绘画,Ai 音乐 吴林林:爱好,家人做写真 初尘:文生视频,做自媒体 ning:工作流
2024-11-16
做视频需要那些AI工具
以下是一些做视频可能用到的 AI 工具及相关流程: 工具方面: Pika Pixverse Runway SVD 流程方面: 1. 故事构思:确定您要讲述的故事,可以是原创(基于自身或周围人的经历、梦境、想象等),也可以是改编(经典 IP、名著、新闻、二创等)。多与他人讨论故事,不断修改完善。 2. 剧本写作:短片创作篇幅较小,情节和角色相对简单,可从自身经历或短篇故事改编入手。不断实践并总结经验。 3. 图像生成:使用 AI 工具(如 Stable Diffusion 或 Midjourney)根据小说内容生成角色和场景的视觉描述,并创建相应图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要重新编辑某些场景或调整音频。 9. 输出与分享:完成编辑后,输出最终视频并在所需平台分享。 请注意,具体的操作步骤和所需工具可能因项目需求和个人偏好有所不同。同时,AI 工具的可用性和功能可能会变化,建议直接访问工具网址获取最新信息和使用指南。
2024-11-16
AI制作视频的案例
以下是一些 AI 制作视频的案例和相关信息: 1. 把小说做成视频的制作流程: 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 2. 制作视频的工具推荐: 最佳动画工具:用于在视频中为人脸制作动画的 最佳语音克隆: 现在,生成一个完全由人工智能生成的角色的视频,阅读完全由人工智能编写的脚本,用人工智能制作的声音说话,由人工智能制作动画,这简直是微不足道的。但要注意深度伪造是一个巨大的问题,这些系统需要合乎道德地使用。 最近还发布了第一个商用文本到视频工具 Runway v2。它创建了 4 秒的短剪辑,更像是对未来发展的展示,但如果你想了解这个领域的未来发展,值得一看。 3. 开箱即用的解决方案 Invideo AI 脚本生成+视频匹配: 产品特点:能够在数十秒时间内轻松实现 Prompt 转视频,并且支持通过编辑器进行后期更改。未来可以使用这类产品快速、低成本地进行视频画面制作。官网地址:https://ai.invideo.io 功能介绍:在官方教程中,建议对视频平台、主旨内容、视频长度、语气、脚本风格进行描述。上传视频后,还会再次询问视频内容倾向。如果对生成的视频不满意,可以重新选择内容倾向进行编辑,也可以修改脚本、搜索并替换视频片段(区别于 Pika labs、Runway 的 AI 生成视频,Invideo 的原理是 AI 生成脚本并匹配视频素材)。在视频生成后,仍可以通过 Prompt 修改视频内容,免费账户无法去除视频上的水印。 实践案例:输入 Prompt“K 公司刚研制出了一款新品乳液,采用了天然草本精华,使用后肤色洁白透亮,并且不再担心冬天气候干燥带来的皮肤干裂困扰,请帮这款新品制作一个 30s 的宣传片”,选择 Youtube 平台非常快速地生成了该视频,标题为“Embrace Winter with K's Herbal Emulsion 用 K's 草本乳液拥抱冬天”,实际视频为 27s。
2024-11-15
ai生成配图
以下是关于 AI 生成配图及相关内容的信息: 如果您想用 AI 把小说做成视频,大致的制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 另外,关于 Runway 生成 AI 动画,可以使用图片+文字描述功能,将 MJ 生成的图片增加对应的动态描述,输入 Runway,同时增加镜头变换的设置(具体教程看)。悦音 AI 配音具有旁白质感,如磁性浑厚、大片质感、娓娓道来。
2024-11-17
用AI生成动画的教程
以下是用 AI 生成动画的一些教程: 1. 端午节动态视频: 可以使用即梦或 runway 等工具。如果要字不动,可以先在剪映里添加文字 logo 素材。 先什么关键词都不写,如果效果不满意,再添加关键词。 将视频放入剪映,放上 PNG 透明底图后导出。 2. Runway 生成 AI 动画: 使用图片+文字描述功能,将 MJ 生成的图片增加对应的动态描述,输入 Runway,同时增加镜头变换的设置。具体教程可查看。 3. 利用 AI 批量生成、模仿和复刻《小林漫画》(内含 coze 搭建视频教程): 作者景淮会带着大家试着搭建一个扣子(Coze)工作流来直接生成文字和图片。本文会按照需求分析、扣子搭建、扣子使用链接分享、批量生产图片、总结的顺序进行。
2024-11-17
AI 语音生成
以下是一些与 AI 语音生成相关的信息: 人工智能音频初创公司: :将书面内容转化为引人入胜的音频,并实现无缝分发。 :提供专业音频、语音、声音和音乐的扩展服务。 (被 Spotify 收购):提供完全表达的 AI 生成语音,带来引人入胜的逼真表演。 :利用合成媒体生成和检测,带来无限可能。 :一键使您的内容多语言化,触及更多人群。 :生成听起来真实的 AI 声音。 :为游戏、电影和元宇宙提供 AI 语音演员。 :为内容创作者提供语音克隆服务。 :超逼真的文本转语音引擎。 :使用单一 AI 驱动的 API 进行音频转录和理解。 :听起来像真人的新声音。 :从真实人的声音创建逼真的合成语音的文本转语音技术。 :生成听起来完全像你的音频内容。 游戏开发中的 AI 语音生成工具: Coqui Studio:https://coqui.ai Bark:https://github.com/sunoai/bark Replica Studios:https://replicastudios.com 生成式 AI 在游戏领域的机会: 许多创业公司正在尝试创造人工智能生成的音乐,如 Soundful、Musico、Harmonai、Infinite Album 和 Aiva。 对话&语音方面,很多公司试图为游戏中的人物创造逼真的声音,包括 Sonantic、Coqui、Replica Studios、Resemble.ai、Readspeaker.ai 等。 即时对话生成,角色可以对玩家的行为做出充分反应。 角色扮演,使用与玩家的化身相匹配的生成的声音保持幻想。 控制音效,可控制声音的细微差别。 本地化,对话可翻译成任何语言并以同样的声音说话,如 Deepdub 专注于这个细分市场。
2024-11-17
什么工具/模型/API 可以根据宠物照片生成数字宠物 可以有简单的活动。
以下是一个可以根据宠物照片生成数字宠物并具有简单活动的工具/模型/API: 出门问问 Mobvoi 的照片数字人工作流及语音合成(TTS)API。 出门问问是一家以生成式 AI 和语音交互为核心的人工智能公司,为全球多个国家提供面向创作者的 AIGC 工具、AI 政企服务,以及 AI 智能硬件。致力于打造国际领先的通用大模型,通过 AI 技术、产品及商业化三位一体发展,致力成为全球 AI CoPilot 的引领者。 在 ComfyUI 全球领导力峰会上,特意搭建了数字人 workflow(照片数字人驱动),仅需上传一张照片,输入一段文字或者上传一段音频,就可以生成短视频让“照片开口说话”。本次活动特意提供了免费 api 额度及操作指南给大家进行体验。以下是一些不同风格的照片驱动效果展示:
2024-11-16
我想要让ai生成svg代码,如何保证其生成质量
目前知识库中没有关于如何保证让 AI 生成 SVG 代码质量的相关内容。但一般来说,要保证 AI 生成 SVG 代码的质量,可以从以下几个方面考虑: 1. 清晰明确地向 AI 描述您的需求,包括图形的特征、尺寸、颜色、线条样式等具体要求。 2. 提供足够的示例或参考资料,让 AI 更好地理解您期望的代码风格和质量标准。 3. 对生成的代码进行多次测试和验证,检查其在不同场景下的显示效果和兼容性。 4. 尝试使用不同的 AI 模型或工具,并比较它们生成的 SVG 代码质量,选择最适合您需求的。
2024-11-15
我想要让ai生成svg图片,如何保证其生成质量
要保证 AI 生成 SVG 图片的质量,您可以参考以下方法: 在使用 AI 生成图片时,可能会遇到即使输入相同关键词,生成的图片仍有很强随机性的情况。为了让生成的图片更加可控,可以利用 seed 参数进行反向生成。 首先,从官方文档中了解 seed 参数的作用:Midjourney 会用一个种子号来绘图,把这个种子作为生成初始图像的起点。种子号为每张图随机生成,但可以使用 Seed 或 same eseed 参数指定。使用相同的种子号和提示符将产生类似的结尾图片。详细参数可查看官方文档: 默认情况下,种子是随机给定的。若想要获得比较相似的图,需要将 seed 固定下来。简单来说,使用时在关键词后添加 seed 参数即可,具体数字在 0–4294967295 范围内均可。例如:caiyunyiueji is a cute sports anime girl,style by Miyazaki Hayao,emoji,expression sheet,8k seed 8888 这样就能保证每次生成的都是相同的图。此外,还可以反向利用这个特性对已经确定的效果图进行微调。比如当发现有一张图已比较接近目标,还需要一些微调时,可以利用确定图片的 seed,在此基础上添加新的关键词来实现。
2024-11-15
售后技术支持的AI解决方案
以下是为您提供的售后技术支持的 AI 解决方案: 在汽车售后场景中,主要存在以下问题: 1. 服务顾问缺少专业知识,无法提前协助车主评估车辆问题,并反馈标准化解决方案。 2. 维修技师在车辆检查和车辆故障分析方面依赖经验水平,缺少辅助分析的工具和直观的辅助指引。 3. 维修方案由技术支持人工编写,输出标准无法保障。 针对这些问题,AI 解决方案具有以下功能: 1. 解答问题:当用户提出问题,它像专业的售后顾问,通过询问细节给出初步判断,涵盖问题原因、维修方向、价格与时间预估。然后转变为技术维护人员角色,分析问题原因,列出具体检查步骤,等待工程师反馈结果后,给出精准解决方案及操作视频。 2. 文档输出:问题解决后,生成维修报告给用户,以及案例归档文档,并将其存入 AI 知识库,丰富知识库内容,方便后续查询和提供更专业的回答。 3. 智能录入:AI 知识库功能强大,不仅支持单独文本录入还支持链接录入。通过识别一篇文章,能智能解析分解出多个知识点并录入知识库,对归档文档的解析录入进一步丰富了知识库。 此外,还有以下 AI 产品案例和投稿与工作场景相关: 1. 销售:定制销售解决方案,涉及企业产品和服务内容、客户需求和参数、营销方案和推广策略、数据处理和模型训练、客户满意度和营销效率、往期营销方案。 2. 客服:定制客服话术,包含产品知识、使用方法、售后服务、售后维修、支付方式、支付流程、产品购买、产品配送、客户投诉、客户建议、政策法规、使用注意事项、客服身份等关键词库。 3. HR:团队绩效管理,根据团队和个人的绩效的往期数据,分析员工绩效排名,输出绩效考评和迭代改进建议。 4. HR:面试工具,开发了一个使用 GPT4 技术的实时转录工具,帮助求职者在面试中生成完美的回答。 5. 科学:研制采摘机器人,荷兰代尔夫特大学和瑞士洛桑联邦理工学院(EPFL)科学家借助 ChatGPT 设计并研制出了一款番茄收割机器人。
2024-10-29
deepseek支持function calling,在dify的agent的prompt里要如何写才能调用工具。我说的是如何写提示词,才能让deepseek通过Function Calling调用工具。
要在 Dify 的 agent 的 prompt 里让 DeepSeek 通过 Function Calling 调用工具,您可以参考以下内容: 1. 提示词工程主要由提示词注入和工具结果回传两部分代码组成。 提示词注入:将工具信息及使用工具的提示词添加到系统提示中。INSTRUCTION 包含 TOOL_EAXMPLE、tools_instructions、REUTRN_FORMAT 三个部分。TOOL_EAXMPLE 用于提示 LLM 如何理解和使用工具,编写时注意用无关紧要的工具作示例避免混淆。tools_instructions 是将通用工具字典转换成 LLM 可读的工具列表,可动态调整。REUTRN_FORMAT 定义调用 API 的格式。 工具结果回传:利用正则表达式抓取输出中的“tool”和“parameters”参数。对于 interpreter 工具,使用另一种正则表达式提取 LLM 输出的代码。通过识别 LLM 返回的调用工具的字典,提取对应值传入工具函数,将结果以 observation 角色返回给 LLM,对于不接受该角色的 LLM 接口,可改为回传给 user 角色。 2. 当模型判断需要调用工具函数时,检测到返回的 json 里 function_call 字段不为空,则执行异步函数调用,采用回调方式获取函数返回结果。通过判断返回的 functionCall 的名称执行不同函数并返回结果。 3. 在大模型请求中,最大的两个变量是 Messages 和 Tools。Messages 里放 sys prompt、memory、user query;Tools 里放能力的 Json Scheme,两者组合形成整个完全的 Prompt。Agent 应用开发的本质是动态 Prompt 拼接,通过工程化手段将业务需求转述成新的 prompt。短期记忆在 messages 里的历史 QA 对,长期记忆是 summary 之后的文本再塞回 system prompt。RAG 是向量相似性检索,可放在 system prompt 里或通过 tools 触发检索。Action 是触发 tool_calls 标记进入请求循环,拿模型生成的请求参数进行 API request,再把结果返回给大模型交互,没有 tool_calls 标记则循环结束。Multi Agents 是更换 system prompt 和 tools。
2024-10-24
deepseek支持function calling,在dify的agent的prompt里要如何写才能调用工具
在 Dify 的 agent 的 prompt 中实现调用工具的方法如下: 1. 提示词注入阶段: INSTRUCTION 为注入到系统提示中的字符串,包含 TOOL_EAXMPLE、tools_instructions、REUTRN_FORMAT 三个部分。 TOOL_EAXMPLE 用于提示 LLM 如何理解和使用工具,编写时应使用无关紧要的工具作为示例,避免 LLM 混淆。 tools_instructions 是将通用的工具字典转换成 LLM 可读的工具列表,实际使用时可动态调整。 REUTRN_FORMAT 定义了调用 API 的格式。 2. 工具结果回传阶段: 利用正则表达式抓取输出中的“tool”和“parameters”参数。 对于 interpreter 工具,使用另一种正则表达式提取 LLM 输出的代码,提高使用成功率。 通过识别 LLM 返回的调用工具的字典,提取对应的值,传入相应的工具函数,将工具返回的结果以 observation 的角色返回给 LLM。对于不接受该角色的 LLM 接口,可改为回传给 user 角色。 此外,当模型判断需要调用工具函数时,即检测到返回的 json 里面 function_call 字段不为空,则执行异步函数调用,可通过判断返回的 functionCall 的名称来执行不同的函数并返回结果。 在提升可控性方面,有以下建议: 1. 放弃 JSON mode,虽然模型能力提升能输出 JSON,但仍会出错,且不能保证 100%正确,而模型厂家对 Function Calling 有微调优化。 2. 降低 System prompt 依赖,化繁为简,能在 Tools 里写的东西尽量写在里面。 3. API Response 增强 Prompt,这一步的准确率很高,可增加给大模型的约束和提示。 4. 尽量让模型做选择,而不是填空,减少 token 输出,提高速度和准确率。 5. 利用 Tools 来做 Route,构建 Multi Agent,术业有专攻。
2024-10-24
deepseek支持function calling,prompt里要如何写才能调用工具。
要在 DeepSeek 中通过提示词实现工具调用,主要通过以下提示词工程实现: 1. 实现原理: 提示词工程主要由提示词注入和工具结果回传两部分代码组成。提示词注入将工具信息及使用提示词添加到系统提示中,工具结果回传则解析工具调用的输出,并将返回内容嵌入 LLM。 2. 提示词注入阶段: INSTRUCTION 为注入到系统提示中的字符串,包含 TOOL_EAXMPLE、tools_instructions、REUTRN_FORMAT 三个部分。TOOL_EAXMPLE 用于提示 LLM 理解和使用工具,编写时应使用无关紧要的工具作示例避免混淆。tools_instructions 是将通用工具字典转换为 LLM 可读的工具列表,实际使用时可动态调整。REUTRN_FORMAT 定义了调用 API 的格式。 3. 工具结果回传阶段: 利用正则表达式抓取输出中的“tool”和“parameters”参数。对于 interpreter 工具,使用另一种正则表达式提取 LLM 输出的代码以提高成功率。通过识别 LLM 返回的调用工具字典,提取对应值传入工具函数,将结果以 observation 角色返回给 LLM,对于不接受该角色的 LLM 接口,可改为回传给 user 角色。 在游戏实操中,当模型判断需要调用工具函数时(检测到返回的 json 里 function_call 字段不为空),执行异步函数调用,采用回调方式获取函数返回结果,通过判断返回的 functionCall 名称执行不同函数并返回结果。 对于 ChatGPT,为让其返回符合要求的 JSON 格式,prompt 的定制尤为重要和复杂。OpenAI 发布函数调用及其他 API 更新后,开发人员可向 gpt40613 和 gpt3.5turbo0613 描述函数,让模型智能输出包含调用函数所需参数的 JSON 对象。本地可根据 GPT 返回的函数名、参数进行数据查询,可采用函数查询或 SQL 查询,根据实际业务需求选择,使 AI 输出更可控。
2024-10-24
你知道有支持个性化训练的大预言模型么
以下是一些支持个性化训练的大语言模型: 1. Character.ai:更注重人格属性,试图满足社交、情感、陪伴等需求,与 ChatGPT 侧重不同,后者注重提高效率和解放生产力。 2. Midjourney:今天发布了模型个性化 Personalization 或 'p'的早期测试版本。模型个性化会学习用户的喜好,以便更可能用用户的口味来填补空白。其要求包括目前从成对排名中的投票和喜欢的探索页面上的图像中学习,需要大约 200 个成对排名/喜欢才能生效。使用时只需在提示后输入 'p',或使用提示栏中的设置按钮为所有提示启用个性化功能,还可以使用 's 100'控制个性化效果的强度。但需注意个性化目前不是一个稳定的功能,会随着进行更多的成对排名而变化,且可能会在接下来的几周内推出算法更新。
2024-10-18
AI在中小学教育中能够提供的支持
AI 在中小学教育中能够提供以下支持: 1. 辅助学生完成课程和任务:可控地引导学生,将部分课程和任务借助 AI 来完成。 2. 培养学生能力:限制部分课程的 AI 使用,以培养学生独立思考和解决问题的能力。 3. 帮助获取信息和学习:可以要求 AI 解释概念,用于自学学习,但要注意对关键数据根据其他来源仔细检查。 4. 协助教师工作:帮助教师节省时间和提高生产力,如备课。 5. 个性化学习计划:分析学生表现,根据知识差距和个人学习风格创建定制的学习路径。 6. 课程开发与学习沉浸:生成图像、文本和视频,转化为补充教育材料、作业和练习题,提供虚拟学习场景。 7. 社会互动与沟通:与新的 AI 工具结合,为学生提供更好的口语和展示沟通的准备工具。 然而,AI 备课与优秀的人类教师相比仍有差距,如缺乏课时设计和合理的教学目标梯度,人机融合是未来的趋势。
2024-10-12
给我推荐几个国内使用频率很高的前几位AI吧,可选择的工具太多导致我选择恐惧症犯了
以下为您推荐一些国内使用频率较高的 AI 工具: 1. 图像类: 可灵:由快手团队开发,可生成高质量的图像和视频,但价格相对较高,重度用户年费最高可达几千元,轻度用户有免费点数和较便宜的包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,操作界面简洁直观,用户友好度高,目前免费,每天签到获取灵感值即可,但存在一定局限性,如某些类型图像无法生成等。 2. 其他类别: 百度 Chat:AI 聊天机器人。 360AI 搜索。 AIbot ai 工具集:导航网站。 创客贴 AI:设计工具。 MasterGo:设计工具。 美图设计室:图像编辑。 魔搭社区 阿里达摩院:AI 训练模型。 即时 AI 设计:设计工具。 Boardmix 博思 AI 白板:PPT。 百度飞桨 AI Studio:AI 学习。 字节扣子。 秘塔写作猫:通用写作。 xmind:思维导图。 标小智 LOGO 生成:图像生成。 liblib.art:图像生成。 稿定设计:设计工具。 千帆大模型平台:模型。 DeepSeek:AI 聊天机器人。 墨刀 AI:设计工具。 沉浸式翻译:翻译。 火山方舟:AI 训练模型。 bigjpgAI 图片无损放大:图片增强。 processon:思维导图。 Pika:图生视频。 千库网:资源。 无限画:图像生成。 autoDL 云服务租用。 同花顺问财:金融。
2024-11-17
国内的ai软件有什么推荐的吗?
以下是为您推荐的一些国内的 AI 软件: 图像类: 可灵:由快手团队开发,主要用于生成高质量的图像和视频,图像质量高,但价格相对较高,重度用户年费可能达几千元,临时或轻度使用有免费点数和较便宜的包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,生成图像质量高、操作界面简洁直观,用户友好度高,且目前免费,每天签到获取灵感值即可。但在某些方面存在局限性,如某些类型图像因监管要求无法生成,处理非中文语言或国际化内容可能不够出色,处理多元文化内容可能存在偏差。 其他领域: AI 儿童安全座椅推荐系统:如宝宝树安全座椅推荐,根据儿童年龄、体重等信息利用 AI 推荐合适座椅。 AI 汽车保养套餐推荐系统:如途虎养车保养推荐,根据车辆情况利用 AI 推荐保养套餐。 AI 物流快递柜管理系统:如丰巢快递柜管理系统,利用 AI 和物联网技术优化快递柜使用效率。 AI 招聘面试模拟平台:如智联招聘面试模拟功能,利用 AI 模拟面试官提问,为求职者提供练习和反馈。 AI 房地产装修设计平台:如酷家乐装修设计软件,利用 AI 生成装修设计方案供用户选择和调整。 AI 游戏道具推荐系统:如游戏内商城推荐功能,根据玩家需求利用 AI 推荐游戏道具。 AI 天气预报分时服务:如彩云天气分时预报,利用 AI 提供每小时的天气预报。 AI 医疗病历分析平台:如医渡云病历分析系统,利用 AI 分析病历辅助诊断。 AI 会议发言总结工具:如讯飞听见会议总结功能,利用 AI 自动总结会议发言内容。 AI 书法作品临摹辅助工具:如书法临摹软件,利用 AI 识别书法作品的笔画和结构提供临摹指导和评价。
2024-11-17
国内的ai软件有什么推荐的吗?我现在只会用来写文案,对它的开发实在是很贫瘠
以下是为您推荐的一些国内的 AI 软件: 1. 聊天对话类: Kimi:具有超长上下文能力,最初支持 20 万字的上下文,现已提升到 200 万字,适合处理长文本或大量信息的任务,但在文字生成和语义理解、文字生成质量方面可能不如国内其他产品,且不支持用户自定义智能体。 智谱清言:背后的技术源自清华大学研发团队的科研成果转化,模型质量出色,以 ChatGPT 为对标打造用户体验,在逻辑推理和处理复杂提示词方面有优势,是国内首批开放智能体应用的公司之一。 2. 编程辅助类: GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能快速提供代码建议。 通义灵码:阿里巴巴团队推出,提供多种编程辅助能力。 CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,实时提供代码建议。 CodeGeeX:智谱 AI 推出的开源免费编程助手,基于 130 亿参数的预训练大模型。 Cody:Sourcegraph 推出,借助强大的代码语义索引和分析能力了解开发者的整个代码库。 CodeFuse:蚂蚁集团支付宝团队推出的免费 AI 代码助手,基于自研基础大模型微调。 Codeium:由 AI 驱动,提供代码建议、重构提示和代码解释。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同,您可以根据自身需求选择。
2024-11-17
国内推荐的ai工具
以下是为您推荐的国内 AI 工具: 图像类: 可灵:由快手团队开发,用于生成高质量的图像和视频,图像质量高,但价格相对较高,重度用户年费可达几千元,临时或轻度使用有免费点数和较便宜的包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,生成图像质量高、操作界面简洁直观、能与阿里其他产品服务整合,目前免费,每天签到获取灵感值,但存在一些局限性,如某些类型图像无法生成、处理非中文或国际化内容可能不够出色、处理多元文化内容可能存在偏差。 内容仿写类: 秘塔写作猫:https://xiezuocat.com/ ,是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风、实时同步翻译,支持全文改写、一键修改、实时纠错并给出修改建议,智能分析文章属性并打分。 笔灵 AI 写作:https://ibiling.cn/ ,是智能写作助手,支持多种文体写作,能一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作:https://effidit.qq.com/ ,由腾讯 AI Lab 开发,能提升写作效率和创作体验。 更多 AI 写作类工具可查看:https://www.waytoagi.com/sites/category/2 (内容由 AI 大模型生成,请仔细甄别) 思维导图类: GitMind:免费跨平台,支持多种模式,可通过 AI 自动生成思维导图。 ProcessOn:国内思维导图+AIGC 的工具,可利用 AI 生成思维导图。 AmyMind:轻量级在线,无需注册登录,支持自动生成节点。 Xmind Copilot:Xmind 推出的基于 GPT 的助手,可一键拓展思路、生成文章大纲。 TreeMind:输入需求由 AI 自动完成思维导图生成。 EdrawMind:提供包括 AI 驱动的头脑风暴等功能,帮助提升生产力。
2024-11-15
目前国内有哪些AI只能软件
目前国内的 AI 智能软件有以下几种: 1. AI 摄影参数调整助手:利用图像识别、数据分析技术,常见于摄影 APP 中,可根据场景自动调整摄影参数,市场规模达数亿美元。 2. AI 音乐情感分析平台:运用机器学习、音频处理技术,有相关音乐情感分析软件,能分析音乐的情感表达,市场规模达数亿美元。 3. AI 家居智能照明系统:基于物联网技术、机器学习,如小米智能照明系统,实现家居照明的智能化控制,市场规模达数十亿美元。 4. AI 金融风险预警平台:通过数据分析、机器学习,有金融风险预警软件,可提前预警金融风险,市场规模达数十亿美元。 5. AI 旅游路线优化平台:借助数据分析、自然语言处理,如马蜂窝路线优化功能,能根据用户需求优化旅游路线,市场规模达数亿美元。 国内免费的大模型 APP 有:Kimi 智能助手(Moonshot AI 出品,能一口气读完二十万字的小说,还会上网冲浪)、文心一言(百度出品,定位是智能伙伴,能写文案、想点子,又能陪你聊天、答疑解惑)、通义千问(由阿里云开发,能够与人交互、回答问题及协作创作)。 做 PPT 的 AI 产品有: 1. Gamma:在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,用户通过输入简单的文本描述来生成专业的 PPT 设计。网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/
2024-11-14
目前国内有哪些AI软件
目前国内的 AI 软件有: 智联招聘 APP:AI 招聘筛选工具,使用自然语言处理、机器学习技术,市场规模达数亿美元,能帮助企业快速筛选简历,提高招聘效率。 贝壳找房 APP:AI 房地产评估系统,运用数据分析、机器学习技术,市场规模达数亿美元,可准确评估房地产价值,为买卖双方提供参考。 腾讯游戏助手:AI 游戏角色生成器,借助图像生成、机器学习技术,市场规模达数亿美元,能为游戏开发者生成独特的游戏角色。 墨迹天气 APP:AI 天气预报助手,通过数据分析、机器学习技术,市场规模达数亿美元,提供精准的天气预报和气象预警。 QQ 音乐:AI 音乐分类器,采用机器学习、音频处理技术,市场规模达数亿美元,可自动分类音乐,方便用户查找和管理。 科沃斯扫地机器人:AI 家居清洁机器人调度系统,利用机器学习、物联网技术,市场规模达数十亿美元,能优化家居清洁机器人的工作安排,提高清洁效率。 东方财富 APP:AI 金融风险评估工具,基于数据分析、机器学习技术,市场规模达数十亿美元,帮助金融机构评估风险,做出更明智的决策。 马蜂窝 APP:AI 旅游景点解说系统,结合语音识别、自然语言处理技术,市场规模达数亿美元,为游客提供景点解说服务,丰富旅游体验。 与思维导图相关的 AI 工具有: GitMind:免费的跨平台 AI 思维导图软件,支持多种模式,可通过 AI 自动生成思维导图。 ProcessOn:国内思维导图+AIGC 的工具,能利用 AI 生成思维导图。 AmyMind:轻量级在线 AI 思维导图工具,无需注册登录,支持自动生成节点。 Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路,生成文章大纲。 TreeMind:“AI 人工智能”思维导图工具,能输入需求由 AI 自动完成思维导图生成。 EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,帮助提升生产力。
2024-11-14