Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

国内有什么生成视频的AI应用么

Answer

以下是国内一些生成视频的 AI 应用:

  1. 可灵:在 AI 视频生成领域表现出色,具有卓越的视频生成质量,生成的视频在画面清晰度、连贯性和内容丰富性上可与国际顶级模型媲美。生成速度快,处理效率高,且对国内用户的可访问性强,提供了便捷、稳定的使用体验。
  2. Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。
  3. Hidreamai:有免费额度,支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持多种控制,可生成不同时长和尺寸的视频。
  4. ETNA:由七火山科技开发的文生视频 AI 模型,能根据简短文本描述生成相应视频内容,视频长度 8 - 15 秒,画质可达 4K,支持中文,时空理解。

更多的文生视频网站可以查看:https://www.waytoagi.com/category/38 需注意,内容由 AI 大模型生成,请仔细甄别。

Content generated by AI large model, please carefully verify (powered by aily)

References

给小白的AI产品推荐

AI视频生成领域,有一款国产应用正在崭露头角,引起了业内外的广泛关注——这就是可灵。如果您曾活跃于AI交流群,或者有幸在可灵刚推出时就体验过它的视频生成功能,您就会深刻感受到可灵在这一领域的强悍实力。事实上,可灵生成的视频质量已经达到了一个令人惊叹的水平,足以与国际一些顶尖模型相媲美。可灵的优势主要体现在三个关键方面:首先,是其卓越的视频生成质量。可灵生成的视频无论是在画面清晰度、连贯性还是内容丰富性上,都达到了与国际顶级模型相当的水准。这种高质量的输出不仅满足了普通用户的需求,也为专业创作者提供了强大的工具支持。其次,可灵在生成速度上表现出色。相比国外同类产品,可灵的处理效率更高,能够更快地完成视频生成任务。在当今快节奏的内容创作环境中,这种高效率无疑是一个巨大的优势,能够大大提升用户的工作效率。最后,对于国内用户来说,可灵的可访问性是其一大亮点。相较于一些可能需要特殊访问方式的国外产品,可灵为国内用户提供了更加便捷、稳定的使用体验。这种便利性不仅降低了使用门槛,也为更多人探索AI视频生成技术提供了机会。基于这些显著优势,在国内文生视频领域,我目前毫不犹豫地首推可灵。它为国内用户提供了一个高质量、高效率的视频生成解决方案,满足了从个人创作者到专业团队的各种需求。除了价格因素外,目前可灵在功能和性能上几乎没有太多值得批评的地方。它代表了国内AI视频生成技术的最高水平,为用户提供了优质的服务体验。可灵的出现不仅填补了国内在高端AI视频生成领域的空白,也为整个行业树立了新的标杆。

问:文字生成视频的 AI 产品有哪些?

"文生视频"通常指的是使用人工智能技术将文本内容转换成视频的服务。以下是一些国内外提供此类功能的产品推荐:1.Pika:这是一款非常出色的文本生成视频AI工具,擅长动画制作,并支持视频编辑。2.SVD:如果你熟悉Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由Stability AI开源的video model。3.Runway:这是一款老牌AI视频生成工具,提供实时涂抹修改视频的功能,不过需要注意的是,Runway是收费的。4.Kaiber:这是一款视频转视频AI,能够将原视频转换成各种风格的视频。5.Sora:由OpenAI开发,可以生成长达1分钟以上的视频。以上工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。另外,更多的文生视频的网站可以查看这里:[https://www.waytoagi.com/category/38](https://www.waytoagi.com/category/38)内容由AI大模型生成,请仔细甄别。

小歪:AI视频工具合集

https://hidreamai.com/#/AiVideo支持文生视频、图生视频提示词使用中文、英文都可以文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成5s和15s的视频相关界面截图:[heading3]ETNA(国内)[content]https://etna.7volcanoes.com/Etna是一款由七火山科技开发的文生视频AI模型,它可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在8~15秒,画质可达到4K,最高3840*2160,画面细腻逼真,帧率60fps。文生视频,支持中文,时空理解

Others are asking
PPT AI 有哪些
以下是一些常见的 PPT AI 产品: 1. Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,网址:https://www.mindshow.fun/ 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 此外,还有以下相关内容: 1. 熊猫 Jay 总结了超全的 AI 工具生成 PPT 的思路和使用指南,提到了 MindShow、爱设计、闪击、Process ON、WPS AI 等工具,并指出选择工具要根据实际需求调整。 2. 在给小白的 AI 产品推荐中,国内值得推荐的是爱设计 PPT,其背后有强大团队,把握住了 AI 与 PPT 结合的市场机遇,已确立市场领先地位。
2025-01-07
在现阶段的GPT发展下,与AI交流提示词还重要吗
在现阶段的 GPT 发展下,与 AI 交流的提示词仍然非常重要。以下是一些原因: 1. 目标明确:对于 GPT 及其他 AI 来说,明确每一步的目标至关重要。只有给予清晰的指导,AI 才能产生相关且有价值的输出。 2. 逻辑性:在各种提示策略中,逻辑性都是关键。清晰、结构化的提示有助于 AI 更有效地生成输出。 3. 分步骤:无论是进行深度分析还是遵循特定结构,确保提示按照清晰的步骤进行极为重要。 4. 考虑变量:这在某些提示策略中尤其重要,需要考虑可能影响结果的所有因素。 例如,在运用 CoD 将文章做摘要的实验中,个人观点认为以英文提示词最后加上中文输出的方式效果较好,并且密度等级 4 的结果较让人满意。同时,LangGPT 框架的出现也表明随着新一代模型的发布,提示词的重要性日益凸显,其编写过程逐渐成为一种编程语言。但也有人认为框架在协助的同时也有限制,提示词带来的收益并非如宣传所说,其重要性会朝两极分化。
2025-01-07
春节期间,有哪款AI工具有活动
春节期间的 AI 工具活动有: 社区共创项目中的 AI 春晚,去年 300 人 30 天共创了 AI 春晚,今年的也即将开始,可报名参与多种岗位。 围绕“过年”项目主题制作 AI 音乐视频的相关活动。
2025-01-07
我想用AI制作一个帮助自己及时获得某细分工业领域国内外信息的工具,应该如何开始?
以下是使用 AI 制作帮助自己及时获得某细分工业领域国内外信息工具的步骤: 1. 让 AI 阅读学习一篇您认为优秀的行业调研报告,总结其中的方法论,输出一份“行业调研报告”的研究方法和操作框架。 2. 询问 AI 该文章在收集行业数据时使用了哪些一手数据和二手数据,并请其推荐一些靠谱的行业资料收集网站。 3. 要求 AI 参考上述内容,为您写一份“XXX 行业调研报告”,并请其作为“行业调研报告撰写专家”,推荐 10 个“XXX 行业”信息网站和 5 个“XXX 行业”研究微信公众号,然后输出一份“XXX 行业调研报告”框架。 4. 要求 AI 针对上述“XXX 行业调研报告”框架,丰富每一章节内容,每章内容字数大于 200 字。 5. 完成以上 4 个步骤后,AI 会为您写出一个“XXX 行业调研报告”的初稿。接下来,您可以根据自己的需求,让 AI 进一步完善每一个章节的内容。然后结合您自己的独特经验和知识,对文章内容进行润色和调整。 需要注意的是,要使调研报告有深度,可以通过以下两个路径: 1. 自己对行业比较了解,整理深度洞察和见解。 2. 一步一步深度咨询 AI,借助 AI 的海量知识,一边学习、一边研究、一边洞察总结。(通过借助 AI,可以加速我们的学习和研究能力) 操作示例如下:获取“kimi 对话原文”链接: 欢迎与 JessieZTalk 交流,在 AIGC 的路上共同进步!
2025-01-07
如何利用Ai生成长文的脑图
以下是关于利用 AI 生成长文脑图的相关信息: 一、AI 生图相关课程与分享 讨论了 AI 生图的学习课程安排,包括邀请白马老师授课、介绍相关工具网站吐司,还提及了 AI 工具的消费和应用情况等。 二、AI 绘图模型 1. 特点、优势、应用场景以及在实际操作中的使用方法和技巧。 2. 工具 SD 的各种玩法、不同界面、模型分类及应用场景,强调了其在创意设计中的作用和优势。 三、图像生成模型 1. 特点、发展历程、优势与应用。 2. 吐司网站的使用方法。 四、获取额外算力 通过特定链接注册或填写邀请码 BMSN,新用户 7 天内可额外获得 100 算力。 五、文生图的操作方式 在首页有对话生图对话框,输入文字描述即可生成图片,不满意可通过对话让其修改。 六、模型及生成效果 Flex 模型对语义理解强,不同模型生成图片的积分消耗不同,生成的图片效果受多种因素影响。 七、图生图及参数设置 可通过电图基于图片做延展,生图时能调整尺寸、生成数量等参数,高清修复会消耗较多算力建议先出小图。 八、特定风格的生成 国外模型对中式水墨风等特定风格的适配可能存在不足,可通过训练 Lora 模型改善。 九、与思维导图相关的 AI 工具 1. GitMind:免费跨平台,支持多种模式,可自动生成思维导图。 2. ProcessOn:国内思维导图+AIGC 工具,可利用 AI 生成思维导图。 3. AmyMind:轻量级在线,无需注册登录,支持自动生成节点。 4. Xmind Copilot:基于 GPT 的助手,可一键拓展思路,生成文章大纲。 5. TreeMind:输入需求由 AI 自动完成思维导图生成。 6. EdrawMind:提供一系列 AI 工具,包括头脑风暴功能,提升生产力。 十、AI 摆摊项目 1. AI 图像处理:图像生成、照片修复与动起来、动漫化头像、老照片复活、创意壁纸制作等。 2. 文案与内容创作:文案定制、朋友圈文案生成、爆款文案编写、创意故事、情话生成等。 3. 音频与音乐制作:专属歌曲创作、音频处理、声音克隆、AI 唱歌、背景音乐定制等。 4. 视频处理:视频换脸、照片转视频、视频动漫化、视频剪辑、数字人制作等。 5. 智能体与 Coze:搭建智能体、GPTs 创建、coze 工作流、微信机器人等。 6. AI 教育与咨询:AI 应用培训、课程设计、商业化咨询、AI+行业应用咨询等。
2025-01-07
要熟练使用ai的话,英语得是哪个级别的?
要熟练使用 AI ,对英语水平的要求会因具体的应用场景和个人需求而有所不同。 一般来说,如果是为了进行基本的交流和获取常见的信息,具备大学英语四级左右的水平可能就能够初步应对。但如果想要更深入地理解和运用 AI 中的复杂技术文档、进行专业领域的交流,或者参与国际前沿的研究和讨论,可能需要达到大学英语六级甚至更高的水平,如雅思 6.5 分及以上。 例如,在一些需要准确理解和运用复杂句子结构、多样化词汇,并能进行深入的观点阐述和交流的场景中,较高的英语水平会更有优势。 同时,学英语的目的和需求不同,所需的英语水平也不同。比如,为了跨语言交流、应试、工作、获取信息或理解文化等,学习的必要性和路径都会有所差异。 在使用 AI 辅助英语学习时,要注意一些事项:AI 只是辅助工具,不能替代人的思考;给 AI 的信息要尽可能准确、清晰;要注重思维启发和知识学习而非单纯获取答案;掌握一些向 AI 提问的技巧;养成做一道题就新开一个对话的好习惯;对于英语、语文之外的学科的学习要慎用 AI 。 此外,英语学习的重点在于“有效输入”,然后是理解后的输出。可以尝试不开字幕听感兴趣的优质播客,每天熟读并背诵一篇 100 字短文等方法。
2025-01-07
吴恩达的视频课程链接
以下是吴恩达相关视频课程的链接: 谷歌/百度 AI 部门负责人吴恩达和 OpenAI 合作推出的免费 Prompt Engineering(提示工程师)课程: 原版网址:https://www.deeplearning.ai/shortcourses/chatgptpromptengineeringfordevelopers/ B 站版本: 【合集·AI Course哔哩哔哩】https://b23.tv/ATc4lX0 https://b23.tv/lKSnMbB 翻译版本: 推荐直接使用 Jupyter 版本学习,效率更高:https://github.com/datawhalechina/promptengineeringfordevelopers/ 视频下载地址:https://pan.quark.cn/s/77669b9a89d7 OpenAI 开源了教程:https://islinxu.github.io/promptengineeringnote/Introduction/index.html 纯文字版本: 2023 年 11 月 9 日推出的新课程《》,一共 31 集,可在 B 站观看学习。
2025-01-07
我想要学AI视频,我应该怎么做
以下是学习 AI 视频的一些建议和资源: 1. 入门教程: 您可以查看。 学习。 2. 交流群: 如需学习 AI 视频、参与 AI 视频挑战赛或参与 AI 视频提示词共创,可直接扫二维码或联系三思或小歪【备注:AI 视频学社】,但必须有 AI 视频账号才能进群,请勿随便申请好友。 3. 直播: AI 视频学社每周 1 次直播(周五直播),例如。 4. 实践建议: 从简单创作开始,如生成零散视频片段或图片进行混剪,选用现成音乐并根据节奏简单剪辑,顺道学习主流创意软件操作。 在成功产出简单作品后,尝试完成更完整的工作流,比如:选题→剧本→分镜描述→文生图→图生视频→配音配乐→剪辑后期。 此外,在 AI 视频学社,小伙伴们可以通过参与每周举办的比赛快速学习相关知识,每周有高手直播分享前沿知识,不定期组织线上或线下活动,大家一起学习最新软件和知识,学习图生视频、视频生视频等技巧。
2025-01-06
AI生成视频
以下是关于 AI 生成视频的相关内容: Adobe 网站的生成视频相关操作: 在 Advanced 部分,您可以使用 Seed 选项添加种子编号,以帮助启动流程并控制 AI 创建的内容的随机性。如果使用相同的种子、提示和控制设置,则可以重新生成类似的视频剪辑。选择 Generate 进行生成。 将小说制作成视频的流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 AI 视频生成的技术发展概况和应用场景思考: 长期以来,人们对 AI 视频技术应用的认知停留在各种“换脸”和视频特效上。随着 AI 图像领域的技术发展,AI 视频技术也逐渐取得了突破。从交互方式来看,当前 AI 视频生成主要可分为文本生成视频、图片生成视频、视频生成视频三种形式。一些视频生成方法是先生成静态关键帧图像,然后构建为视频序列。也存在直接端到端生成视频的技术,无需进行多阶段处理即可生成视频,如基于 GAN、VAE、Transformer 的方法。微软 NUWAXL 是通过逐步生成视频关键帧,形成视频的“粗略”故事情节,然后通过局部扩散模型(Local Diffusion)递归地填充附近帧之间的内容。
2025-01-06
如何生成一个人慢慢变成动物的视频?
以下是几种生成一个人慢慢变成动物的视频的方法: 1. 利用通义万相视频模型,例如生成“古风女孩从人变身成一只狐狸”的视频,您可以通过以下链接获取相关视频: 2. 在剪映中操作: 打开“数字人”选项,选取适合的数字人形象,如“婉婉青春”,添加数字人,软件会根据提供的内容生成对应音视频。 增加背景图片,删除先前导入的文本内容,上传本地图片并调整其位置和大小。 3. 使用 Runway 软件:将图片拖到 Runway 里面生成 4s 视频,进入 Runway 官网首页,点击 start with image,直接将图片拖进来,动画幅度尽量用 3,5 有时候会乱跑,不需要等进度条转完,可以直接继续往里放图片。(Runway 是收费的,您也可以找一下有没有免费的,或者去闲鱼或者淘宝买号)
2025-01-06
可以制作音乐视频,并且把歌词按照节奏显示出来的AI平台有哪些
以下是一些可以制作音乐视频,并能按照节奏显示歌词的 AI 平台: 1. 梁明晶所介绍的平台:上传音频后上传文本歌词到 TXT 里,通过自带功能同步制作逐字歌词 TRC,修正错别字后提交,审核成功可在 QQ 音乐、酷狗、酷我 3 个平台同步显示。 2. 人工智能音频初创公司列表中的平台: :无需昂贵录音设备即可进行多轨录音。 :生成歌词、旋律、鼓点等,并能像专业 DAW 一样编辑和混音。 :AI 驱动,可创作歌词、节拍和人声,直接混音和发布。 :创作情感背景音乐。 :简化的音乐创作工具,为视频和播客创作音乐。 :为直播游戏玩家提供自适应 AI 音乐。 :高质量音乐和音效,包含版权。 :世界上第一个动态音乐引擎。 (被 Shutterstock 收购):为内容创作者提供的 AI 音乐创作工具。 :虚拟音乐工作室。 :即时制作音乐并分享。 :智能乐谱。 :由艺术家、研究人员、设计师和程序员组成的团队。 此外,在 SUNO 和 UDIO 平台的音乐制作中,其底层技术基于扩散模型,生成音乐时根据提供的提示词和上传的音频进行扩散生成,需考虑和声/调性、节奏型、人声或器乐编配、音色、音频质量、音频长度等元素。
2025-01-06
AI视频
以下是关于 AI 视频的相关内容: 1. 来来的 AI 视频短片工作流: 概念设定:MJ 剧本+分镜:ChatGPT AI 出图:MJ、SD、D3 AI 视频:Runway、pika、PixVerse、Morph Studio 对白+旁白:11labs、睿声 音效+音乐:SUNO、UDIO、AUDIOGEN 视频高清化:Topaz Video 字幕+剪辑:CapCut、剪映 完整文档: 直播回放: 2. Bay 的 AI 视频生成(上): 长期以来,人们对 AI 视频技术应用的认知停留在各种“换脸”和视频特效上。 随着 AI 图像领域的技术发展,AI 视频技术逐渐取得突破。 从交互方式来看,当前 AI 视频生成主要可分为文本生成视频、图片生成视频、视频生成视频三种形式。 一些视频生成方法是先生成静态关键帧图像,然后构建为视频序列。也存在直接端到端生成视频的技术,无需进行多阶段处理即可生成视频,如基于 GAN、VAE、Transformer 的方法。 微软 NUWAXL:通过逐步生成视频关键帧,形成视频的“粗略”故事情节,然后通过局部扩散模型(Local Diffusion)递归地填充附近帧之间的内容。 3. Bay 的 AI 视频生成(下): 若从生成方式分类,AI 视频生成包含: 文生视频、图生视频(Runway、Pika labs、SD+Deforum、SD+Infinite zoom、SD+AnimateDiff、Warpfusion、Stability Animation) 视频生视频:又分逐帧生成(SD+Mov2Mov)、关键帧+补帧(SD+Ebsynth、Rerender A Video)、动态捕捉(Deep motion、Move AI、Wonder Dynamics)、视频修复(Topaz Video AI) AI Avatar+语音生成:Synthesia、HeyGen AI、DID 长视频生短视频:Opus Clip 脚本生成+视频匹配:Invideo AI 剧情生成:Showrunner AI 若从产品阶段和可用维度分类,将按照相关维度进行产品介绍。
2025-01-06
插画生成
以下是关于插画生成的相关内容: Midjourney 商业实战案例 1. 像素风格插画 关键词:3D,16bit pixel art,Super mario,Minecraft,LEGO,pixel style,Blocksplicing,girl with long hair,Alice in Wonderland,garden background,8K–uplight–ar 9:16–v 5 Midjourney 生成的图片:像素女孩插画 2. 手机壁纸插画 关键词:mobile wallpaper illustrations,four seasons,natural landscapes,minimalist illustrations,line illustrations–ar 9:16–niji Midjourney 生成的图片:手机壁纸 3. 新海诚风格插画 关键词:Makoto Shinkai animation style,a girl,4K–ar 9:16–niji Midjourney 生成的图片:新海诚动漫海报 4. 国潮插画 关键词:Make posters of James Jean,white deer,auspicious clouds,birds,distant mountains,Chinese ChinaChic style,colorful,light color,gradient color–ar 9:16 Midjourney 生成的图片:国潮白鹿插画 【SD】简笔水彩风格插画 作者:白马少年 介绍:SD 实践派,出品精细教程 发布时间:20230620 20:04 原文网址:https://mp.weixin.qq.com/s/TPSturdv9fdGRLAxEG2rKg 生成方法:首先使用大模型“Flat2D Animerge”,适合生成一些卡通动漫的图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复的话,可拉到 11)。还有两个 lora,“Chinese painting style”可增加中国画水彩风格的效果,权重设置为 0.4;“Crayon drawing”可给画面添加简单线条和小孩子的笔触,权重设置为 0.8。将图片丢到标签器中反推出关键词,发送到“文生图”。在正向提示词末尾添加这两个 lora,尺寸按参考图设置,重绘幅度开 0.5 让 AI 更自由发挥,想和原图更接近可降低数值。将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。 商业教程:统一 2 个角色的插画海报 1. 生成女性 获取男生那张的 seed,加在关键词后面,生成女生。挑选相似的。也可以先 U3 后继续通过变化的变化 2 个按钮挑选合适的。 2. 局部重绘 局部重绘不满意的表情,如希望女生开心点,添加 happy。 3. ps 处理 把需要的角色扣在一起。ps 把颜色调整一致(如果有 ps ai 版可以修修手) 4. 小素材生成 其他过程稿
2025-01-06
数据生成图表
以下是关于数据生成图表的相关内容: 使用 Coze 做一个智能报表助手的实现过程: 1. 用户上传 Excel 后,在工作流中获取 Excel 连接,通过插件下载并读取其中数据。 2. 最初打算将解析的 Excel 数据以单元格形式存到 bot 数据库,让大模型根据单元格数据和用户提问生成答案,但大模型计算能力差,常出错。 3. 改为将 Excel 转换为数据表,使用大模型把用户问题转换为 SQL,准确率高。 4. 自己写服务在动作流里调用,根据 Excel 的 URL 动态创建表并插入数据,将表名存到 Coze 数据库,以便后续根据表名动态执行 SQL 拿到数据。 5. 根据数据库表字段信息,使用大模型为用户生成 3 个推荐报表,限制数据 100 条。 6. 拿到 SQL 后,动态执行查询数据,再用大模型转换为绘制 Echarts 图表的参数。 7. 绘制图表,使用自己写的插件,放大图片三倍提高清晰度。 ChatGPT 助力数据分析的问题与技巧: 1. 在 user prompt 限定 SQL 和数据分析及其返回格式,而不用 system prompt,原因一是 system prompt 已承载表结构信息,二是 user prompt 遵循力度更高,让其承载具体返回格式更精确,操作在后端进行防止用户通过开发者工具查看参数。 2. 分开定义单维度数据和多维度数据的 prompt,而不直接让 GPT 判断,因为存在两种结果导向的 prompt 时,GPT 约有 50%几率出错,最好在发送请求前用条件运算符区分格式,代码判断后决定使用哪个 prompt 再传给 ChatGPT,让 prompt 只存在一种结果导向。 3. 前端渲染图表时,SQL 分析的接口或个性化分析解析的数据文件所获得的 tableData 格式与渲染表格相同为对象数组,让 GPT 判断出对象的 key 值映射:keyMap,得知维度、数据项、数据值的 key,就可拿到并处理成图表所需的 series、xAxis。 ChatGPT 助力数据分析的流程: 1. 第一个 user prompt 限定 SELECT SQL,要求不要用 SELECT查询全部列,仅回复一条 SELECT SQL 语句,至少查询两列:数据项、数据值,且不能直接查询长类型字段,可用 count/substring 等函数查询。 2. system prompt 是表结构信息,如有难以理解的字段可告知 GPT 字段意义,多个表可分开描述。 3. 校验 GPT 生成的 SQL,不通过直接返回提示,通过再执行 SQL 查询数据。 4. 数据分析的 user prompt 提示数据分析,限定返回的 JSON 格式:conclusion、keyMap、title。由于支持多维数据,采取分开定义单维度数据和多维度数据的 prompt,根据结果数据 tableData 的维度,用条件运算符选择对应的 prompt 再传递给 GPT。 5. 结果数据 tableData 跟随接口返回到前端,已通过 SQL 查询的数据,不能让 GPT 再次生成,否则耗时。
2025-01-06
我想要生成一个logo,应该使用哪个工具
以下是一些可以生成 logo 的工具: 1. Looka:在线 Logo 设计平台,使用 AI 理解用户品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:其 Logo 制作器使用 AI 技术创建个性化设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的设计工具,用户可拖放设计,利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据输入快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助创建个性化 Logo。 此外,您还可以访问以下网站获取更多好用的工具: 另外,还有以下特定的工具和使用方法: 1. 超强 LOGO 生成器:设计一个 logo 生成工具,允许用户上传多张 logo 图片作为参考,通过提示询问用户是否使用这些图片来创建新的 logo 设计,可自定义提示词风格和设定每张图片的参考权重。利用 GPT4 Vision 的识图能力提取图片关键特征生成新 logo,不满意可重新生成,创作完提示用户是否满意,满意则发送转 LOGO 矢量图。 2. ideogram:海外生图平台,早期以准确生成图片文字出名,目前有大量创作者生成各类创意 Logo,对英文字母生成友好,输入支持中文。使用方法是在首页信息流中找到中意的 Logo 款式,点进去 retry,替换提示词中字母部分,支持主流图片比例和主流风格选择。 3. liblib 及 esheep 在线工作流: 极简 Logo:进入极简 Logo Lora 生成页面 https://www.liblib.art/modelinfo/8db352bf5f6b4190841de341cb9eaa0c 。 毛绒风格 Logo:进入 https://www.esheep.com/app/9116?utm_source=app_tab 一键运行。 夏日冰冰凉风格 Logo:进入 https://www.esheep.com/app/8975?utm_source=app_tab 一键运行。
2025-01-06
多模态的应用场景
多模态的应用场景广泛,主要包括以下方面: 1. 娱乐领域:如与 AI 导师进行视频聊天、与 AI 合作迭代和编写电视剧剧本等,为消费者提供更加引人入胜、连贯和全面的体验。 2. 内容生成:改变娱乐、学习与发展以及跨各种消费者和企业用例的内容生成。 3. 工具使用:使大语言模型能够使用设计给人类使用但没有自定义集成的工具,例如传统的企业资源计划(ERP)系统、桌面应用程序、医疗设备或制造机械。 4. 视频处理:包括视频搜索,通过描述性语言在数小时的视频内容中快速找到用户想要的瞬间;视频文本生成,从视频生成文本摘要、关键点、标签和标题等;定制化模型,允许用户微调自己的模型以满足特定领域需求。 5. 落地场景:如广告插入与内容审核,区分视频内容的性质;流媒体内容分析,自动生成媒体分析报告;运动赛事视频分析,帮助精彩瞬间捕捉、技术动作分析、比赛策略分析等。 6. 扩展到物理现实:通过机器人、自动驾驶车辆和其他需要与物理世界实时交互的应用程序,将大语言模型扩展到我们自己的物理现实中。
2025-01-06
RAG与Agent如何结合应用
RAG 与 Agent 的结合应用可以通过以下步骤实现: 1. 数据加载:根据数据源类型选择合适的数据加载器,如网页可使用 WebBaseLoader 加载和解析,返回文档对象。 2. 文本分割:依据文本特点选择合适的文本分割器,将文档对象分割成较小的对象,如博客文章可用 RecursiveCharacterTextSplitter 分割。 3. 嵌入与存储:使用文本嵌入器和向量存储器将文档对象转换为嵌入并存储,根据质量和速度选择合适的,如 OpenAI 的嵌入模型和 Chroma 的向量存储器。 4. 创建检索器:通过向量存储器检索器,传递向量存储器对象和文本嵌入器对象作为参数,创建用于根据用户输入检索相关文档对象的检索器。 5. 创建聊天模型:根据性能和成本选择合适的聊天模型,如使用 OpenAI 的 GPT3 模型,根据用户输入和检索到的文档对象生成输出消息。 以餐饮生活助手为例,基于结构化数据来 RAG 实战: 1. 定义餐饮数据源:将餐饮数据集转化为 Langchain 可识别和操作的数据源,如数据库、文件、API 等,并注册到 Langchain 中,提供统一接口和方法供 LLM 代理访问和查询。 2. 定义 LLM 的代理:通过 Langchain 的代理(Agent)实现,代理管理器可让开发者定义不同的 LLM 代理及其功能和逻辑,提供统一接口和方法供用户交互。 以下是使用 LangChain 构建 RAG 应用的示例代码。
2025-01-06
RAG的经典应用场景
RAG(检索增强生成)的经典应用场景主要包括以下方面: 1. 构建智能问答客服:用户提出问题,RAG 模型从大规模的文档集合中检索相关的文档,然后生成回答。 2. 知识问答系统:用户提问后,RAG 从私有知识中检索到“包含答案的内容”,然后把“包含答案的内容”和用户提问一起放到提示词中,提交给大模型,大模型的回答会充分考虑到“包含答案的内容”。
2025-01-06
如何应用提示词
以下是关于如何应用提示词的全面指导: 一、理解提示词的作用 提示词向模型提供上下文和指示,其质量直接影响模型输出的质量。 二、学习提示词的构建技巧 1. 明确任务目标,用简洁准确的语言描述。 2. 给予足够的背景信息和示例,帮助模型理解语境。 3. 使用清晰的指令,如“解释”“总结”“创作”等。 4. 对特殊要求应给予明确指示,如输出格式、字数限制等。 三、参考优秀案例 研究和学习已有的优秀提示词案例,可在领域社区、Github 等资源中获取。 四、实践、迭代、优化 多与语言模型互动,根据输出提高提示词质量。尝试各种变体,比较分析输出差异,持续优化提示词构建。 五、活用提示工程工具 目前已有一些提示工程工具可供使用,如 Anthropic 的 Constitutional AI。 六、跟上前沿研究 提示工程是当前前沿研究领域之一,持续关注最新成果和方法论。 七、在星流一站式 AI 设计工具中的应用 1. 在 prompt 输入框中输入提示词,可使用图生图功能辅助创作。 2. 了解提示词的定义:用于描绘想生成的画面,支持中英文输入。 3. 掌握写好提示词的方法: 内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等。 调整负面提示词,帮助 AI 理解不想生成的内容。 利用“加权重”功能,让 AI 明白重点内容。 可使用预设词组,小白用户可点击进行生图。 4. 善用辅助功能,如翻译功能、删除所有提示词、会员加速等。 精心设计的提示词能最大限度发挥语言模型的潜力,多实践、多学习、多总结,终可掌握窍门。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-06
大模型家族、类别、应用场景
大模型主要分为以下两类: 1. 大型语言模型:专注于处理和生成文本信息,主要应用于自然语言处理任务,如文本翻译、文本生成、情感分析等。 2. 大型多模态模型:能够处理包括文本、图片、音频等多种类型的信息,可以应用于更广泛的领域,例如图像识别与描述、视频分析、语音识别与生成等。 大型多模态模型与大型语言模型的不同点包括: 1. 处理的信息类型不同:大型语言模型专注于文本信息,大型多模态模型能处理多种类型信息。 2. 应用场景不同:大型语言模型主要用于自然语言处理任务,大型多模态模型应用领域更广泛。 3. 数据需求不同:大型语言模型主要依赖大量文本数据训练,大型多模态模型需要多种类型数据训练。 对于聊天大模型的深度用户,把同一个问题让不同的大模型解答是高频操作,主要适用于以下场景: 1. 对回答的精准性、全面性要求较高的问题,因为不同大模型在解决不同问题时各有优劣。 2. 需要多方交叉验证,规避模型幻觉的客观事实类问题。 常用的模型网站有: 1. 2. 3. 4. 5. 下载模型后需要将之放置在指定的目录下,不同类型的模型放置目录不同: 1. 大模型(Ckpt):放入 models\\Stablediffusion 2. VAE 模型:一些大模型需要配合 vae 使用,对应的 vae 同样放置在 models\\Stablediffusion 或 models\\VAE 目录,然后在 webui 的设置栏目选择。 3. Lora/LoHA/LoCon 模型:放入 extensions\\sdwebuiadditionalnetworks\\models\\lora,也可以在 models/Lora 目录 4. Embedding 模型:放入 embeddings 目录 模型的类型可以通过检测。
2025-01-06
有数据分析方面的AI应用么
以下是一些数据分析方面的 AI 应用: ChatGPT 助力数据分析:通过实际案例与相关技巧,实现了两种方式的多维数据分析,包括 SQL 分析和个性化分析。分析完成后可展示结果数据的图表和分析结论,图表支持折线图和柱状图切换。 AI 儿童安全座椅推荐系统:利用数据分析和机器学习,如宝宝树安全座椅推荐,为家长推荐合适的儿童安全座椅。 AI 汽车保养套餐推荐系统:结合数据分析和机器学习,如途虎养车保养推荐,根据车辆情况推荐保养套餐。 AI 物流快递柜管理系统:借助数据分析和物联网技术,如丰巢快递柜管理系统,优化快递柜使用效率。 AI 招聘面试模拟平台:运用自然语言处理和机器学习,如智联招聘面试模拟功能,帮助求职者进行面试模拟。 AI 房地产装修设计平台:使用图像生成和机器学习,如酷家乐装修设计软件,为用户提供装修设计方案。 AI 游戏道具推荐系统:基于数据分析和机器学习,在一些游戏的内商城推荐功能中,根据玩家需求推荐游戏道具。 AI 天气预报分时服务:利用数据分析和机器学习,如彩云天气分时预报,提供精准的分时天气预报。 AI 医疗病历分析平台:通过数据分析和自然语言处理,如医渡云病历分析系统,分析医疗病历,辅助诊断。 AI 会议发言总结工具:运用自然语言处理和机器学习,如讯飞听见会议总结功能,自动总结会议发言内容。 AI 书法作品临摹辅助工具:借助图像识别和数据分析,如书法临摹软件,帮助书法爱好者进行临摹。
2025-01-06