直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

你可以从图片提取文字吗

回答

目前,在 AI 领域,存在能够从图片中提取文字的技术和应用。

例如,谷歌 Gemini 多模态技术可以实现从图像中提取文本,比如从表情包或文档扫描中提取文字。它不仅能提取文字,还能理解图像或视频中的内容,包括识别物体、场景和情绪等。在一些具体的应用场景中,比如有人想为猫买新衣服,可以给模型提供猫的图片和相关文本提示,模型会给出适合猫的衣服建议。而且输入的图像和文本顺序可以交错,不同的顺序可能会影响结果。

另外,Tipbot AI 具有图片 OCR 功能,能够从图片中提取文字并提供简洁的摘要。它适用于各种用户群体,如学生、专业人士、忙碌的父母等。用户可以通过拍照提取图片中的文字并获得摘要,还能根据自身需求和偏好创建和定制自己的 AI 助手,其用户友好的设计使得即使非技术专家也能轻松使用。

但需要注意的是,使用 Tipbot AI 时要注意保护个人隐私和数据安全,而且它可能在对某些特定图片的文字提取上存在不准确的情况。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

谷歌Gemini多模态提示词培训课——Part1

多模态技术可以从图像中提取文本,使从表情包或文档扫描中提取文本成为可能。它还能理解图像或视频中发生的事情,识别物体、场景,甚至情绪。假设有人想为一只猫买新衣服,他可以给模型提供两张猫的图片。同时,他可以提供一个文本提示,询问什么样的衣服适合这只猫。图像和文本将作为模型的输入。模型随后会给出响应,建议最适合这只猫的衣服。基于这两张图片,输入可以是交错的,意味着它可以是文本、图像、音频的混合。在这个例子中,有一个图像,然后是文本提示,接着是另一个图像。这个顺序可以改变,而且顺序很重要。课程稍后会详细讨论这一点。这是一个关于学生解决物理问题答案的例子。有一个包含问题和学生答案的图像,以及一个文本提示。模型被要求逐步推理这个问题,然后判断学生是否给出了正确答案。如果解决方案是错误的,模型需要解释错误之处并解决问题。在这个例子中,提供了一个文本提示和一个图像。在输出部分,可以看到模型的答案。值得注意的是,模型能够跨文本和图像进行推理。图像中包含文字和绘图,而模型的响应既包含文本,又包含一些LaTeX公式。

效率工具篇2-5000+个AI 项目详解

Tipbot AI的独特优势在于其图片OCR功能,能够从图片中提取文字并提供简洁的摘要。然而,用户在使用该应用时需要注意保护个人隐私和数据安全。此外,Tipbot AI可能有一些局限性,例如对某些特定图片的文字提取可能不准确。

效率工具篇2-5000+个AI 项目详解

Tipbot AI适用于各种用户群体。无论您是学生、专业人士还是忙碌的父母,Tipbot AI的图片OCR功能都能在您的日常生活中发挥巨大作用。您可以通过拍照提取图片中的文字并获得简洁的摘要。此外,您还可以根据自己的需求和偏好创建和定制自己的AI助手。Tipbot AI的用户友好设计使得AI变得易于使用,即使您不是技术专家也可以轻松上手。

其他人在问
如果我希望搜索尽可能全部的含有相关搜索词的论文并提取其特定信息呢
目前知识库中没有关于如何搜索尽可能全部的含有相关搜索词的论文并提取其特定信息的内容。但一般来说,您可以通过以下几种方式来尝试: 1. 利用专业的学术数据库,如 Web of Science、Scopus 等,设置精确的搜索词和筛选条件。 2. 尝试使用多个不同的学术搜索引擎,以扩大搜索范围。 3. 运用高级搜索技巧,例如布尔逻辑运算符(AND、OR、NOT)来优化搜索词组合。 4. 对于提取特定信息,可以先确定所需信息的类型和特征,然后借助相关的文献管理工具或数据挖掘软件来辅助处理。
2024-11-06
提取视频中的语音转文字
要提取 B 站视频中的字幕文字内容,可按以下步骤操作: 1. 打开 B 站视频,如果在视频栏下面有字幕按钮,说明该视频作者已上传字幕或后台适配了 AI 字幕。 2. 安装油猴脚本: 。 3. 安装后刷新浏览器,点击字幕,会看到多出一个“下载”按钮。 4. 点击下载按钮,弹出窗口,可选择多种字幕格式,如带时间的或者不带时间的。 5. 最后将下载的字文字内容全选复制发送给 GPTs 即可。 需要注意的是,对于有字幕的视频,目前大部分用 AI 总结视频的工具/插件/应用都是通过获取字幕来实现的。直接用语音转文字的方式效率较低。
2024-11-04
能够提取视频摘要的大模型有哪些
以下是一些能够提取视频摘要的大模型: 1. InstructBLIP:基于预训练的BLIP2模型进行训练,在MM IT期间仅更新QFormer。通过引入指令感知的视觉特征提取和相应的指令,能够提取灵活多样的特征。 2. PandaGPT:是一种开创性的通用模型,能够理解6种不同模式(文本、图像/视频、音频、热、深度和惯性测量单位)的指令并根据指令采取行动。 3. PaLIX:使用混合VL目标和单峰目标进行训练,包括前缀完成和屏蔽令牌完成。这种方法对于下游任务结果和在微调设置中实现帕累托前沿都是有效的。 4. VideoLLaMA:引入了多分支跨模式PT框架,使LLMs能够在与人类对话的同时处理给定视频的视觉和音频内容,使视觉与语言以及音频与语言保持一致。 5. 视频聊天GPT:专门为视频对话设计的模型,能够通过集成时空视觉表示来生成有关视频的讨论。 6. Shikra:Chen等人介绍的一种简单且统一的预训练MMLLM,专为参考对话(涉及图像中区域和对象的讨论的任务)而定制,展示了值得称赞的泛化能力,可以有效处理看不见的设置。 7. DLP:提出PFormer来预测理想提示,并在单模态句子数据集上进行训练,展示了单模态训练增强MM学习的可行性。 8. Pegasus1:具有约800亿参数,可处理从10秒到数小时的视频内容。不仅能识别视频中的人物、物体、场景,还能理解背景音乐、对话等,并提供一系列API来满足不同的视频到文本转换需求。
2024-11-01
AI 辅助访谈过程分析与信息提取
以下是关于 AI 辅助访谈过程分析与信息提取的相关内容: 在“危柯宇:如何让 AI 走进我们的工作和生活”中,案例二“【调研达人秘籍】用 AI 破解信息迷阵,轻松收获深度报告(提效 10x)”提到了以下要点: 效益方面:通过清晰的 AI 工作流,能在短时间内完成深度调研,为决策提供有力支持。 AI 赋能调研工作流包括: 启动智库引擎:询问 AI 如何理解问题(参考截图一)。 搭建信息骨架:询问 AI 如何汇报内容(参考截图二)。 精准信息挖掘:向“秘塔 AI”定向搜索(参考截图三)。 信息融合与分析:让“Kimichat”综合分析(参考截图四和五)。 汇报成果精炼:整合分析结果,制作报告,分享实用调研工具(参考截图六和七)。 详情可查看上面的即刻链接。
2024-10-29
科学问题二:XXX(小标题) 问题挑战:如何通过构建合理的先验知识或模型假设,刻画出数据中的可变性?如何利用从少量样本中提取到的变化信息来预测未见数据的表现? XXX XXX(问题挑战一的方法) XXX)问题挑战二的方法) 请将XXX补充完整,重点在预测,如何刻画和利用数据分布的“变化性”
以下是为您补充完整的内容: 对于如何通过构建合理的先验知识或模型假设,刻画出数据中的可变性,以及如何利用从少量样本中提取到的变化信息来预测未见数据的表现,我们可以参考以下方法: 在准备 LLM 数据方面,对于制作 LLM 微调数据集,首先获取文本格式非结构式和网络式结构式的数据。对于 QA 数据集,主要依靠已有的大语言模型生成,根据不同文本设定不同的提示词以获取尽可能多且信息量丰富的 QA。先对文件中的文本进行切割,将每一大部分放进一个约 200 字的 txt 文件里,然后设定提示词模板。例如对于公司产品手册,模板可以是:“你是一个聪明的 xxx 公司的 xxx 产品的产品经理。给你一段 xxxxx 有限公司 xx 产品相关的文本,你必须依据文本想出十个不同的问题和这十个问题对应的答案。你想出的问题可以被用来测试公司内部 xxx 职员的专业能力。你想出的问题可以是使用公司产品的用户会想到的问题。你想出的问题和答案必须和所给文本相关。你回答得答案必须可以让使用产品的用户理解。当你想出问题和答案后,你必须用以下格式回复:```
2024-10-21
有发小红书视频链接,能自动提取完整文字文案的bot或者工具吗,谢谢~
以下为您介绍一款可以自动提取小红书视频链接完整文字文案的工具: 名称:小红书文案专家 功能价值: 见过多个爆款文案,只需输入网页链接或视频链接,就能生成对应的小红书文案。 可辅助创作者生成能一键复制发布的初稿,提供创意和内容,节约 10 倍文字内容创作时间。 应用链接:https://www.coze.cn/s/ij5C6LWd/ 设计思路: 痛点:个人时间有限,希望有人帮忙写初稿再进行二创,同时希望能生成配图。 实现思路:为自己和团队设计工作流,让 AI 按照运营日常思路和流程工作。 一期产品功能: 可以提取任何链接中的标题和内容。 按照小红书平台文案风格重新整理内容。 加入 emoji 表情包,使文案更有活力。 为文案配图片。 二期计划功能: 持续优化升级。 增加全网搜索热点功能。 提炼热点新闻或事件关键信息。 结合用户想要生成的内容方向,输出文案和配图。 另外,在使用类似工具时,需要将需求做细颗粒度的分解,把大任务拆成小任务,小任务拆成更小的任务,并为每个小任务选择合适的工具/模型来实现。
2024-10-17
有哪些免费的可以提高图片分辨率的网站
以下是一些免费提高图片分辨率的方法和相关网站: 1. 在 Stable Diffusion 中: 文生图功能中有内置的高清修复(HiresFix)功能。将初始分辨率设置为 800x420 时,选择放大倍率为 2,理论上放大倍率越高,图片越清晰,但最高可达 4 倍,实际效果与电脑配置和显卡显存有关。 先以较低分辨率画图,获取生成图的种子值,然后将其填入随机数种子以固定图片,再进行高清修复,放大算法如二次元绘图可选择 RESRGAN 4x+ Anime6B,写实类风格可选择 RESRGAN 4x+。 2. Stability AI 推出的基于 Discord 的工具: :将低分辨率、低质量的图像转换为 4k 杰作,价格为 25 积分。 :简单、低成本的分辨率提升,价格为 0.2 积分。 此外,在 MJ 应用中也有相关操作,如复制图像链接和提示词等步骤来生成新的图像,并通过改变比例和镜头拉远等操作调整构图,最终提升分辨率。
2024-11-06
如何编辑更改图片中的文字
以下是一些关于编辑更改图片中文字的方法和示例: DALL·E 推出了编辑功能,例如可以添加耳机、去掉错误文字、添加正确文字、修改鹿角等。但对于添加较多区域小的文字识别可能不太好。 Ideogram 2.0 在生成图像时,AI 基于学习内容创造文字,可能存在字体版权、字体生成错误等问题。纠正方式包括多次生成提示、使用编辑器修改文本、更换同义词、上传包含所需文本的图像等。 Midjourney 有新的图片编辑器功能,如增加主体数量(以狐狸为例,涂抹空白区域并修改关键词)、轻松扩图(自由操作图片并点击生成)、扩图并增加主体(缩放原图、涂抹空白区域并修改关键词),还能添加文字。进入 Midjourney 图片编辑器的步骤为:打开 MJ 官网(https://www.midjourney.com),选择要修改的图片,点击图片后再点击右下角的 Editor 按钮。需要注意的是,新生成的主体须与原图一致,且部分操作目前 discord 暂不支持。
2024-11-05
想用AI生成自然界治愈的图片
以下是为您生成自然界治愈图片的相关信息和建议: PMRF 是一种全新的图像修复算法,它擅长处理去噪、超分辨率、着色、盲图像恢复等任务,能够生成自然逼真的图像。不仅能提高图片清晰度,还能确保图片看起来像真实世界中的图像,可应对复杂图像退化问题,修复细节丰富的面部图像或多重损坏的图片,效果优质。详细介绍: 此外,在 AI 线上绘画方面,如果您需要生成自然风景等图片,有以下工具和网站可供选择: 主流工具如 midjourney(MJ)付费成本较高,stable diffusion(SD)硬件门槛不低。 免费在线 SD 工具网站如 。 希望以上信息对您有所帮助。
2024-11-05
图片生成视频的工具或平台
以下是一些图片生成视频的工具或平台: 1. Pika:要生成视频,需进入 generate 频道,目前有 10 个 generate 频道,任选一个进入。生成视频的工作流程包括直接生成视频(在输入 /create,然后输入 prompt,得到视频)和图片生成视频(使用 MJ/SD 生成图像(可选)+在 PIKA 平台添加 prompt =得到视频)。 2. 即梦:登录进入即梦的界面,选择视频生成,选择需要制作的图片和填写对应的提示词,点击生成按钮。如果觉得图生视频等待时间较长,也可以直接使用已生成好的片段。 3. Adobe Firefly:在上选择“生成视频”。在 Generate video 页面上,在 Prompt 字段中输入文本提示,还可以使用 Upload 部分中的 Image 选项将图像用于第一帧,并为视频剪辑提供方向参考。在 General settings 部分,可以确定 Aspect ratio 和 Frames per second。
2024-11-05
最常用的免费图片修改AI软件是哪些
以下是一些常用的免费图片修改 AI 软件: 1. AVAide Watermark Remover:在线工具,使用 AI 技术去除图片水印,支持多种图片格式,操作简单,还提供去除文本、对象等功能。 2. Vmake:可上传最多 10 张图片,AI 自动检测并移除水印,适合快速去除水印及社交媒体分享图片的用户。 3. AI 改图神器:提供 AI 智能图片修复去水印功能,支持粘贴或上传手机图像,操作简便。 在图像生成方面,以下是一些相关工具: 1. 最透明的选项:Adobe Firefly(https://www.adobe.com/sensei/generativeai/firefly.html) 2. 开源选项:Stable Diffusion(https://stablediffusionui.github.io/) 3. 最佳免费选项:Bing 或 Bing Image Creator(https://www.bing.com/images/create)(使用 DALLE),Playgound(https://playgroundai.com/)(允许使用多个模型) 4. 最佳质量图像:MidJourney(https://midjourney.com/) 以下是一些 AI 视频软件: 1. Runway:https://runwayml.com ,有网页和 app 方便。 2. haiper:https://app.haiper.ai/ ,免费。 3. SVD:https://stablevideo.com/ ,有免费额度,对景观效果较好。 4. Pika:https://pika.art/ ,收费,可控性强,可对嘴型、配音。 5. PixVerse:https://pixverse.ai/ ,免费,人少不排队,有换脸功能。 6. Dreamina:https://dreamina.jianying.com/ ,剪映旗下,生成 3 秒,动作幅度升级,有最新模型。 7. Morph Studio:https://app.morphstudio.com/ ,还在内测。 8. Heygen:https://www.heygen.com/ ,数字人/对口型。 9. Kaiber:https://kaiber.ai/ 10. Moonvalley:https://moonvalley.ai/ 11. Mootion:https://discord.gg/AapmuVJqxx ,3D 人物动作转视频。 12. 美图旗下:https://www.miraclevision.com/ 13. Neverends:https://neverends.life/create ,2 次免费体验,操作傻瓜。 14. SD:Animatediff SVD deforum ,免费,需自己部署。 15. Leiapix:https://www.leiapix.com/ ,免费,可把照片转动态。 16. Krea:https://www.krea.ai/ ,12 月 13 日免费公测。
2024-11-04
我只是想要修改背景和提高图片质量,哪个图片AI工具最合适
以下是一些适合修改背景和提高图片质量的图片 AI 工具: Liblibai:具有迭代步数、尺寸、生成批次、每批数量、提示词引导系数、随机数种子、ADetailer、ControlNet、重绘幅度等设置,可调整图片内容。 迭代步数:调整图片的次数,越多理论上效果越好,但并非越多越好。 尺寸:影响生成图片的大小,需适中选择。 生成批次和每批数量:控制生成图片的数量。 提示词引导系数:影响图像与提示的匹配程度,过高会使质量下降。 ADetailer 和 ControlNet 为高阶技能。 重绘幅度:用于图生图,决定输出图与输入图的差别。 辅助工具: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可增加细节。 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强: magnific:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ Photoshop 2023 Beta:更擅长对原有图像的扩充,具有创成式填充功能,可去除人物、添加元素等,但生成的某些图形质量可能不如 MJ 和 SD 的效果,仍需后期处理来达到满意效果。
2024-11-04
免费的文字生图工具推荐
以下为一些免费的文字生图工具推荐: DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真图片。 StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 MidJourney:因高质量图像生成效果和友好的界面设计受欢迎,在创意设计人群中流行。 您还可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 另外,为您补充一些文字生成视频的 AI 产品: Pika:出色的文本生成视频 AI 工具,擅长动画制作,支持视频编辑。 SVD:若熟悉 Stable Diffusion,可安装其最新插件,在图片基础上生成视频,由 Stability AI 开源。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多文生视频的网站可查看:https://www.waytoagi.com/category/38 。 关于 Stability AI 推出基于 Discord 的媒体生成和编辑工具的文生图使用方法: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 2. 进入 ARTISAN 频道,任意选择一个频道 输入/dream 会提示没有权限,点击 https://stability.ai/stableartisanchoosestableartisanplan 链接,注册登录,填写信用卡信息以及地址,点击提交,可免费试用三天,三天后开始收费。 输入/dream 提示词,这部分和 MJ 类似。 和 MJ 手工输入参数不同,可选参数有五类: prompt:提示词,正常文字输入,必填项。 negative_prompt:负面提示词,填写负面提示词,选填项。 seed:种子值,可以自己填,选填项。 aspect:长宽比,选填项。 model:模型选择,SD3、Core 两种可选,选填项。 Images:张数,1 4 张,选填项。完成后选择其中一张。
2024-11-07
怎么文字转语音,用自己的音色
要实现文字转语音并使用自己的音色,以下是一些方法和相关信息: ChatTTS 增强版整合包:当文本内容很多时,可以勾选文本切割来处理,默认五十字符切割,还能将音频片段合并为一整段音频。切割的音频片段也支持增强处理。保存后的音频文件结构清晰,包括合成的一整段音频、增强处理后的整段音频、切分的音频片段等。该版本增加了批量处理功能,可上传按句换行格式的 TXT 文本。音色固定,可通过点击随机按钮多尝试找到满意音色,并将设置和音色种子保存到配置文件方便下次使用。 ElevenLabs 工具:能全自动将视频翻译成 29 种语言,更能克隆原视频里的声音来配音。 GPTSoVITS + BertVITS2:一开始可选不同音色,基于网络红人训练,音色与网络红人相像。若没有接近的音色,可自己训练,参考 WaytoAGI 的知识库: 。但实际使用中只改音色可能不够,如说话时的口头禅、重音、停顿等。
2024-11-06
我需要一个能写生成文生视频prompt的机器人,这个机器人只负责生产宠物做饭视频的文字prompt,请学习文生视频prompt写作技巧,并给我写一个这样的机器人
以下是关于文生视频 prompt 写作技巧及为您生成的一个宠物做饭视频的文字 prompt 示例: 文生视频 prompt 写作技巧: 1. 明确视觉样式:要具体描述视频的视觉基调和风格,比如是想要现实的、电影的、动画的还是超现实的。对美学的描述越具体,生成的效果就越接近期望。 2. 考虑视觉风格创意:如电影感要注重戏剧性照明、镜头光晕和高对比度;逼真风格要追求自然光、清晰细节和逼真角色;动画风格可使用卡通、3D 动画或 2D 动画等术语;艺术风格可用印象派、极简主义或抽象等形容词来指导艺术方向。 宠物做饭视频的文字 prompt 示例:“创建一个 2D 动画、色彩鲜艳的视频,一只可爱的猫咪在厨房里熟练地烹饪美味的鱼餐,画面具有温馨的灯光和可爱的卡通风格。”
2024-11-06
文字转视频软件
以下是一些文字转视频的软件和相关信息: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文字转视频的网站可以查看:https://www.waytoagi.com/category/38 。 通过 ChatGPT 生成文案,将这些文案复制到支持 AI 文字转视频的工具内,可实现短视频的自动生成。市面上一些手机剪辑软件也支持文字转视频,如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。这类工具操作相对简单,让大众生产视频更轻松。 Morphstudio 的使用方法: 1. MorphVideoBot 的 Text to Video 命令:/video ,示例:/video Hello World!ar 16:9 motion 5 camera zoom in fps 30 s 5 。 2. MorphBot 的 Image to Video 命令:/animateA cat is walking ar 16:9 motion 5 camera pan up fps 30 。 参数说明: ar(MorphVideoBot 专用):设置视频的宽高比,如 16:9、4:3、1:1、3:4、9:16 等。 motion:调整视频中运动的强度,值越低运动越轻微,值越高运动越夸张。 camera:控制相机运动,如 Zoom(缩放):camera zoom in/out;Pan(平移):camera pan up/down/left/right;Rotate(旋转):camera rotate clockwise/counterclockwise 或 camera rotate cw/ccw;Static(静止):camera static 。 fps:设置视频的帧率,默认是每秒 24 帧。 s(MorphVideoBot 专用):设置视频的时长(秒)。 提示:更详细和描述性的提示可能会在生成的视频中产生更好的结果。可以随意尝试不同的设置以达到期望的效果。 内容由 AI 大模型生成,请仔细甄别。
2024-11-05
如何根据文字生成视频
文字生成视频可以通过以下方式和使用以下产品实现: 一些提供文字生成视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:可在 Stable Diffusion 基础上安装使用,能在图片基础上生成视频。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多产品可查看: 在 Adobe Firefly 中生成带有文本提示和图像的视频: 在 Adobe Firefly 网站(https://firefly.adobe.com/)上选择“生成视频”。 在 Generate video 页面的 Prompt 字段输入文本提示,还可在 Image 部分的 Upload 选项中使用图像作为第一帧并为视频生成提供视觉提示。 在 General settings 部分确定 Aspect ratio 和 Frames per second。 在 Advanced 部分,可使用 Seed 选项添加种子编号来控制 AI 创建内容的随机性。 最后选择 Generate 生成。 以上工具适用于不同的使用场景和需求,您可以根据自身情况进行选择。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-11-05