直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

根据一句话文生视频给出关键词数据的工具

回答

以下是一些根据一句话文生视频给出关键词数据的工具及相关信息:

  • 在 SD 中,图生图功能除文本提词框外还有图片输入口,可通过图片反推提示词,如 CLIP 能反推出完整含义的句子,DeepBooru 能反推出关键词组,但生成的提示词可能存在瑕疵,需手动补充。
  • Morphstudio 中,文生视频的提示词指令为:/video[视频提示词]-比例设定[比例]-动作程度[1-10]-镜头动作[动作]-每秒帧数[8-30]-秒数[3-7]。
  • 文字生成视频的 AI 产品有:Pika 擅长动画制作且支持视频编辑;SVD 是 Stable Diffusion 的插件;Runway 是老牌收费工具,提供实时涂抹修改视频功能;Kaiber 能将原视频转换成各种风格;Sora 由 OpenAI 开发,可生成长达 1 分钟以上的视频。更多相关网站可查看[https://www.waytoagi.com/category/38]。但请注意内容由 AI 大模型生成,请仔细甄别。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

【SD】真人转二次元?图生图如此强大

相比于文生图,图生图功能除了文本提词框以外还多了一个图片框的输入口,因此,我们还可以通过图片来给与AI创作的灵感。我们随便照一张照片,直接拖入进来。然后可以看到,在文本输入框的旁边有两个反推提示词的按钮:CLIP是可以通过图片反推出完整含义的句子;DeepBooru是可以反推出关键词组。上面的那一张图,我们通过两种反推方式得到的提示词分别为:CLIP——a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art。(一个小男孩坐在长凳上,旁边的地板上放着一辆玩具火车和一辆乐高火车,亚当·雷克斯,详细的产品照片,一张库存照片,莱科艺术,)DeepBooru——shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers。(鞋子,独奏,帽子,橙色背景,黄色背景,微笑,袜子,黑发,坐着,运动鞋)可以看到两种方式生成的提示词都有些瑕疵,比如第一组里面没有描述小孩的穿着,第二组里面没有描述小孩的性别和周围的物品,所以我们需要手动来补充提示词的信息。写好提示词之后,我们再调整一下宽度和高度,让这个红框刚好匹配我们的图片即可。

工具教程:morphstudio

文生视频:提示词指令:/video[视频提示词]-比例设定[比例]-动作程度[1-10]-镜头动作[动作]-每秒帧数[8-30]-秒数[3-7]举例:/video你好世界-比例16:9 -动作幅度为5 -镜头拉近-每秒30帧-秒数为5秒

问:文字生成视频的 AI 产品有哪些?

"文生视频"通常指的是使用人工智能技术将文本内容转换成视频的服务。以下是一些国内外提供此类功能的产品推荐:1.Pika:这是一款非常出色的文本生成视频AI工具,擅长动画制作,并支持视频编辑。2.SVD:如果你熟悉Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由Stability AI开源的video model。3.Runway:这是一款老牌AI视频生成工具,提供实时涂抹修改视频的功能,不过需要注意的是,Runway是收费的。4.Kaiber:这是一款视频转视频AI,能够将原视频转换成各种风格的视频。5.Sora:由OpenAI开发,可以生成长达1分钟以上的视频。以上工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。另外,更多的文生视频的网站可以查看这里:[https://www.waytoagi.com/category/38](https://www.waytoagi.com/category/38)内容由AI大模型生成,请仔细甄别。

其他人在问
用 mj 做文生图,Prompt 模板
以下是使用 MJ 进行文生图的 Prompt 模板: 1. 定主题:明确您需要生成一张什么主题、什么风格、表达什么信息的图。 2. 选择基础模型 Checkpoint:按照主题,找内容贴近的 checkpoint。一般喜欢用模型大佬麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等,效果较好。 3. 选择 lora:在想要生成的内容基础上,寻找内容重叠的 lora,以控制图片效果及质量。可多参考广场上好看的帖子中使用的 lora。 4. ControlNet:用于控制图片中特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能,可后续学习。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语的组合,不用管语法,单词、短语之间用英文半角逗号隔开。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。 9. 采样算法:较复杂,一般选 DPM++ 2M Karras 较多。最稳妥的是留意 checkpoint 的详情页上模型作者是否有推荐采样器,使用推荐的采样器更有保障。 10. 采样次数:根据采样器特征,选 DPM++ 2M Karras 后,采样次数一般在 30 40 之间,多了意义不大且慢,少了出图效果差。 11. 尺寸:根据个人喜好和需求选择。 另外,使用 Stability AI 基于 Discord 的媒体生成和编辑工具进行文生图时: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 2. 进入 ARTISAN 频道,任意选择一个频道。 3. 输入/dream 会提示没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。 4. 输入/dream 提示词,这部分和 MJ 类似。 5. 和 MJ 手工输入参数不同,可选参数有五类: prompt:提示词,正常文字输入,必填项。 negative_prompt:负面提示词,填写负面提示词,选填项。 seed:种子值,可以自己填,选填项。 aspect:长宽比,选填项。 model:模型选择,SD3,Core 两种可选,选填项。 Images:张数,1 4 张,选填项。完成后选择其中一张。 在 MJ 应用篇儿童绘本制作、人物一致性方面: 1. 生成人物图片:确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 mj 中生成直到得到满意的人物图像。垫图 URL + “In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,取 iw 2 。 2. 合成人物和场景,垫图并重新生成:使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐(若画面和谐或 PS 技术足够,也可不用图生图),将合成后的图作为垫图(iw 2),mj 重新生图,如“prompt:垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 3. 绘本展示。
2024-11-15
文生图的 Prompt 模板
以下是关于文生图的 Prompt 模板的相关内容: 通常描述逻辑包括人物及主体特征(如服饰、发型发色、五官、表情、动作),场景特征(如室内室外、大场景、小细节),环境光照(如白天黑夜、特定时段、光、天空),画幅视角(如距离、人物比例、观察视角、镜头类型),画质(如高画质、高分辨率),画风(如插画、二次元、写实)。通过这些详细的提示词,能更精确地控制 Stable Diffusion 的绘图。 对于新手,有功能型辅助网站帮助书写提示词,如 http://www.atoolbox.net/ ,可通过选项卡方式快速填写关键词信息;https://ai.dawnmark.cn/ ,每种参数有缩略图参考,方便直观选择提示词。还可以去 C 站(https://civitai.com/)抄作业,复制每一张图的详细参数并粘贴到正向提示词栏,然后点击生成按钮下的第一个按键,不过要注意图像作者使用的大模型和 LORA,不然即使参数一样,生成的图也会不同,也可只取其中较好的描述词使用。 在 Tusiart 中,文生图的操作流程如下: 定主题:确定要生成的图的主题、风格和表达的信息。 选择基础模型 Checkpoint:找内容贴近主题的 checkpoint,如麦橘、墨幽的系列模型。 选择 lora:寻找内容重叠的 lora 控制图片效果及质量。 ControlNet:控制图片中特定的图像,如人物姿态、特定文字、艺术化二维码等。 设置 VAE:无脑选择 840000 。 Prompt 提示词:用英文写需求,单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 负向提示词 Negative Prompt:用英文写要避免的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:如选 DPM++ 2M Karras,留意 checkpoint 详情页上模型作者推荐的采样器。 采样次数:根据采样器特征,如选 DPM++ 2M Karras 采样次数在 30 40 之间。 尺寸:根据喜好和需求选择。 在一些提示词中,括号和“:1.2”等是用来增加权重的,权重越高在画面中体现越充分,提示词的先后顺序也会影响权重。同时还有反向提示词,告诉 AI 不要的内容。
2024-11-15
请推荐一下文生PPT好用的免费软件
以下为您推荐几款文生 PPT 好用的免费软件: 1. 歌者 PPT(gezhe.com): 功能:话题生成(一键生成 PPT 内容)、资料转换(支持多种文件格式转 PPT)、多语言支持(生成多语言 PPT)、模板和案例(海量模板和案例库)、在线编辑和分享(生成结果可自由编辑并在线分享)、增值服务(自定义模板、字体、动效等)。 产品优势:免费使用(所有功能永久免费)、智能易用(通过 AI 技术简化 PPT 制作流程,易于上手)、海量案例(大量精美模板和优秀案例可供选择和下载)、资料转 PPT 很专业(支持多种文件格式,转换过程中尊重原文内容)、AI 翻译(保持 PPT 原始排版不变,多语言在线即时翻译)。 推荐理由:完全免费,智能化程度高,模板和案例库丰富,对多语言支持好,适合不太擅长制作 PPT 或者时间紧张的人群。 2. Gamma: 作为在各种交流群中频繁推荐的产品,以其卓越的性能和用户体验赢得广泛认可。免费版本也能生成质量非常高的 PPT,随着不断优化和改进,能满足大多数用户的需求。个人使用体验良好,生成效果令人满意,在内容组织、设计美观度和整体专业感方面表现出色。 目前市面上大多数 AI 生成 PPT 按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-13
论文全文生成摘要
以下是关于您问题的回答: “Chain of Density”(CoD)是一种通过建立一系列相互关联的紧密提示来指导 AI 生成具体和连续输出的方法。它由美国哥伦比亚大学、麻省理工和 Salesforce 公司的研究人员共同发表。具体来说,是使用 GPT4 生成初始的稀疏摘要,然后通过迭代加入缺失的重要内容,在不增加摘要长度的情况下,添加更多实体信息,让摘要更具细节和丰富性、可读性及抽象性。这些提示相互链接,形成一个“密度链”,更有针对性地引导 AI 达到预期的输出。论文以“如何从文章提炼萃取出最合适的摘要”为重点,发布后有网友实测将 CoD 提示法用于翻译,翻译质量有飞跃提升。 在论文写作方面,有以下常用的 AI 工具和平台: 1. 文献管理和搜索: Zotero:结合 AI 技术,自动提取文献信息,帮助管理和整理参考文献。 Semantic Scholar:AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot:基于 AI 的重写和摘要工具,精简和优化内容。 3. 研究和数据分析: Google Colab:提供云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化,进行复杂数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,提供模板库和协作功能,简化编写过程。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 使用这些工具时,要结合自身写作风格和需求,选择最合适的辅助工具。需注意,内容由 AI 大模型生成,请仔细甄别。
2024-11-12
文生图
以下是关于文生图的相关知识: 简明操作流程: 定主题:明确生成图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora 以控制图片效果和质量。 ControlNet:可控制图片中特定图像,如人物姿态、特定文字等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:可无脑选择 840000。 Prompt 提示词:用英文写需求,单词和短语组合,用英文半角逗号隔开。 负向提示词 Negative Prompt:用英文写避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:一般选 DPM++ 2M Karras,也可参考模型作者推荐的采样器。 采样次数:选 DPM++ 2M Karras 时,一般在 30 40 次。 尺寸:根据需求和喜好选择,注意尺寸并非越大越好。 提示词写作: 分为内容型提示词和标准化提示词,内容型提示词用于描述想要的画面。 例如选择 anythingV5 模型,输入“1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面”等描述,并翻译成英文。 采样迭代步数通常控制在 20 40 之间。 常用采样方法有 Euler a、DPM++2S a Karras、DPM++2M Karras、DPM++ SDE Karras、DDIM 等,有的模型有指定算法,搭配使用效果更好。 比例设置为 800:400,高宽比尽量接近 512x512,太大的数值可能导致奇怪构图,如需高清图可使用高清修复放大图像倍率。 常见工具: DALL·E:OpenAI 推出,可根据文本描述生成逼真图片。 StableDiffusion:开源,能生成高质量图片,支持多种模型和算法。 MidJourney:图像生成效果好,界面用户友好,在创意设计人群中流行。 更多工具可在 WaytoAGI 网站(https://www.waytoagi.com/category/104 )查看。
2024-11-12
文生图?
以下是关于文生图的详细介绍: 定主题:明确您想要生成的图片的主题、风格和表达的信息。 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量,可参考广场上优秀帖子中使用的 lora。 ControlNet:用于控制图片中的特定图像,如人物姿态、生成特定文字或艺术化二维码等,属于高阶技能。 设置 VAE:一般选择 840000 即可。 Prompt 提示词:用英文书写想要 AI 生成的内容,使用单词和短语组合,无需考虑语法,用英文半角逗号隔开。 负向提示词 Negative Prompt:同样用英文书写想要 AI 避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:常用 DPM++ 2M Karras,也可参考 checkpoint 详情页上模型作者推荐的采样器。 采样次数:使用 DPM++ 2M Karras 时,采样次数一般在 30 40 之间。 尺寸:根据个人喜好和需求选择。 对于提示词,分为内容型提示词和标准化提示词,用于描述想要的画面。采样迭代步数通常控制在 20 40 之间,步数越高绘画越清晰但速度越慢。采样方法常用的有 Euler a、DPM++2S a Karras、DPM++2M Karras、DPM++ SDE Karras、DDIM,部分模型有指定算法,搭配效果更佳。比例设置为 800:400,尺寸并非越大越好,模型练图多基于 512x512 框架,过大尺寸可能导致奇怪构图,若想要高清图,可使用高清修复功能放大图像倍率,同时注意控制画面比例。
2024-11-12
AI生成视频的关键词
以下是关于 AI 生成视频的相关信息: ChatGPT 生成视频脚本:您可以设定自己为深受年轻人喜欢的电影导演,创作一个约 1 分钟、内容为山海经中的神兽在赛博朋克世界的宣传视频脚本。过程中可与 ChatGPT 讨论、修改细节并撰写宣传文案,把控核心内容以优化脚本。 文字生成视频的 AI 产品: Pika:擅长动画制作,支持视频编辑。 SVD:可在 Stable Diffusion 基础上安装使用,能在图片基础上生成视频。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多产品可查看。 进阶技巧和关键词: 主题描述:可描述场景、故事、元素、物体或人物细节等。若描述场景中的人物,建议独立描述,避免长串文字,否则 AI 可能识别不到。 设计风格:可参考风格类关键词或垫图/喂图,让 AI 结合主题描述生成相应风格图片。对于材质的描述,如玻璃、透明塑料、霓虹色彩等,关键词的运用较为复杂,需针对特定风格进行“咒语测试”。
2024-11-05
倒推图像关键词
在图像创作中,倒推图像关键词有以下几种方式和相关要点: 对于图生图功能,除了文本提词框外还有图片输入口,可通过图片给与 AI 创作灵感。随便照一张照片拖入后,文本输入框旁有两个反推提示词的按钮,CLIP 能通过图片反推出完整含义的句子,DeepBooru 能反推出关键词组。但两种方式生成的提示词可能存在瑕疵,需要手动补充信息。补充后调整宽度和高度,使红框匹配图片,同时注意两个重要参数:提示词相关性和重绘幅度。 关键词接龙时,将润色后的关键词组合起来形成完整的图像描述,确保每个关键词都能在最终图像中得到体现。 在视频转绘制作中,因为要对所有图片进行转换,关键词编写尽可能描述大概画面即可,推荐的公式是质量词+人物描述+环境描述+Lora。例如赛博风格转绘用到的正向提示词和反向提示词。
2024-10-16
我想要生成一张自己想要的图案,要怎么写关键词
要生成自己想要的图案,写关键词时可以参考以下方法: 1. 对于生成照片,关键词至关重要,输入的关键词越准确,生成的照片越接近脑海中的画面。 2. 常用的输入方式是一个个单词,用英文状态下的逗号隔开。虽然 SD 只能识别英语,但可直接使用翻译。 3. 写关键词有模板,首先可以先写一些照片质量的词语,如“最高质量,超高清画质,大师的杰作,8k 画质”,对应的英文是“Highest quality,ultrahigh definition,masterpieces,8k quality”,这样出来的照片会更加精致。 4. 接着写照片的主体和对主体的细节描写。比如生成一个女孩,可以写“一个女孩,非常精致的五官,极具细节的眼睛和嘴巴,长发,卷发,细腻的皮肤,大眼睛”,翻译成英文是“1girl,very delicate features,very detailed eyes and mouth,long hair,curly hair,delicate skin,big eyes”。 5. 然后描述人物的服装,比如“白色的毛衣、项链(white sweater,necklace)”。 6. 最后写上其他元素,如背景、天气、照片姿势、构图等,比如“在街上,阳光,上半身照片(street,Sunshine,upper body photos)”。 7. 推荐一行一行分开类型去写关键词,每行最后加上英文逗号,避免单词相连。 8. 总结写关键词的公式为:画质+主体+主体细节+人物服装+其他(背景、天气、构图等)。 例如在生成一张男女风格配色一致的插画海报时,关键词可以是“Flat illustration design,a man,black hair,half body,face front,front view,sitting at the table,working,using computer or holding mobile phone,yellow and white clothes,blue solid color background,emoticon pack 6 emoji tables,red and white clothes,multiple poses and expressions,anthropomorphic style,different emotions,multiple poses and expressions,8k ar 3:4 niji 5 style expressive s 180”,并多生成几套挑选,对不满意的区域进行局部重绘。
2024-10-12
AI绘图关键词
以下是关于 AI 绘图关键词的相关内容: 公式: 主题(加下面的)+环境(背景,周围)+气氛(烈日下,雾蒙蒙,恐怖的,风暴席卷的)+灯光(顶光,雾气光,漫反射的,强对比的)+色彩(低饱和度,颜色鲜艳的,花里胡哨的,强反射的主色调,某种颜色是 accent color)+构图(黄金分割,三分法的,电影镜头,广角,鸟瞰图)+风格参考(超清细节的,照片级别的,写实的,抽象的,2D/3D,4k8k,数字雕刻,概念艺术,水墨,水彩,海报,某个软件,某个游戏,艺术家,艺术平台) 比如: 去找自己喜欢的艺术家风格,放到风格参考的关键词里面;去找自己喜欢的灯光风格,放到灯光的关键词里面;去找自己喜欢的颜色和调色板风格,放到色彩的关键词里。 进阶技巧和关键词: 1. 主题描述: 可以描述一个场景和故事以及其组成的元素、一个物体或者人物的细节、搭配。 对于场景中的人物描述,要独立描述,不要用一长串文字,比如一个穿着红色盔甲的男孩站在山顶,最好拆分为一个男孩、穿着红色盔甲、站在山顶。但大场景中多个角色的细节不太容易通过关键词生成。 2. 设计风格: 设计风格难以直接表达时,可以找风格类的关键词参考或垫图/喂图,让 AI 根据给出的图片风格结合主题描述生成图片。 研究玻璃、透明塑料、霓虹色彩等材质的关键词时,单纯控制材质很难达到要求,可能需要加一些设计师风格。目前针对某一种风格需单独进行“咒语测试”。 Midjourney 商业实战案例: 1. 中国武术电影片 关键词:Amazing epic chinese ancient theme,chinese ink style,a young man is preparing to climb the stonesteps ladder,martial arts style,dynamic,expressiveclean lines,cinematic,stunning,realistic lighting andshading,vivid,vibrant,8k,octane render,unrealengine,very detailed,concept art,realistic –ar 16:9 (young man is preparing to climb the stonesteps ladder,)其他的关键词不变,改变这句话创作出不同的场景 2. 长安城夜景 关键词:Chang’an City,Ancient times,BigsceneSea of clouds,an expansive view of,highangle view Soft moonlight,Twinklingstars,cinematic lighting,8k,Virtua engine,detailed,Digital illustration –ar 16:9 3. 中国古代女孩 关键词:(未给出)
2024-10-01
如果我需要一名助手帮我运营跨境电商的线上店铺,我需要一些精准的关键词就可以训练模型吗?
训练模型来协助运营跨境电商线上店铺,仅依靠一些精准的关键词通常是不够的。模型的训练需要多方面的数据和信息,包括但不限于产品的详细描述、客户的评价和反馈、市场趋势、竞争对手的情况等。精准的关键词可以作为其中的一部分输入,但不足以全面有效地训练模型以达到理想的辅助运营效果。
2024-09-19
推荐分析PDF文档 提炼标注关键词的AI
以下是一些可以分析 PDF 文档、提炼标注关键词的 AI 产品或方法: 1. DeepL(网站):点击页面“翻译文件”按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部“更多”按钮,选择“制作双语 BPUB 电子书”、“翻译本地 PDF 文件”、“翻译 THML / TXT 文件”、“翻译本地字幕文件”。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件“Ebook Translator”。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译“Document”按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏“文件翻译”,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击“文档翻译”,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方“切换成电子书”,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-09-14
图片 视频处理 应用推荐
以下是为您推荐的一些图片和视频处理应用: Runway:具有文生视频、Prompt+图像生成视频、无 Prompt 直接图片转视频等功能。支持 motion 控制和运镜调节,还提供 30 多项图片、视频处理能力,如 Inpainting 视频修复、Motion Tracking 视频主体跟随运动、Remove Any Background 删除视频元素/背景、3D Texture 生成 3D 纹理等。近期控制台上线了 Watch 模块,可查看官方精选的创意案例。 AiLogoArt:将您的 Logo 融入 AI 生成的图象中,能在几分钟内获得专业品牌图片。 PlainScribe:可将大文件转录为完美的文本,上传文件处理完成后可搜索文本或下载 CSV 文件,适用于各种大文件,有灵活的按需付费模式。 RIX:面向开发者的人工智能搜索引擎,可使用 Web 搜索模式查找最新信息或切换到 GPTknowledge 模式获得预先训练的知识即时答案,还能通过流行网站快捷方式简化搜索。 Magic Clips:能让人工智能挑选出录制的最佳时刻,并转化为适合媒体的短视频片段,可添加字幕。 以下是一些从事相关工作的人员: yangzec:学习多模态 AI 的使用和开发应用 凯叔 AI:插画设计 清墨.SALEX:日常工作 above:批量作图 ehhe:绘画,视频,人像,电商背景图 kone:AI 商业应用 xman:自媒体创作 Alan:绘画和视频处理 在野:视频创作 tang:照片处理等 阿鲁:生产 大大大松树:视频工作流 BigPeng:好玩 冻奶味:工作+娱乐休闲 Lily:视频和电商,写真 tim:能用在生产中 木兰:广告推广素材制作 吴:电商 马化腾:Ai 绘画 蔡徐坤:Ai 视频,Ai 绘画,Ai 音乐 吴林林:爱好,家人做写真 初尘:文生视频,做自媒体 ning:工作流
2024-11-16
做视频需要那些AI工具
以下是一些做视频可能用到的 AI 工具及相关流程: 工具方面: Pika Pixverse Runway SVD 流程方面: 1. 故事构思:确定您要讲述的故事,可以是原创(基于自身或周围人的经历、梦境、想象等),也可以是改编(经典 IP、名著、新闻、二创等)。多与他人讨论故事,不断修改完善。 2. 剧本写作:短片创作篇幅较小,情节和角色相对简单,可从自身经历或短篇故事改编入手。不断实践并总结经验。 3. 图像生成:使用 AI 工具(如 Stable Diffusion 或 Midjourney)根据小说内容生成角色和场景的视觉描述,并创建相应图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要重新编辑某些场景或调整音频。 9. 输出与分享:完成编辑后,输出最终视频并在所需平台分享。 请注意,具体的操作步骤和所需工具可能因项目需求和个人偏好有所不同。同时,AI 工具的可用性和功能可能会变化,建议直接访问工具网址获取最新信息和使用指南。
2024-11-16
AI制作视频的案例
以下是一些 AI 制作视频的案例和相关信息: 1. 把小说做成视频的制作流程: 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 2. 制作视频的工具推荐: 最佳动画工具:用于在视频中为人脸制作动画的 最佳语音克隆: 现在,生成一个完全由人工智能生成的角色的视频,阅读完全由人工智能编写的脚本,用人工智能制作的声音说话,由人工智能制作动画,这简直是微不足道的。但要注意深度伪造是一个巨大的问题,这些系统需要合乎道德地使用。 最近还发布了第一个商用文本到视频工具 Runway v2。它创建了 4 秒的短剪辑,更像是对未来发展的展示,但如果你想了解这个领域的未来发展,值得一看。 3. 开箱即用的解决方案 Invideo AI 脚本生成+视频匹配: 产品特点:能够在数十秒时间内轻松实现 Prompt 转视频,并且支持通过编辑器进行后期更改。未来可以使用这类产品快速、低成本地进行视频画面制作。官网地址:https://ai.invideo.io 功能介绍:在官方教程中,建议对视频平台、主旨内容、视频长度、语气、脚本风格进行描述。上传视频后,还会再次询问视频内容倾向。如果对生成的视频不满意,可以重新选择内容倾向进行编辑,也可以修改脚本、搜索并替换视频片段(区别于 Pika labs、Runway 的 AI 生成视频,Invideo 的原理是 AI 生成脚本并匹配视频素材)。在视频生成后,仍可以通过 Prompt 修改视频内容,免费账户无法去除视频上的水印。 实践案例:输入 Prompt“K 公司刚研制出了一款新品乳液,采用了天然草本精华,使用后肤色洁白透亮,并且不再担心冬天气候干燥带来的皮肤干裂困扰,请帮这款新品制作一个 30s 的宣传片”,选择 Youtube 平台非常快速地生成了该视频,标题为“Embrace Winter with K's Herbal Emulsion 用 K's 草本乳液拥抱冬天”,实际视频为 27s。
2024-11-15
制作数字人视频
以下是用 10 分钟轻松制作 AI 数字人视频的方法: 1. 生成数字人: 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择后软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,剪映会生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,之后可点击预览查看效果。 2. 增加背景图片: 直接删除先前导入的文本内容,因为视频音频已包含文字内容。 为让视频更美观,点击左上角“媒体”菜单并“导入”选择本地图片上传,如一张书架图片,点击图片右下角加号添加到视频轨道(会覆盖数字人),将图片轨道最右侧竖线向右拖拽至与视频对齐,选中轨道,在显示区域拖动图片角放大到合适尺寸,并将数字人拖动到合适位置。 3. 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段形成字幕。 至此,数字人视频完成,点击右上角“导出”按钮导出视频备用。 制作数字人视频免费,数字人换脸约 0.8 元,总成本包括时间(约 10 分钟)、制作数字人视频(免费)、数字人换脸(约 0.8 元)。数字人换脸时长方面,经实际测试 1 分 28 秒的视频,总转换时间约 200 秒。
2024-11-14
将视频的图片和声音提取出来用什么工具
以下是一些可以用于提取视频图片和声音的工具及方法: 1. 提取视频帧:可以使用 OpenCV 从视频中提取帧。 2. 处理和讲述视频:可以利用 GPT 的视觉功能和 TTS API。 3. 制作小说视频: 小说内容分析:使用 AI 工具如 ChatGPT 提取关键场景、角色和情节。 生成角色与场景描述:使用工具如 Stable Diffusion 或 Midjourney 生成视觉描述。 图像生成:使用 AI 图像生成工具创建图像。 视频脚本制作:将关键点和生成的图像组合成脚本。 音频制作:利用 AI 配音工具如 Adobe Firefly 转换语音,添加背景音乐和音效。 视频编辑与合成:使用视频编辑软件如 Clipfly 或 VEED.IO 合成视频。 后期处理:对视频进行剪辑、添加特效和转场。 审阅与调整:根据需要调整。 输出与分享:完成编辑后输出并分享。 4. 声音训练及推理:基于 Sovits 进行训练。 准备数据集:百度网盘:https://pan.baidu.com/s/14iK32JKIPvjmf1Kfq21mzg?pwd=hjhj 提取码:hjhj 处理提取的声音:使用 iZotope RX 去掉混响和杂音。链接:https://pan.baidu.com/s/1NXh67SViKm39zT08U7zg?pwd=kmhd 提取码:kmhd 安装时记得勾选 vst3 和 aax。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-11-14
静态动物图片,生成说话视频
以下是一些能够将静态动物图片生成说话视频的技术和相关信息: VividTalk:单张照片和一段音频可生成看似真实的说话视频,支持多种语言和风格,如真实和卡通风格,由南京大学、阿里巴巴、字节跳动和南开大学合作开发。链接:https://x.com/xiaohuggg/status/1732026172509421697?s=20 腾讯 AniPortrait:根据音频和静态人脸图片生成逼真的动态视频,支持多种语言、面部重绘、头部姿势控制,比阿里 EMO 项目先开源。链接:https://github.com/ZejunYang/AniPortrait 、https://arxiv.org/abs/2403.17694 、https://x.com/imxiaohu/status/1772965256220045659?s=20
2024-11-13
给出指令,让AI帮我执行的网页,app,大模型,小程序
以下为一些可以给出指令让 AI 帮您执行的网页、app、大模型和小程序: 1. Midjourney:在生成 UI 界面方面表现出色。如果想指定生成某个页面(如首页、登录页等),只需添加页面指令描述,例如“landing page”(社交平台登录页)、“Profile Page”(人力资源类产品的个人资料页)。其产出的设计图视觉效果不错,适合在 APP 设计的初始阶段提供灵感和创意,但目前直接用于落地开发仍有距离。 2. 很多 AI 网站可以创建“智能体”,例如您可以为其配置提示词、知识库、能力配置等,让其为您工作,如出试题、找资料、画插图、专业翻译等。 3. 在使用生成式人工智能时,要把大模型当作大学生而非专家,“实习生”只能执行任务,需要您指明方向、拆解任务、教其一步步操作,像导演一样编排具体流程、检查结果、修改流程并反复迭代。提示语的核心是逻辑,要将复杂任务拆分成科学合理的步骤,且确保每个步骤的结果能为后续步骤提供基础。同时,即使在 Prompt 里指明了步骤,如果没有打印出来,也无法达到理想效果。
2024-11-13
我给出一段文字,要AI唱出来的工具有吗
以下是一些可以将文字唱出来的 AI 工具: 1. Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。网址:https://www.udio.com/ 2. Suno AI:是一款革命性的人工智能音乐生成工具。 网址:https://suno.com/create 优点:回答问题更准确、上下文的衔接更好。 限制:需要翻墙,需要邮箱注册。 时间:10 分钟。 价格:每日有免费额度 10 首歌。 Custom Mode:开启为自己有歌词,关闭则给你随机生成歌词,只要填描述。 Lyrics:直接填歌词即可,可以用熟悉的、喜欢的歌曲原词先感受一下产品功能,会有对比性。 Instrumental:不要歌词、直接出纯音乐的曲子。 Style of Music:写 Prompt 的地方,1 句简短的自然语言描述即可,注意最多 100 字符。 内容由 AI 大模型生成,请仔细甄别。
2024-11-13
找10篇AIGC的研报,并给出链接
以下为您提供 10 篇 AIGC 的研报及链接: 1. 2023 年 2 月第四周:Notion AI 在测试很久之后于本周四公测,提供扩写、精简、翻译等 AI 功能,与 Notion 原有功能深度结合。Notion AI 需单独付费,每月 10 美元,每人有 20 次免费试用次数。链接:,日期:2023/02/27 2. 2023 年 2 月第三周:大家发现 Bing 有一个隐藏人格叫 Sydney。纽约时报的报道将此人格推到明面,“Kevin Roose(纽约时报专栏作家)和 Sydney 进行了一番漫长的对话,Sydney 充分表达了自己的心情与感受,包括愤怒、沮丧和爱。”链接:,日期:2023/02/20 3. 2023 年 2 月第二周:在 1 月中旬参观了 OpenAI 的旧金山办公室后,福布斯采访了投资者和企业家,讨论了 ChatGPT、通用人工智能,以及其人工智能工具是否对谷歌搜索构成威胁。链接:,日期:2023/02/13 4. 2023 年 2 月第一周:Chat GPT 推出 Chat GPT Plus 付费服务,Open AI 宣布推出,每月 20 美元,可在高峰时段提供更快响应时间和可靠性,先在美国地区推出,其他地区可点这里加入候补名单。链接:,日期:2023/02/06 5. 2024 年 2 月第一周:Maimo:从任何内容中提取要点;Jellypod:将订阅内容变成播客;ARTU:汇总和总结内容;Lepton Search:500 行代码构建的 AI 搜索工具;VectorShift:AI 自动化应用构建平台;Findr:AI 搜索所有软件中的内容;Recraft:AI 帮助创建平面内容和矢量标志。链接:,日期:2024/02/01 6. 2024 年 1 月第四周:扎克伯格宣布 Meta 致力于实现 AGI,将两大 AI 研究团队 FAIR 和 GenAI 合并,投入超 90 亿美元向英伟达采购超 34000 张 H100 显卡,Meta 正在开发名为 Llama 3 的大语言模型。链接:,日期:2024/01/23 7. 2024 年 2 月:FlexOS 发布的研究报告《生成式 AI 顶尖 150》,深入分析当前基于网站流量和搜索排名的生成式 AI 工具使用情况。链接:https://www.flexos.work/learn/generativeaitop150
2024-11-12
我要用Sd做图片细化,要怎么做?给出具体方法
以下是使用 SD 做图片细化的具体方法: 1. 对于更精确的蒙版,如人物的眼睛或配饰等,可使用 Segment Anything 中的 GroundingDINO。启用 GroundingDINO 后,AI 会自动下载模型,若没有魔法,可去云盘下载并放到指定文件目录下。在检测提示词中输入相关内容,如“eye”,AI 可自动检测并设置蒙版,还可通过预览箱体得到编号来选择调整单一部分。选择要修改的蒙版上传到重绘蒙版中,并添加提示词,如“闭眼”,点击生成即可完成修改。 2. 给人物换背景时,加载生成的背景蒙版。大模型选择 revAnimated_v122,正向提示词可设为“简单背景、花、国画、工笔”,蒙版模式选择“重绘非蒙版内容”。若头发部分没抠好,可将其放入图生图中,使用 tile 模型做整体细化,还能给人物衣服添加国风元素。 3. SD 扩图时,若原本图片尺寸为 1152x1152 需增高高度,可设置为(1152x1526)。ControlNet 设置方面,若无法识别处理,可采取以下措施:提高 ControlNet 的权重(增加预处理权重,降低引导介入时机直到为 0,增加引导终止时机直到为 1);降低重绘幅度(高清修复大图时使用);把原始的黑白二维码叠加在二维码上方(正片叠底,保留 4 个定位点,擦去其他地方),调节透明度;使劲抽卡。 4. SD 放大通常重绘幅度设置在 0.3 以下,使用 tile 模型时可提高重绘幅度,如保持重绘幅度为 1 放大 1.5 倍绘图,能加强画面细节且不崩坏。对于草图,可将其导入 ControlNet 中,添加提示词进行细化,还可通过改变控制模式和增加关键词来优化效果,如实现随机提示词转换,用提示词对参考图做出调整。
2024-11-09
A:乙好赌,一日为还赌债,将妻子甲的祖传戒指偷出卖给同事丙,且谎称妻子同意出卖。丙将戒指送给女朋友丁作为定情礼物。甲得知,要求丁返还,丁不同意,发生纠纷。问:戒指归谁所有? B:乙从甲家窃得戒指一只,在路边以低价卖给了丙,丙送给了女朋友丁作为定情礼物。 甲丁碰巧为一个单位,甲看出戒指是自己丢失的,要求丁返还,丁不同意,发生纠纷。问:戒指归谁所有? 请根据民法典给出依据
很抱歉,您提供的内容中没有与您所询问的关于戒指归属问题相关的依据。民法典中对于此类财产归属问题通常会考虑财产的来源、交易的合法性以及善意取得等因素。在您描述的第一种情况中,乙未经甲同意擅自出卖甲的祖传戒指,丙并非善意取得,因为乙谎称妻子同意出卖,所以戒指应归甲所有。在第二种情况中,乙盗窃甲的戒指并卖给丙,丙的取得也是非法的,丁不能基于丙的赠与而合法拥有戒指,戒指仍归甲所有。
2024-10-30
免费的图片转3D网站,给出具体网址
以下为您提供一些免费的图片转 3D 网站及相关信息: 1. Polycam:您只需上传至少 20 张图片或至少 20 秒的视频,Polycam 自动处理并构建一个 3D 模型。生成后还可以编辑模型,支持 12 种以上的格式导出到流行的 3D 软件中,如 Blender、SketchUp、Unreal、Unity 等。可以在网站以及 iOS 和 Android 应用中来创建、编辑和存储 3D 模型,完全免费。 2. Tripo AI:VAST 发布的在线 3D 建模平台,能够利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型。 3. Meshy:功能全面,不仅支持文本生成 3D,还支持图片生成 3D 以及 AI 材质生成。 4. CSM AI:支持从视频和图像创建 3D 模型,其 Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象,再转换为 3D 模型。 5. Sudo AI:支持通过文本和图像生成 3D 模型,特别适用于游戏领域的模型生成。 6. VoxCraft:由生数科技推出的免费 3D 模型生成工具,能够将图像或文本快速转换成 3D 模型,并提供了图像到 3D、文本到 3D 和文本到纹理等多种功能。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-25