直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

可以生成原生动漫人物的AI软件

回答

以下是一些可以生成原生动漫人物的 AI 软件:

  1. 数字人的躯壳构建方面:
    • 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,代表软件是 Live2D Cubism(https://www.live2d.com/)。
    • 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高,代表有 UE(Unreal Engine)、Unity,虚幻引擎 MetaHuman 等。个人学习在电脑配置和学习难度上有一定门槛。
    • AIGC:虽然省去了建模流程,直接生成数字人的展示图片,但算法生成的数字人在 ID 一致性和帧与帧的连贯性上存在弊端。典型的项目有 wav2lip(https://github.com/Rudrabha/Wav2Lip)、video-retalking(https://github.com/OpenTalker/video-retalking)等。AIGC 还有一个方向是直接生成 2D/3D 引擎的模型,但该方向还在探索中。
  2. 生成式 AI 在艺术创作方面:
    • Lensa 可以生成肖像画等内容。
  3. 其他相关软件:
    • 百川智能 Baichuan-NPC 可以定制游戏角色和动漫人物,并融合角色知识库和多轮记忆,提供 Lite 和 Turbo 两种版本。
    • 阿里巴巴 FaceChain-FACT 支持零样本肖像生成,秒级速度,支持百余种定制模板,兼容 ControlNet 和 LoRA 插件。
    • BakedAvatar 可以从视频创建逼真 3D 头部模型,实时渲染和多视角查看,兼容多种设备,可交互性编辑。
    • DragNUWA 能够基于文本、图像和轨迹生成视频,用户绘制轨迹即可动态生成。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AI 数字人-定义数字世界中的你

数字人的躯壳就是建模过程,有多种构建方式:1.2D引擎风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,毕竟能将喜欢的动漫人物变成数字人的躯壳,是一件很棒的事情。2D引擎的代表就是Live2D Cubism(https://www.live2d.com/)。1.3D引擎风格偏向超写实的人物建模,拟真程度高,定制化成本高,目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体(如下图,NextHuman(https://nexthuman.cn/))。3D引擎的代表是UE(Unreal Engine)、Unity,虚幻引擎MetaHuman等(个人学习在电脑配置和学习难度上有一定门槛。1.AIGC虽然AIGC的方式相比前两者省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持ID一致性,帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高,可以使用这种方案(算法发展非常快,可能不久就会有连贯度很高的生成方式),典型的项目有wav2lip(https://github.com/Rudrabha/Wav2Lip)、video-retalking(https://github.com/OpenTalker/video-retalking)等。AIGC还有一个方向是直接生成2d/3d引擎的模型,而不是直接生成数字人的最终展示部分,但该方向还在探索中。得益于现有各类技术方案的成熟度,以往建模往往都是由专业的建模师完成工作,不久之后相信大家就可以通过一些生成算法快速生成自己的人物模型了。

生成式 AI:下一个消费者平台

生成式AI使我们能够将想象变为现实——做得好时,这简直像魔法一样。内容创作一直是生成式AI的第一个主流用例,正如我们在[Lensa](https://apps.apple.com/us/app/lensa-ai-photo-video-editor/id1436732536)所看到的那样。还记得你的社交媒体信息流曾被描绘成超级英雄、宇航员和动漫角色的朋友的照片淹没的时候吗?肖像画只是开始。生成式AI产品将服务于各种用例,从消费者“仅为了娱乐”地创造内容,到创作者或个体创业者通过内容实现盈利。我们已经看到生成式AI工具几乎在每一种媒介中推出:

XiaoHu.AI日报

1⃣️ 🤖三星AI家居机器人Ballie:-个人家庭助手,自主移动和任务完成。-连接控制家中智能设备。-学习用户习惯,提供个性化服务。🔗 https://x.com/xiaohuggg/status/1744708584854970868?s=20 2⃣️ 🎮 Convai游戏AI功能:-场景感知和NPC行动生成。- NPC语音对话交流和自主执行任务。-集成Audio2face和Riva ASR模块。🔗 https://x.com/xiaohuggg/status/1744694700010074126?s=20 3⃣️ 🌐阿里巴巴FaceChain-FACT:-零样本肖像生成,秒级速度。-支持百余种定制模板。-兼容ControlNet和LoRA插件。🔗 https://x.com/xiaohuggg/status/1744623826510741764?s=20 4⃣️ 🎭百川智能Baichuan-NPC:-定制游戏角色和动漫人物。-融合角色知识库和多轮记忆。-提供Lite和Turbo两种版本。🔗 https://x.com/xiaohuggg/status/1744613444853371237?s=20 5⃣️ 🚗大众汽车集成ChatGPT:- ChatGPT作为标准功能集成。-与IDA语音助手交互。-保障用户数据安全。🔗 https://x.com/xiaohuggg/status/1744609284724572387?s=20 6⃣️ 👤 BakedAvatar动态3D头像:-从视频创建逼真3D头部模型。-实时渲染和多视角查看。-兼容多种设备,交互性编辑。🔗 https://buaavrcg.github.io/BakedAvatar/ 🔗 https://x.com/xiaohuggg/status/1744591059169272058?s=20 7⃣️ 📹 DragNUWA在线视频生成:-基于文本、图像和轨迹生成视频。-用户绘制轨迹即可动态生成。

其他人在问
是AI聪明还是人的大脑聪明
AI 和人的大脑谁更聪明是一个复杂的问题,不能简单地一概而论。 从某些方面来看,AI 具有强大的计算能力和处理大量数据的能力,能够快速准确地完成特定任务。例如,在处理复杂的数学计算、大规模数据的分析和模式识别等方面表现出色。 然而,人的大脑具有独特的智慧和能力。大脑是一个混沌系统,具有创造性、适应性、情感理解、综合判断和复杂情境处理等能力。人类能够进行抽象思维、创新创造、理解情感和道德等方面的思考。 AI 是通过学习人类大脑结构来发展的,但目前仍存在诸多不足和缺陷。例如,大模型内部也是混沌系统,即使是科学家也无法解释其微观细节。 在绘画方面,人类的绘画创作通常是线性发展的过程,先学习线稿表达、色彩搭配、光影表现等,而 AI 是以积累数据、扩散噪声、再降噪收束的路径来生图,经常会在同一张图中呈现出不同绘画级别的细节。 总之,AI 和人的大脑各有优势和局限性,不能简单地判定谁更聪明。
2024-11-22
AI到底是什么
AI 是一门令人兴奋的科学,它是指某种模仿人类思维,可以理解自然语言并输出自然语言的东西。 对于不具备理工科背景的人来说,可以把 AI 当成一个黑箱,只需要知道它是能够理解自然语言的存在即可。其生态位是一种似人而非人的存在,即便技术再进步,这一生态位也不会改变。 从历史角度看,最初计算机是按照明确定义的程序来运算的,但对于像从照片判断人的年龄这类无法明确编程的任务,就需要人工智能来解决。 在应用方面,AI 健身是利用人工智能技术辅助或改善健身训练和健康管理的方法,能根据用户情况提供定制化训练计划和建议。比如 Keep、Fiture、Fitness AI、Planfit 等都是不错的 AI 健身工具。
2024-11-22
AI知识库工具
以下是为您提供的关于 AI 知识库工具的相关信息: WayToAGI(通往 AGI 之路): 这是由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库。 大家贡献并整合各种 AI 资源,让人们能轻松学习 AI 知识,应用各类 AI 工具和实战案例。 提供一系列开箱即用的工具,如文生图、文生视频、文生语音等的详尽教程。 追踪 AI 领域最新进展并时刻更新,无论您是初学者还是行业专家,都能在此发掘有价值的内容。 网址:https://waytoagi.com/ 体验链接:https://waytoagi.com/ 知识库在 AI 模型中的作用: 知识库就像 AI 的“活字典”,是一个非常贴切的比喻。 能解决 AI 知识“过期”的问题,AI 可随时从更新的知识库中检索相关信息,给出更准确的回答。 例如可建立包含最新新闻、科技发展、法律法规等内容的知识库,让 AI 回答最新事件的问题。 像热门的 AI 搜索,就是将整个互联网的实时数据作为知识库,通过搜索引擎获取最新信息。 产品经理 AI 工具集: 用户研究、反馈分析:Kraftful(kraftful.com) 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 画原型:Uizard(https://uizard.io/autodesigner/) 项目管理:Taskade(taskade.com) 写邮件:Hypertype(https://www.hypertype.co/) 会议信息:AskFred(http://fireflies.ai/apps) 团队知识库:Sense(https://www.senseapp.ai/) 需求文档:WriteMyPRD(writemyprd.com) 敏捷开发助理:Standuply(standuply.com) 数据决策:Ellie AI(https://www.ellie.ai/) 企业自动化:Moveworks(moveworks.com)
2024-11-22
我想做ui设计来模仿微信做一个app,想找各种图标素材 怎么用ai找这些素材
以下是使用 AI 找模仿微信做 App 所需图标素材的方法: 1. 对于直播礼物风格图标:可以在素材网站上找到喜欢的 icons 风格,然后喂图给 Midjourney 机器人,并加上关键词,如“喂图 + 耳机图标等。 2. 对于主题应用 icons:使用关键词“icon design,light texture,glow,Dribbble,3D,frostedglass effect,3d,ui,ux,–upbeta –q 2 –v 4”。 3. 对于 B 端图标:可以喂图加上关键词“A data icon,blue gradient frosted glass,frostedglass building,white transparent technology sensewhite city building scene,data line link,chip,OCrenderer,big data,industrial machinery,high detailight gray background with simple linear details,studio lighting,3d,c4d,pure white background,8k”。 4. 对于音乐软件 UI 设计:使用关键词“music app ui design,ux design,white,light,bright,data,modern,smooth,behance,dribbble,–upbeta –q 2 –v 4”。 需要注意的是,Midjourney 生成的图片可能在某些方面不够规范或完善,只能作为风格参考。
2024-11-22
怎么用ai写脚本
以下是关于如何用 AI 写脚本的一些指导: 首先,明确您要写的故事类型和来源。故事来源可以有两种路径: 1. 原创(直接经验):包括您或您周围人的经历、您做过的梦、您想象的故事等等。 2. 改编(间接经验):比如对经典 IP、名著、新闻进行改编或二创。 在剧本写作方面: 编剧是有一定门槛的手艺,不能单纯依赖剧作理论和模板,而应先大胆地写和实践,再结合看书学习,不断总结经验。对于短片创作,由于篇幅较小、情节和角色相对简单,可以从自己或朋友的经历改编入手,或者对触动您的短篇故事进行改编。多与他人讨论您的故事,有助于修改和进步。 如果您想用 AI 把小说做成视频,大致的制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说,提取关键场景、角色和情节。 2. 生成角色与场景描述:利用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:借助 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,并添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,提升视频质量。 8. 审阅与调整:观看视频,根据需要调整某些场景或音频。 9. 输出与分享:完成编辑后,输出最终视频并在所需平台分享。 需要注意的是,具体操作步骤和所需工具可能因项目需求和个人偏好有所不同,AI 工具的可用性和功能也可能变化,建议访问相关工具网址获取最新信息和使用指南。 另外,对于担心 AI 削弱孩子思考力的问题,如果使用方法正确,AI 反而能助力拓展思维边界。比如将提问方式从封闭性改为开放性,或者让 AI 帮助提出更多拓展思考的问题。在 AI 辅助写作文时,可以让孩子提交与 AI 共同完成作文的聊天记录,重点关注孩子能否说清 AI 作文的优缺点以及如何修改。
2024-11-22
如何起步开始学习ai设计
以下是关于如何起步开始学习 AI 设计的一些建议: 1. 阅读相关文章: 如 ,了解市场动态和生成式 AI 商业模式的相关问题。 ,认识到尽早学习的重要性,避免被其他熟练掌握 AI 动力设计技巧的设计师超越。 ,了解设计的当前状态、常见问题及实用技巧。 ,学习最佳实践和利用 UX 策略使 AI/ML 系统更易于解释和透明。 2. 利用工具: 了解星流一站式 AI 设计工具,在入门模式下,熟悉右侧生成器的图片参考部分,如快速参考、风格迁移、Tile 分块、重新上色等功能。 掌握基础模型,包括星流通用大模型及基础模型 F.1、基础模型 XL、基础模型 1.5 等,了解它们在效果和生成速度上的差异。 了解增强模型,可通过收藏、查看例图和选择风格等方式进行使用。
2024-11-22
Midjourney生成知名动漫或卡通形象受限制了么?
Midjourney 在生成知名动漫或卡通形象时存在一定的限制。例如,在生成角色方面,最好不要生成过多角色,过多甚至可能指 2 个。做人、做动物的情况还好,但对于有拟人角色需求的情况,可能难以生成满意的结果。比如小龙喷火到小兔子举着的礼物盒这种看似简单的需求,可能无法达到满意效果,可能出现动物不拟人或龙的体型超大等情况。对于像中国龙这种数据样本较少的形象,生成符合要求的图很有挑战性。 在视频生成方面,如果想让角色做出一些较大的动作,比如转头、掉眼泪、抬手或更生动的表情变化,现有的技术还不够成熟,还需要更先进的技术、更丰富的数据和更强大的计算能力。此时的策略是尽量规避制作需要大动作表现的视频,如果实在避免不了,可以尝试制作一些只涉及小动作的场景,然后通过加入台词和场景描述来补充细节和深度,帮助观众更好地理解场景背景和角色心理,以弥补视觉上的不足。
2024-10-29
动漫风格的数字人
以下是关于动漫风格数字人的相关信息: 构建动漫风格数字人的躯壳有多种方式: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,能将喜欢的动漫人物变成数字人的躯壳。代表如 Live2D Cubism(https://www.live2d.com/)。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高。代表有 UE(Unreal Engine)、Unity,虚幻引擎 MetaHuman 等,但个人学习在电脑配置和学习难度上有一定门槛。 3. AIGC:省去了建模流程,直接生成数字人的展示图片,但算法生成的数字人很难保持 ID 一致性,帧与帧的连贯性上会让人有虚假的感觉。典型的项目有 wav2lip(https://github.com/Rudrabha/Wav2Lip)、videoretalking(https://github.com/OpenTalker/videoretalking)等。AIGC 还有一个方向是直接生成 2D/3D 引擎的模型,但该方向还在探索中。 建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。 另外,【SD】一键切换不同画风中也包含动漫风格,例如“花丛中的小猫”。
2024-10-29
动漫生成
以下是关于动漫生成的相关内容: Niji V5 动漫提示干货操作实例: 在通过 Midjourney 创作动漫时,可在提示中包含动漫艺术家、漫画艺术家或漫画家的名字,如宫崎骏、织田荣一郎、竹内直子、井上武彦、平井恒、松本纪夫、藤本浩、勇吉成、樱桃子等。 示例提示:“一个穿着传统日本服装的女孩,旁边有白狼,站在一个神奇的托里神社前,artgerm,吉卜力工作室— ar 3:2 — niji 5”,可创建出相应的动漫画面。 对比 Niji V4 和 Niji V5,Niji Version 5 在细节和艺术风格上表现更优。 动态叙事动画生成器: 系统架构: 处理与分析层:负责处理用户输入并分析内容,包括 Prompt 解析器、实体识别、场景理解、情感分析等。 生成与渲染层:将分析结果转换为视觉内容,包括分镜生成器、动画引擎、后处理单元。 优化与反馈层:确保生成的视频满足用户需求并根据反馈优化,包括质量评估、性能监控、反馈循环。 技术支撑层:为系统提供技术支持和基础设施,包括数据管理、计算资源、API 和接口。 方案效果: 系统处理流程: Prompt 解析器解析关键信息。 分镜生成器根据信息生成分镜脚本,如不同季节的场景和人物动作。 视频渲染引擎将分镜脚本转换为视频帧并渲染,添加色调、光影、背景音乐和声音效果。 用户交互界面供用户输入 Prompt 并选择参数、预览和下载视频。
2024-10-28
我有张动漫风格图片,有什么 ai 可以仿制出来吗,我要的是在网页就可以直接使用 门槛低的 我是小白
以下为您推荐一些门槛低、可在网页直接使用的仿制动漫风格图片的 AI 工具和网站: 吐司网站:首页最上方有对话生图的快速入口,输入想画的文字或点击随机提示词,点击“对话生图”即可出图。站内所有帖子均可“一键做同款”,还有“今日灵感”提供绘画想法。有多种模型、lora 可供选择,如写实、2.5D、二次元等,涵盖风格、元素、形象等。还有控制线条、深度、姿态、语义、风格迁移等的 Controlnet 功能。同时有扩图、高清修复、去背景等多个设计小工具,以及趣味玩法和风格滤镜,一键真人转动漫,包括韩漫、日漫风格。使用小工具前请阅读标题和详情页描述。 扣子网站:输入一个关键词,会直接生成 4 张包含金句的图片。整个工作流程包括用户输入关键词,大模型制作金句,根据金句生成画面描述,结合描述和关键词使用插件生成图片,再用图像流结合金句和图片。但扣子官方的画图工具绘制小林漫画风格效果不佳,可尝试使用 MJ 等工具绘制小林漫画风格。
2024-10-21
我有一张动漫风格的图片,希望可以生成类似的图片
以下是为您生成类似动漫风格图片的方法和相关信息: 方法一: 使用大模型和 lora 的组合。 大模型:“Flat2D Animerge”,适合生成卡通动漫图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复时可拉到 11)。 lora:“Chinese painting style”可增加中国画水彩风格效果,权重设置为 0.4;“Crayon drawing”可添加简单线条和小孩子的笔触,权重设置为 0.8。 操作步骤:将图片丢到标签器中反推关键词,发送到“文生图”。在正向提示词末尾添加上述 lora,设置好尺寸,重绘幅度开 0.5(若想更接近原图可降低数值)。将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。 方法二: 利用 DALLE 中的 Seed 值。 DALLE 每次通过 Prompt 生成图像时会随机选取一个 Seed 值。使用同样的 Prompt 和 Seed 值能生成相同或相似的图片。您可以按照以下步骤进行测试: 1. 新开一个对话,随便使用一个 Prompt 让 DALLE 画图,要求提供 Seed。 2. 查看图片的 Prompt 并复制。 3. 在当前对话输入上一条 Prompt,另起一行输入“Use seed number '您在第一步拿到的 Seed'”。 好用的图生图产品: 目前比较成熟的产品主要有: 1. Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果很好。 但这些 AI 模型仍存在一些局限,如偶尔性能不稳定、生成内容不当等问题,使用时请仔细甄别。
2024-10-21
怎么用AI绘制一个我指定的动漫人物原型的各类图片,例如日漫《好想告诉你》中的黒沼爽子
要使用 AI 绘制指定的动漫人物原型,如日漫《好想告诉你》中的黑沼爽子,您可以按照以下步骤进行: 1. 选择合适的 AI 绘画工具:目前有许多在线的 AI 绘画平台和软件可供选择,例如 DALL·E2、StableDiffusion 等。 2. 明确描述特征:在输入描述时,尽可能详细地描述黑沼爽子的外貌特征,包括发型(如黑色的长直发)、眼睛(如大而明亮的眼睛)、服装(如校服的款式和颜色)、表情(如羞涩的微笑)等。 3. 参考相关图片:如果可能,找到黑沼爽子的官方图片或其他粉丝绘制的作品,作为参考提供给 AI 绘画工具,以帮助其更好地理解您的需求。 4. 不断调整和优化:根据生成的初步结果,对描述进行调整和优化,例如修改某些特征的描述、增加更多细节等,以获得更符合您期望的图片。 需要注意的是,AI 绘画的结果可能会受到多种因素的影响,不一定能完全符合您的预期,但通过不断尝试和优化,您有机会获得较为满意的作品。
2024-10-17
根据原生二维码生成一个二维码生成一个艺术二维码
以下是根据您的需求生成艺术二维码的方法: 1. 准备工作: 前往草料网(https://cli.im/)生成自己所需内容的二维码。例如制作公众号二维码,上传原码后进行简单设置,如选择白底黑块,调整容错率(如 30%)和尺寸(如 500500px),还可进行二维码美化,选择不同形状的码眼,将码边距换成 4 个色块以扩大白色边框范围。调整好后生成并下载。 2. 安装插件与解码: 在扩展列表中搜索“QR Toolkit”并安装,安装完成后重启 webui。 打开界面,在上方的选项卡中找到该插件。 进入草料网,点击右侧的解码,上传二维码得到解码结果,并将其粘贴入插件中,以调整二维码。 3. 利用模型与调整参数: 将二维码发送到 controlnet,使用 qrcode_monster 模型,权重值保持在 1.2 1.5 之间,值越大二维码越清晰,值越小融合度更好。 通过调整参数对二维码的外观、容错率、尺寸、噪点等进行改造。 4. 设计提示词: 例如使用提示词“Rackflower,blue flower,chibi,1girl,rainbow color hair,cloud,,in garden,bokeh background,masterpiece,ultra realistic,32k,extremely detailed CG unity 8k wallpaper,best quality,”来生成艺术二维码。 此外,还有一个艺术二维码制作活动: 活动时间为 2024 年 5 月 13 日至 2024 年 5 月 18 日。 活动目标是确保群里每个人都能学会制作艺术二维码,提升个人设计技能,促进群内交流互动。 活动内容是利用提供的二维码将其转换成艺术二维码,需满足美观、可扫、长按可识别的条件。 参与方式是使用 SD 对基础二维码进行艺术化设计,并将设计好的艺术二维码保存为图片格式发送至 SD 学社微信群。 作品收集会创建一个在线文档,用于收集大家的作品。 评选方式是在 5 月 19 日举行群内投票,选出前三名最受欢迎的艺术二维码作品。 注意事项包括设计需原创,不得侵犯他人版权或商标,提交的作品视为允许在群内公开展示,并在截止日期前提交。 您也可以使用 https://www.waytoagi.com/ 自己生成二维码。
2024-09-27
有哪些在北京的ai原生公司
以下是一些在北京的 AI 原生公司及相关大模型: 百度:文心一言,链接为 https://wenxin.baidu.com/ 抖音:云雀大模型,链接为 https://www.doubao.com/ 智谱 AI:GLM 大模型,链接为 https://chatglm.cn/ 中科院:紫东太初大模型,链接为 https://xihe.mindspore.cn/modelzoo/taichu/introduce 百川智能:百川大模型,链接为 https://www.baichuanai.com/ 此外,在北京还有一些个人在 AI 领域有所涉足,例如: 梦醒:软件工程师,是网络安全和软件开发从业者,AI 新手,正在学习 coze 智能体及 AI 视频制作,对 AI 领域很有兴趣。 大可:高管,AI 探索者,目前在运营一民政注册 AI 与算力联盟,做过记者、公务员、上市公司高管。 Laura:投资人,互联网经济研究咨询出身,互联网连续创业者,企业创新战略顾问。投资了两个人工智能算法项目,参投了一个智算中心。家住通州,喜欢唱歌。
2024-09-25
现在有哪些GenAI原生应用验证了PMF?
目前,一些 GenAI 原生应用已展现出产品市场契合度(PMF)的早期成功迹象。例如,ChatGPT 成为增长最快的应用,在学生和开发者中具有很强的产品市场契合度;Midjourney 成为集体创意的灵感来源,据报道仅 11 人的团队就实现了数亿美元的收入;Character 推动了 AI 娱乐和伴侣领域的发展,创造了用户平均在应用中花费两小时的消费者“社交”应用。然而,尽管有这些成功案例,仍有许多 AI 公司尚未实现产品市场契合度(PMF)或拥有可持续的竞争优势,整个 AI 生态系统的繁荣也并非完全可持续。
2024-08-30
可以根据照片生成人物的AI软件
以下是一些可以根据照片生成人物的 AI 软件: PhotoMaker:可以根据文字描述生成人物照片,能混合不同人物特征创造新形象,还能改变照片中人物的性别、年龄。访问链接:https://photomaker.github.io ,https://x.com/xiaohuggg/status/1746861045027869072?s=20 HeyGen:通过上传照片或文字提示,即可生成个性化 AI 数字形象视频。支持自定义肢体动作、服装、背景、年龄、性别等特征。仅需 1 分钟即可生成包含脚本、声音和情感表达的数字人视频。访问链接:https://x.com/imxiaohu/status/1852317866038809035
2024-11-22
可以根据照片,生成漫画人物的AI软件
以下是一些可以根据照片生成漫画人物的 AI 软件和相关信息: HeyGen 推出了基于照片生成数字人的新功能,您可以上传照片或输入文字提示来生成个性化的 AI 数字人形象。能选择性别、年龄、种族,定制肢体动作、服装、姿势和背景,支持脚本编辑,提供多种声音和情感表达,一分钟即可生成视频。详情链接: 在使用过程中,如果生成了自己比较满意的图,一定要记得存起来。下次想要同种类型的就可以直接拿来喂图,效果要比重新找的好很多。
2024-11-22
可以生成人物的AI软件
以下是一些可以生成人物的 AI 软件: 1. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色。它运用深度学习算法生成高质量的肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:这是一个 AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:这是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。 在剪映中生成数字人的步骤如下: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,剪映 App 会生成对应音视频并添加到轨道中。左下角会提示渲染完成时间,可点击预览查看效果。 关于数字人的相关算法开源代码仓库有: 1. ASR 语音识别: openai 的 whisper:https://github.com/openai/whisper wenet:https://github.com/wenete2e/wenet speech_recognition:https://github.com/Uberi/speech_recognition 2. AI Agent: 大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分可使用 LangChain 的模块去做自定义,基本包含了 Agent 实现的几个组件 3. TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多分支版本。 sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注于唱歌。 除了算法,人物建模模型可通过手动建模(音频驱动)或者 AIGC 的方式生成人物的动态效果(例如 wav2lip 模型)实现。但这种简单的构建方式还存在一些问题,比如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应动作、数字人如何使用知识库做出某个领域的专业性回答等。 请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-11-22
如果我想让快速提取网页内容,并将其中的数据提取为表格或文档,我应该使用哪一款AI软件?
以下是一些可以帮助您快速提取网页内容并将数据提取为表格或文档的 AI 软件及相关建议: 1. 利用 AI 搜索与权威网站结合获取关键数据,AI 可辅助提取结构化表格数据或编写抓取程序。但要注意,信息收集过程中,AI 仅作辅助,最终内容需人工主导校验,避免误导性结论。 2. 对于数据处理,可以借助传统工具如 Excel,结合 AI 指导高效操作数据筛选与图表生成。 3. 分析与撰写时,通过整理数据,利用 AI 辅助分析后撰写报告初稿,可指定风格并校验数据与结论准确性。 此外,Mistral 发布了全新聊天应用,基于 Pixtral Large 124B 多模态模型,支持网络搜索、写作画布与 Flux Pro 图像生成功能。其网络搜索工具可获取最新信息,写作画布功能适合文档创作与协作,高质量图像生成工具 Flux Pro 支持免费使用。您可以通过在线体验: 了解更多。
2024-11-22
推荐一款国内不错的AI视频生成软件
以下为您推荐几款国内不错的 AI 视频生成软件: 1. 可灵:在 AI 视频生成领域表现出色,具有以下优势: 卓越的视频生成质量,与国际顶级模型相当,能满足普通用户和专业创作者的需求。 生成速度快,处理效率高于国外同类产品,提升用户工作效率。 对国内用户可访问性强,提供便捷、稳定的使用体验。 2. Hidreamai:有免费额度,支持文生视频、图生视频,提示词使用中文、英文均可,文生视频支持多种控制,可生成 5s 和 15s 的视频。网址:https://hidreamai.com//AiVideo 3. ETNA:由七火山科技开发,可根据简短文本描述生成相应视频内容,生成视频长度 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps,支持中文,时空理解。网址:https://etna.7volcanoes.com/ 此外,还有 Pika、SVD、Runway、Kaiber、Sora 等国内外提供此类功能的产品,您可以根据自己的具体情况进行选择。更多的文生视频网站可查看: 需注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-22
知识库软件有什么推荐的吗
以下是为您推荐的一些知识库软件: 稿定 AI:国内设计工具稿定推出的 AI 创意工具合集,包括设计宣传图、绘图、素材、商品图、文案、AI 圈等功能,能切中国内内容营销的痛点,体验良好。 OpenCat:由开发,推出了付费订阅计划,每月 18 元可无限使用 GPT3.5 及一些软件的高级功能,如 iCloud 同步、AI 键盘等。 Tana:非常强大的知识管理软件,推出了 AI 相关功能,不仅能扩写文本,还能与您的所有数据交互并访问网上信息。 Read Speak:由开发的利用 ChatGPT 联系口语的 APP,支持与虚拟角色对话边学边练,具有实时发音评价、实时语法纠错等功能。 STUDIO AI:AI 驱动的无代码网页构建工具,能学习用户反馈并将设计转化为实际网站,内含 WebDesignAI,具有自动补全样式和内容的功能,支持语音控制编辑器完成日常设计任务。 Clarity:AI 驱动的分层阅读工具,提供分层的深度阅读功能,用户可从摘要开始掌握复杂主题,通过点击相应内容了解更多细节。 如果您想搭建个人知识库,还可以参考文章,忽略本地部署大模型环节,直接看其中推荐的软件。但使用时可能需要对接一些额外的 API,建议先了解 RAG 的原理再使用。
2024-11-22