Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

9月份AI技术有哪些进展

Answer

以下是 9 月份 AI 技术的一些进展:

  1. 9 月 AI 圈内发生了多起趣事和事件,包括 Cursor 编程软件的爆红、Runway 删除开源的 Stable Diffusion v1.5、国产 AI Bot 类产品留存率不足 1%等。
  2. 众多新模型和功能接连发布,如 DeepSeek、OpenAI 和 Meta 有新的进展,以及 AI 编程工具不断竞争。
  3. 行业关注度持续上升,尤其是 Cursor 的成功引发广泛讨论,显示 AI 编程工具仍在快速发展。
  4. 吴恩达深入探讨了 AI 技术的最新发展和未来方向,重点关注 Agentic Workflow、模型架构、推理速度和基础设施。他介绍了 Agentic Workflow 的优势,强调 AI 能够自主回顾和修复错误,提高系统稳定性。以斯坦福大学的演示为例,AI Agent 在网络搜索失败时自动切换到维基百科,展示了其适应性。
  5. 关于模型架构,吴恩达认为现有的 Transformer 模型已经表现良好,虽然新架构值得研究,但不是必需的。他强调提高快速推理和生成控制能力更为关键。
  6. 推理速度被视为当前 AI 应用的主要瓶颈。吴恩达指出,显著提高推理速度(如从 25 分钟缩短到 2 分钟)将极大改善用户体验,推动 AI 应用发展。
  7. 在讨论 AI 基础设施时,吴恩达认同增加训练投资可能提高模型效率的观点。他提到一些公司正在开发高效的 token 生成技术,并提出了训练和推理基础设施是否应分离的问题,暗示这可能需要新的架构支持。
Content generated by AI large model, please carefully verify (powered by aily)

References

4.4 历史更新

[title]4.4历史更新[heading2]2024年9月[heading3]9月30日《[9月:AI圈的乌龙、趣事与新闻](https://mp.weixin.qq.com/s/xl0b_dxwswnSDKZ2M-TzUA)》作者南乔River,9月AI圈内发生了多起趣事和事件,包括Cursor编程软件的爆红、Runway删除开源的Stable Diffusion v1.5、国产AI Bot类产品留存率不足1%等。众多新模型和功能接连发布,如DeepSeek、OpenAI和Meta的进展,以及AI编程工具的不断竞争。行业关注度持续上升,尤其是Cursor的成功引发广泛讨论,显示AI编程工具仍在快速发展。

通往 AGI 之路

[title]通往AGI之路[heading1]🎏近7日更新日志[heading3]9月30日《[9月:AI圈的乌龙、趣事与新闻](https://mp.weixin.qq.com/s/xl0b_dxwswnSDKZ2M-TzUA)》作者南乔River,9月AI圈内发生了多起趣事和事件,包括Cursor编程软件的爆红、Runway删除开源的Stable Diffusion v1.5、国产AI Bot类产品留存率不足1%等。众多新模型和功能接连发布,如DeepSeek、OpenAI和Meta的进展,以及AI编程工具的不断竞争。行业关注度持续上升,尤其是Cursor的成功引发广泛讨论,显示AI编程工具仍在快速发展。

课代表笔记:吴恩达 & 李沐对AI的见解(8月总结版)

1.吴恩达深入探讨了AI技术的最新发展和未来方向,重点关注Agentic Workflow、模型架构、推理速度和基础设施。他介绍了Agentic Workflow的优势,强调AI能够自主回顾和修复错误,提高系统稳定性。以斯坦福大学的演示为例,AI Agent在网络搜索失败时自动切换到维基百科,展示了其适应性。2.关于模型架构,吴恩达认为现有的Transformer模型已经表现良好,虽然新架构值得研究,但不是必需的。他强调提高快速推理和生成控制能力更为关键。3.推理速度被视为当前AI应用的主要瓶颈。吴恩达指出,显著提高推理速度(如从25分钟缩短到2分钟)将极大改善用户体验,推动AI应用发展。4.在讨论AI基础设施时,吴恩达认同增加训练投资可能提高模型效率的观点。他提到一些公司正在开发高效的token生成技术,并提出了训练和推理基础设施是否应分离的问题,暗示这可能需要新的架构支持。

Others are asking
知识库中已有的ai工具按能力分类列举
以下是知识库中已有的 AI 工具按能力分类列举: 工具入门篇 数据工具: 多维表格小白之旅 适用人群:Excel 重度使用者、手动数据处理使用者、文件工作者 简要说明:用表格+AI 进行信息整理、提效、打标签,满足 80%数据处理需求 编程工具: Cursor 的小白试用反馈 适用人群:0 编程经验、觉得编程离我们很遥远的小白 简要说明:通过 AI 工具对编程祛魅,降低技术壁垒 音乐工具: Suno 的小白探索笔记 适用人群:0 乐理知识、觉得作词作曲和我们毫不相关成本巨大的小白 简要说明:AI 赋能音乐创作,无需乐理知识即可参与音乐制作 100 个 AI 应用 81 100: AI 菜谱口味调整工具 已有产品:下厨房口味调整功能 一句话介绍:根据用户反馈调整菜谱口味。 AI 语言学习纠错平台 已有产品:英语流利说纠错功能 一句话介绍:帮助语言学习者纠正错误。 AI 电影剧情分析系统 已有产品:豆瓣电影剧情分析工具 一句话介绍:分析电影剧情,提供深度解读。 AI 办公文件分类系统 已有产品:腾讯文档分类功能 一句话介绍:自动分类办公文件,方便管理。 AI 美容护肤方案定制平台 已有产品:美丽修行定制方案功能 一句话介绍:根据用户肤质定制护肤方案。 21 40: AI 菜谱生成平台 已有产品:豆果美食 APP 一句话介绍:根据用户口味和现有食材生成个性化菜谱。 AI 语言学习助手 已有产品:沪江开心词场 一句话介绍:辅助用户学习语言,提供个性化学习方案。 AI 电影推荐系统 已有产品:爱奇艺智能推荐 一句话介绍:根据用户喜好推荐电影,发现优质影片。 AI 办公自动化工具 已有产品:WPS Office 一句话介绍:提高办公效率,实现自动化办公流程。
2025-01-23
我是一名小说家,需要ai帮助
以下是关于小说家利用 AI 进行小说创作的相关内容: 南瓜博士在人机协作小说创作中有着丰富的经历。除了无名猫视角的获奖作品,还为 LLM 小说比赛尝试了多种方法,包括编写 agent flow 框架让 AI 自动按步骤写作和评判,但因无法认同 AI 的审美而放弃。之后选择在 GPT 页面上对话,先让 AI 生成大量创意,自己进行判断挑选,写作时 AI 勤勤恳恳,自己负责掌舵,最后给出改进意见由 AI 遵循修改。 在具体创作过程中,为确保文章前后一致,先让 AI 写故事概要和角色背景介绍并略作修改。让 AI 以表格形式输出细节描述有三个好处:打破叙事习惯避免陈词滥调;按编号做局部调整容易;确保内容都是具体细节。然后把生成的表格依次复制粘贴让 AI 写文章,偶尔需要自己给建议。 在修改环节,小说大赛要求作品不能改动且不能超 2000 字,让 GPT4 改时它很快暴露出记性不好的缺点,求助 Claude 时关键情节被改没。总之,小说创作中,人有人的用处。
2025-01-23
有什么免费的制作思维导图的AI
以下是一些免费的制作思维导图的 AI 工具: 1. GitMind:免费的跨平台思维导图软件,支持多种模式,可通过 AI 自动生成思维导图。 2. ProcessOn:国内思维导图与 AIGC 结合的工具,能利用 AI 生成思维导图。 3. AmyMind:轻量级在线思维导图工具,无需注册登录,支持自动生成节点。 4. Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路、生成文章大纲。 5. TreeMind:“AI 人工智能”思维导图工具,输入需求由 AI 自动完成生成。 6. EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,提升生产力。 此外,以下是一些可以绘制逻辑视图、功能视图、部署视图的工具: 1. Lucidchart:流行的在线绘图工具,支持多种视图创建,有拖放界面。 2. Visual Paradigm:全面的 UML 工具,提供多种视图创建功能。 3. ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板。 6. draw.io(现称 diagrams.net):免费在线图表软件,支持多种图表创建。 7. PlantUML:文本到 UML 转换工具,可自动生成部分视图。 8. Gliffy:基于云的绘图工具,支持创建部分架构图。 9. Archi:免费开源工具,支持创建逻辑视图。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图。
2025-01-23
会画图的AI有哪些
以下是一些可以画图的 AI 工具: 1. 对于绘制 CAD 图: CADtools 12:是 Adobe Illustrator 插件,添加 92 个绘图和编辑工具。 Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件。 nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型。 ParaMatters CogniCAD:根据输入自动生成 3D 模型。 主流 CAD 软件如 Autodesk 系列、SolidWorks 等的生成设计工具。 2. 绘制示意图: Lucidchart:强大的在线图表制作工具,集成 AI 功能,可绘制多种示意图。 Microsoft Visio:专业图表绘制工具,AI 功能可优化图表设计。 Diagrams.net:免费开源的在线图表绘制工具。 3. 绘制逻辑视图、功能视图、部署视图: Lucidchart:流行的在线绘图工具,支持多种视图创建。 Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 ArchiMate:开源建模语言,与 Archi 工具配合使用创建逻辑视图。 Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图创建。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 draw.io(diagrams.net):免费在线图表软件,支持多种图表创建。 PlantUML:文本到 UML 转换工具,自动生成多种视图。 Gliffy:基于云的绘图工具,支持创建架构图。 Archi:免费开源工具,支持逻辑视图创建。 Rational Rose:IBM 的 UML 工具,支持多种视图创建。 需要注意的是,这些工具通常需要一定的相关知识和技能才能有效使用。对于初学者,建议先学习基本技巧,然后尝试使用这些工具提高设计效率。
2025-01-23
写综述论文的ai?
在论文写作领域,AI 技术的应用发展迅速,能提供多方面的辅助,以下是一些相关的 AI 工具和平台: 1. 文献管理和搜索: Zotero:结合 AI 技术,可自动提取文献信息,助于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,能提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化的软件,有助于复杂数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 利用 AI 写课题可参考以下步骤和建议: 1. 确定课题主题:明确研究兴趣和目标,选有价值和创新性的主题。 2. 收集背景资料:用学术搜索引擎和文献管理软件等 AI 工具搜集相关文献和资料。 3. 分析和总结信息:借助 AI 文本分析工具提取关键信息和主要观点。 4. 生成大纲:用 AI 写作助手生成包括引言、文献综述、方法论、结果和讨论等部分的大纲。 5. 撰写文献综述:利用 AI 工具确保内容准确完整。 6. 构建方法论:根据需求,采用 AI 建议的方法和技术设计研究方法。 7. 数据分析:若涉及数据收集和分析,使用 AI 数据分析工具处理和解释数据。 8. 撰写和编辑:用 AI 写作工具写各部分,并检查语法和风格。 9. 生成参考文献:用 AI 文献管理工具生成正确格式。 10. 审阅和修改:用 AI 审阅工具检查逻辑性和一致性,根据反馈修改。 11. 提交前的检查:用 AI 抄袭检测工具确保原创性,做最后的格式调整。 对于不会代码但想在 20 分钟内上手 Python + AI 的朋友,可循序渐进完成以下任务: 1. 完成一个简单程序。 2. 完成一个爬虫应用,抓取公众号文章。 3. 完成一个 AI 应用,为公众号文章生成概述。 请注意,AI 工具可辅助但不能完全替代研究者的专业判断和创造性思维,使用时应保持批判性思维,确保研究质量和学术诚信。
2025-01-23
我是一个AI小白,想系统学习AI,实现的目标是成为AI领域小能手,如果能用于变现则更好,我需要从什么开始学习,周期大概是多少?适合做哪些变现的项目呢
对于您这样的 AI 小白,想要系统学习 AI 并实现成为领域小能手甚至变现的目标,以下是一些建议: 1. 学习模式:可以采用输入→模仿→自发创造的模式。先广泛输入知识,然后进行模仿,最后尝试自发创造。 2. 学习内容:去 waytoAGI 社区发现自己感兴趣的 AI 领域,学习最新的内容。但要注意,一些旧的学习材料可能已经不适用。 3. 时间安排:学习时间不必每天依次进行,可以在有空的时候学习。 4. 学习状态:保持良好的学习状态,有意愿和动力去学。 5. 费用方面:学习资源大多是免费开源的。 新手学习 AI 可以这样做: 1. 了解 AI 基本概念:阅读「」部分,熟悉术语和基础概念,浏览入门文章了解其历史、应用和发展趋势。 2. 开始学习之旅:在「」中找到为初学者设计的课程,推荐李宏毅老师的课程,也可通过在线教育平台按自己节奏学习并获取证书。 3. 选择感兴趣模块深入:AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习,掌握提示词技巧。 4. 实践和尝试:理论学习后进行实践,巩固知识,尝试使用各种产品做出作品,在知识库分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。 学习周期因人而异,取决于您的学习时间投入、学习效率和理解能力等因素。 关于变现项目,比如可以尝试用 GPT 和 SD 制作图文故事绘本、小说推文等,但要注意项目可能存在的不确定性。
2025-01-23
deepseek 进展
DeepSeek 在 AI 领域有以下进展: 在编码任务中已成为社区的最爱,推出了组合速度、轻便性和准确性的 deepseekcoderv2。 发布了 2360 亿参数的 DeepSeekV2,该模型由 60 位专家混合开源,在数学、编码和推理方面表现出色,具有 236B 参数,21B 在生成过程中被激活,在 MTBench 上表现优异,中文能力强且性价比高。
2025-01-23
总结一下24年国产AI大模型的主要进展
2024 年国产 AI 大模型的主要进展包括: 9 月: 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 21 日:大模型测试基准研究组正式成立。 23 日:钉钉 365 会员上线。 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 国内大模型落地情况: 2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。在金融行业,百度以 14 个中标数量、3734.4 万元中标金额排名第一;科大讯飞居第二。 在智能终端行业,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 百度表现突出,截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%。 大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。大模型的竞争,正在加速成为体系化之战。
2025-01-09
国产AI大模型的最新进展
以下是国产 AI 大模型的最新进展: 通义千问的 Qwen 系列表现出色:Qwen 是国内唯一出现在 OpenAI 视野里、能参与国际竞争的国产大模型。Qwen 多次冲进相关榜单,得分不断提高,其开源模型累计下载量突破 1600 万,国内外有大量开发者基于 Qwen 开发模型和应用,尤其在企业级领域。通义大模型证明了开源开放的力量。 国内大模型落地情况:2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。 其他进展:智谱一年间推出了 4 代 GLM,一直是国内能力较好的模型之一。MiniMax 推出了 MoE 架构的新模型和“星野”这个目前国内较成功的 AI 陪聊 APP。月之暗面专注长 Token 能力,在记忆力和长 Token 能力上有一定优势。但硬件层上的卡脖子问题仍未缓解,国内目前仍无胜任大模型训练的芯片,在推理上虽有 Nvidia 的替代产品逐渐出现,但华为昇腾在单卡指标上距离不远,因稳定性不足和缺乏 Cuda 生态,仍需时间打磨。
2025-01-09
端到端语音技术现在进展到什么程度了
端到端语音技术目前取得了显著进展。 在语音合成方面: 语音合成将文本转换为可听的声音信息,是人机交互的重要接口,一般包括 TTS、歌唱合成等领域。 当代工业界主流语音合成系统包括文本前端和声学后端两个部分。文本前端将输入文本转换为层次化的语音学表征,声学后端基于此生成语音,主要技术路线包括单元挑选波形拼接、统计参数和端到端语音合成方法,当代主要采用端到端声学后端。 端到端声学后端一般包括声学模型和声码器两部分,也出现了直接从音素映射为波形的完全端到端语音合成系统。 在全模态智能体方面: OpenAI 发布的 GPT4o 是新模型通过端到端的神经网络,把视觉、语音和文本数据混合训练,对音频输入的平均反应时间为 300 毫秒,与人类对话的反应时间相似。 直接拿音频数据来训练的好处是模型能从数据中感悟到人类表达的情绪、语调、风格等,能听到几乎真实的人类的声音。 OpenAI 未公开 GPT4o 的技术细节,唯一线索来自内部模型炼丹师的一篇博客,项目名是 AudioLM,目标是用端到端的方式扩大语音模型的能力。
2025-01-03
AI在电商直播带货有什么新进展吗
AI 在电商直播带货领域有以下新进展: 1. “全真 AI 颜值网红”出现,可以稳定输出视频,并能够进行直播带货。 2. 数字人工具软件方面,有实时驱动和非实时驱动两类,实时驱动在直播时能改音频话术,真人可接管,标准零售价一年 4 6 万往上;非实时驱动一个月 600 元,效果差,市场价格混乱。 3. 数字人运营服务可按直播间成交额抽佣。 4. 适用于不需要强展示的商品,如品牌食品饮料,以及虚拟商品如门票、优惠券等,店播效果较好,数据基本能保持跟真人一样。不适用于促销场景。 5. 目前技术仍显稚嫩,如更真实的对口型、更低的响应延迟等方面有待提高。 6. 不会一家独大,可能 4 5 家一线效果,大多二三线效果公司。 7. 有资源、有业务的大平台下场可能会带来降维打击,例如剪映若全环节打通会绑定商家。 8. 欧莱雅、YSL、兰蔻、李宁、北面等品牌会选择使用 AI 驱动的虚拟主播进行自播,但通常只在午夜时段排期。 9. 阿里云提供的品牌智能直播间基础版售价为 99000 元/(年×路),提供多种功能。 10. 虚拟形象有 3D 卡通风格和 2D 拟真人风格,预设动作库和真实语音表现,商品展示以图片为主,直播互动流程相对固定。但虚拟主播无法与产品接触,测评结果缺乏真实性,目前更像是花瓶,负责基础性介绍和互动问答。
2024-12-07
AI在机械制图方面有什么进展吗
AI 在机械制图方面的进展相对有限。然而,在艺术创作领域,特别是 AI 绘画方面有显著的发展。从早期的机械臂机器人到当前的大语言模型,技术的进步使得 AI 绘画在创作质量和速度上取得了新的突破。 AI 绘画不仅改变了艺术作品的创作方式,还对艺术的审美观念和市场需求产生了影响。但同时也引发了一系列讨论和争议。一方面,人们对于由 AI 驱动的机器人创作的艺术品和人类创作的艺术品的接受程度大致相同,但不太愿意将机器人视为艺术家,因为 AI 在表达情感和创造性意图方面存在局限性。另一方面,艺术家对 AI 生成艺术的态度复杂,既有对创新潜力的期待,也有对版权、原创性和伦理问题的担忧。 此外,AI 绘画技术的发展带来了对文化创意领域从业者职业安全的焦虑,以及对其“侵权”嫌疑的反对之声。不过,AI 绘画也为艺术创作提供了新的可能性,能帮助艺术家探索新的创意表达方式,提高制作效率,降低制作成本,促进艺术与观众之间的互动,提供更加个性化和互动的艺术体验。 总的来说,AI 绘画对艺术界的影响是复杂且双面的,既提供了新的创作工具和可能性,也引发了关于艺术本质、创造性、版权和伦理的重要讨论。但目前在机械制图领域,相关进展尚不明显。
2024-12-07
AI今年3月份有什么大事件
以下是今年 3 月份 AI 领域的一些大事件: 1. Google 的 Bard 在 3 月下旬推出,虽有地域限制,但未来可期。 2. 3 月 23 日,Tome 推出了第一个基于文档的 AI 演示工具,该工具基于 GPT4,能够将文档转换成演示文稿、叙述和故事。结合 Tome 自研的渲染系统,具有流畅的生成过程和竞争力。 3. 上周五,Gamma 推出了自己的文生演示文稿工具,工作流顺畅。
2024-12-16
我想组织一个团队,完成属于自己的一套数字人制作技术
以下是组织一个团队完成属于自己的一套数字人制作技术的相关内容: 方案一:剪映数字人“个性化“—无限免费私模数字人 1. 准备谷歌账号(可在淘宝或“”购买)。 2. 第一步:打开谷歌浏览器,点击链接https://github.com/facefusion/facefusioncolab 并点击 open colab 进入程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费。点击红框对应的 URL 打开操作界面。 3. 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 4. 第三步:等待专属数字人视频出炉。 方案二:借助开源社区力量构建高质量的 AI 数字人 1. 推荐借助开源社区的像 dify、fastgpt 等成熟的高质量 AI 编排框架,它们有大量开源工作者维护,集成各种主流模型供应商、工具及算法实现等。 2. 可通过这些框架快速编排出自己的 AI Agent,赋予数字人灵魂。 在开源项目中,使用 dify 框架,利用其编排和可视化交互任意修改流程,构造不同的 AI Agent,实现相对复杂功能,如知识库搭建、工具使用等,无需编码和重新部署工作。 Dify 的 API 暴露了 audiototext 和 texttoaudio 两个接口,基于此可将数字人的语音识别和语音生成都交由 Dify 控制,低门槛做出高度定制化的数字人。具体部署过程参考 B 站视频:https://www.bilibili.com/video/BV1kZWvesE25 。 若有更高度定制的模型,也可在 Dify 中接入 XInference 等模型管理平台部署自己的模型。 数字人 GUI 工程中保留了 LLM、ASR、TTS、Agent 等多个模块,能保持更好的扩展。 注意事项: 1. 使用 Dify 接口时,必须在应用编排功能中打开文字转语音和语音转文字功能,否则接口会返回未使能的错误。 2. 只有接入了支持 TTS 和 SPEECH2TEXT 的模型供应商,才会在功能板块中展示出来,Dify 的模型供应商图标下标签有展示该供应商支持哪些功能,可自行选择方便使用的。对于 TTS,不同的模型供应商支持的语音人物不同,可根据个人喜好添加。 制作数字人的工具: 1. HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2025-01-21
有哪个大模型工具可以提供“word技术规范书转功能清单”功能
目前尚未有确切的大模型工具专门提供“word 技术规范书转功能清单”的功能。但一些通用的自然语言处理工具和办公软件的插件可能会对您有所帮助,例如一些基于云服务的办公自动化工具,不过其效果可能因具体的文档内容和格式而有所差异。
2025-01-21
我是一名公安技术人员,对于打击博彩打击涉网犯罪有没有什么ai可以帮助到我们,请提供一些ai工具并且告诉我应该如何使用
以下是一些 AI 在打击博彩和涉网犯罪方面的应用及工具: 利用强大的数据处理能力,如在儿童图像滥用数据库中,通过 AI 识别受害者和犯罪者。 公司提供的网络安全服务中,使用 AI 分析大量有关恶意软件的数据,并以超人类的速度应对网络安全漏洞,增强网络安全能力。 在使用这些 AI 工具时,需要注意以下几点: 确保数据的合法性、准确性和完整性,以保证分析结果的可靠性。 对 AI 系统进行持续的监测和评估,及时发现并解决可能出现的问题。 培训相关人员,使其能够熟练操作和理解 AI 工具提供的结果。
2025-01-16
我是一名公安技术人员,对于打击博彩打击涉网犯罪有没有什么ai可以帮助到我们
以下是一些 AI 在打击博彩和涉网犯罪方面的应用和帮助: 1. 利用强大的数据处理能力,如在儿童图像滥用数据库中,通过 AI 识别受害者和犯罪者,快速有效地在数字滥用图像中确定相关人员。 2. 增强网络安全能力,提供网络安全服务的公司越来越多地使用 AI 来分析大量有关恶意软件的数据,并以超人类的速度应对网络安全漏洞。随着网络威胁形势的不断变化,AI 的模式识别和递归学习能力在主动网络防御恶意行为方面可能发挥越来越重要的作用。 3. 拜登签署的行政命令中,建立了先进的网络安全计划,开发 AI 工具以查找和修复关键软件中的漏洞。同时,还下令制定国家安全备忘录,指导在 AI 和安全方面的进一步行动,以确保美国军事和情报机构在任务中安全、道德和有效地使用 AI,并采取行动对抗对手的军事 AI 应用。
2025-01-16
列举常用的剪辑软件、硬件设备、技术支持和3d动画软件
常用的剪辑软件有 Adobe Premiere Pro、Final Cut Pro、DaVinci Resolve 等。 常用的硬件设备包括高性能的计算机主机,具备强大处理能力的 CPU(如英特尔酷睿 i7 或 i9 系列)、大容量高速内存(16GB 及以上)、专业图形显卡(如 NVIDIA GeForce 系列)、大容量高速存储硬盘(如 SSD 固态硬盘),以及高分辨率和色彩准确的显示器。 常见的技术支持包括视频编码和解码技术(如 H.264、H.265 等)、特效插件(如 After Effects 插件)、色彩校正工具等。 常用的 3D 动画软件有 Maya、3ds Max、Blender 等。
2025-01-16
列举常用的剪辑软件、硬件设备以及技术支持,3d动画和ai视频生成
以下是关于剪辑软件、硬件设备、技术支持、3D 动画和 AI 视频生成的相关信息: AI 视频生成工具: Runway: 主要能力:文生视频(Text 2 Video)、Prompt+图像生成视频(Text+Image to Video)、无 Prompt 直接图片转视频(Image to Video)。 使用建议:Text to Video 时,优先使用右下角的“Free Preview”免费生成多组图片,然后从中选择一张进行视频生成以节约 credits。 近期更新:支持将 4s 的视频延长,每次延长需消耗 20 credits;9 月更新中,支持 110 级的 motion slider 调节,默认幅度为 5,同时支持水平、垂直、空间和旋转的运镜,并支持调节运动速度。 其他功能:提供 30 多项图片、视频处理能力,如 Inpainting 视频修复、Motion Tracking 视频主体跟随运动、Remove Any Background 删除视频元素/背景、3D Texture 生成 3D 纹理等。控制台上线了 Watch 模块,可查看官方精选的创意案例。推荐教程:ai 繪圖教學|Ai 动画:https://www.youtube.com/watch?v=Yj73NRmeSZM 由于您未明确提及剪辑软件、硬件设备和技术支持的具体需求,暂时无法为您详细列举。如果您能提供更具体的要求,我将为您提供更有针对性的信息。
2025-01-16