直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

Way to AGI 近期更新

回答

以下是关于 Way to AGI 的近期更新信息:

  • Runway 官方镜头提示词相关:
    • 官方镜头指南:https://help.runwayml.com/hc/en-us/
    • 相关文章:articles/30586818553107-Gen-3-Alpha-Prompting-Guide
    • 生图官网:https://app.runwayml.com/video-tools/teams/aimwisetonix/ai-tools/generative-video
    • 小互动:最下面一起生文字“WaytoAGI”回头剪辑到一起
    • 此次更新适合参加本期 video battle第 14 期:Video Battle AI 视频挑战-拐点
    • 官方效果:工具教程:Runway Gen-3
    • Gen-3 Alpha 上线,具有无限潜力,可将艺术视野带入生活。创建传达场景的强烈提示是生成与概念一致视频的关键,涵盖不同示例结构、关键字和提示帮助使用 Gen-3 Alpha,鼓励实践时大胆实验。
  • 知识库介绍:
    • 原文《WaytoAGI:找到了 AI 知识付费的免费源头,让更多人因 AI 而强大!》
    • WayToAGI 是由热爱 AI 的专家和爱好者共同建设的开源 AI 知识库,大家贡献并整合各种 AI 资源,方便大家学习 AI 知识、应用工具和实战案例等。
    • 提供一系列开箱即用的工具,如文生图、文生视频、文生语音等详尽教程,将文字化为视觉与听觉现实。
    • 追踪 AI 领域最新进展,时刻更新,每次访问都有新收获。
    • 无论初学者还是行业专家,都能发掘有价值内容。
    • 链接:https://waytoagi.com/(通往 AGI 之路)
    • 即刻体验:https://waytoagi.com/
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

Runway官方镜头提示词【

[title]Runway官方镜头提示词Runway官方镜头指南:https://help.runwayml.com/hc/en-us/articles/30586818553107-Gen-3-Alpha-Prompting-Guide生图官网:https://app.runwayml.com/video-tools/teams/aimwisetonix/ai-tools/generative-video1️⃣最下面有个小互动,一起生文字“WaytoAGI”回头剪辑到一起2️⃣这次更新非常适合参加本期video battle[第14期:Video Battle AI视频挑战-拐点](https://waytoagi.feishu.cn/wiki/CufGwGyeXiomZnkiLTwcIgd3nnb)官方效果:[工具教程:Runway Gen-3](https://waytoagi.feishu.cn/wiki/Eun9wqDgii1Q7GkoUvCczYjln7r)Gen-3 Alpha上线了!具有无限的潜力,可以将您的艺术视野带入生活。创建一个传达场景的强烈提示是生成与您的概念一致的视频的关键。本文涵盖不同的示例结构、关键字和提示,以帮助您开始使用Gen-3 Alpha。这些只是例子--在将您的想法付诸实践时,不要害怕进行实验。

Runway官方镜头提示词

[title]Runway官方镜头提示词Runway官方镜头指南:https://help.runwayml.com/hc/en-us/articles/30586818553107-Gen-3-Alpha-Prompting-Guide生图官网:https://app.runwayml.com/video-tools/teams/aimwisetonix/ai-tools/generative-video1️⃣最下面有个小互动,一起生文字“WaytoAGI”回头剪辑到一起2️⃣这次更新非常适合参加本期video battle[第14期:Video Battle AI视频挑战-拐点](https://waytoagi.feishu.cn/wiki/CufGwGyeXiomZnkiLTwcIgd3nnb)官方效果:[工具教程:Runway Gen-3](https://waytoagi.feishu.cn/wiki/Eun9wqDgii1Q7GkoUvCczYjln7r)Gen-3 Alpha上线了!具有无限的潜力,可以将您的艺术视野带入生活。创建一个传达场景的强烈提示是生成与您的概念一致的视频的关键。本文涵盖不同的示例结构、关键字和提示,以帮助您开始使用Gen-3 Alpha。这些只是例子--在将您的想法付诸实践时,不要害怕进行实验。

知识库有什么|感谢银海 inhai

[title]知识库有什么|感谢银海inhai原文《WaytoAGI:找到了AI知识付费的免费源头,让更多人因AI而强大!》你是否在为如何学习AI?何处学习AI困惑不已?割韭菜套路那么多,如何不上当?我认为AI知识库WayToAGI(通往AGI之路)就是一个满分答案。WayToAGI是由一群热爱AI的专家和爱好者共同建设的开源AI知识库,大家贡献并整合各种AI资源,使得大家都可以轻松学习各种AI知识,应用各类AI工具和实战案例等。WayToAGI提供了一系列开箱即用的工具,文生图、文生视频、文生语音等详尽的教程,将你的文字化为视觉与听觉的现实。追踪AI领域最新的进展,时刻更新,让你紧跟AI领域的步伐,每次访问都能有新的收获。无论你是AI初学者还是行业专家,都可以在这里发掘有价值的内容,让更多的人因AI而强大。🔗:https://waytoagi.com/(通往AGI之路)🚀即刻体验:https://waytoagi.com/

其他人在问
AGI
AGI 即通用人工智能(Artificial General Intelligence),是能够像人类一样思考、学习和执行多种任务的人工智能系统。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能解决复杂问题,如 ChatGPT,可根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 ChatGPT 是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,于 2022 年 11 月 30 日发布,目前使用的是 GPT4 的 LLM。NLP 指自然语言处理,LLM 指大型语言模型。
2024-11-04
AGI
AGI 即通用人工智能(Artificial General Intelligence),是能够像人类一样思考、学习和执行多种任务的人工智能系统。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能解决复杂问题,如 ChatGPT,可根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 ChatGPT 是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,于 2022 年 11 月 30 日发布,目前使用的是 GPT4 的 LLM。 NLP 指自然语言处理,就是处理人类语言。 LLM 是大型语言模型,数据规模很大,耗费资金多。
2024-11-04
AI新手在WaytoAGI怎么入手学习AI并能获得现金收入
对于 AI 新手在 WaytoAGI 入手学习 AI 并获得现金收入,以下是一些建议: 学习 AI 有可能赚钱,但不保证每个人都能成功。人工智能领域有很多高薪工作,如数据科学家、机器学习工程师等,掌握相关技术可在这些岗位获得不错收入,且 AI 技术在各行业应用广泛,掌握技能能增加就业和职业发展机会。 然而,能否赚钱取决于多种因素,包括个人学习能力、实际应用能力、对市场和商业的理解等。仅学会基础知识可能难以在竞争中脱颖而出,需要持续学习和实践。 对于新手,【野菩萨的 AIGC 资深课】是不错的选择。这门课程由工信部下属单位【人民邮电出版社】开设,是市面上值得推荐的课程之一,也是全网技术更新最快的课程。课程涵盖 AI 绘画、视听语言和 ChatGPT 等多个体系的知识,无论新手还是进阶者都适用。 总之,新手要在 AI 领域获得现金收入,不仅要选对课程深入学习,还要不断提升自身能力,结合市场需求进行实践。
2024-11-04
AGI是什么意思
AGI 指的是通用人工智能(Artificial General Intelligence),它是一种能够像人类一样思考、学习和执行多种任务的人工智能系统。做任何人类可以做的事,涵盖了广泛的认知技能和能力,包括推理、规划、解决问题、抽象思维、理解复杂思想、快速学习和从经验中学习等。在 2000 年代初,“通用人工智能”这一名词开始流行,以强调从“狭义 AI”到更广泛的智能概念的追求。但目前 AGI 还未取得巨大进展。
2024-11-02
生成agi插画的网站
以下是一些可以生成 AGI 插画的网站: :可以使用 AI 创建网站和 app 使用的插画。 :PictoGraphic,免费的 AI 生成插图库,提供超过 40000 张图像和 SVG 文件,支持文本提示创建自定义插图。
2024-10-31
什么是AGI?
AGI 即通用人工智能(Artificial General Intelligence),是指具有人类水平的智能和理解能力的 AI 系统。它有能力完成任何人类可以完成的智力任务,适用于不同的领域,同时拥有某种形式的意识或自我意识。目前还只是一个理论概念,还没有任何 AI 系统能达到这种通用智能水平。 OpenAI 在其内部会议上分享了关于 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力的 AI,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平的 AI,能够解决复杂问题,如 ChatGPT,能够根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务的 AI。目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明的 AI,如谷歌 DeepMind 的 AlphaFold 模型,可以预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。
2024-10-31
在WaytoAGI如何从0开始学习AI
对于在 WaytoAGI 中从 0 开始学习 AI,以下是一些建议: 1. 学习 AI 是一个长期的过程,需要耐心和持续的努力,不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。 2. 完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。 3. 为您推荐【野菩萨的 AIGC 资深课】,这门课程由工信部下属单位【人民邮电出版社】开设,是市面上为数不多的值得推荐的 AI 课程之一,也是全网技术更新最快的课程。课程内容涵盖 AI 绘画、视听语言和 ChatGPT 等多个体系的知识,无论您是 AI 初学者还是进阶者,都能满足您的学习需求。您可以扫码添加菩萨老师助理,了解更多信息。 需要注意的是,开源社区资源丰富,适合自律的自主学习者,而知识付费课程能提供系统结构、专业指导、针对性计划和互动反馈,是一种高效的学习途径,您可以根据自身情况选择适合自己的学习方式。
2024-10-30
我可以通过waytoagi做些什么
通过 waytoAGI,您可以实现以下功能: 1. 自动问答:自动回答用户关于 AGI 知识库内涉及的问题,并对多文档进行总结、提炼。 2. 知识搜索:在内置的「waytoAGI」知识库中搜索特定的信息和数据,快速返回相关内容。 3. 文档引用:提供与用户查询相关的文档部分或引用,帮助用户获取更深入的理解。 4. 互动教学:通过互动式的问答,帮助群成员学习和理解 AI 相关的复杂概念。 5. 最新动态更新:分享有关 AGI 领域的最新研究成果、新闻和趋势。 6. 社区互动:促进群内讨论,提问和回答,增强社区的互动性和参与度。 7. 资源共享:提供访问和下载 AI 相关研究论文、书籍、课程和其他资源的链接。 8. 多语言支持:支持多语言问答,满足不同背景用户的需求。 此外,在 WaytoAGI 网站上,您还可以: 1. 和 AI 知识库对话,询问任何关于 AI 的问题。 2. 浏览集合的精选 AI 网站,按需求找到适合您的工具。 3. 查看集合的精选提示词,并复制到 AI 对话网站使用。 4. 了解知识库精选内容,获取每天知识库的精华。 总之,WaytoAGI 网站和 WaytoAGI 知识库各自独立又相互关联,旨在成为您学习 AI 路上的好助手。
2024-10-29
想了解WaytoAGI 是什么,能 做什么,
WaytoAGI 是由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库。目前知识库的内容覆盖 AI 绘画、AI 视频、AI 智能体、AI 3D 等多个版块,包含赛事和活动促进大家动手实践,有 1000 万的访问量。 WaytoAGI 网站提供以下功能: 1. 和 AI 知识库对话:您可以在这里问任何关于 AI 的问题。 2. AI 网站:集合了精选的 AI 网站,按需求找到适合您的工具。 3. AI 提示词:集合了精选的提示词,可以复制到 AI 对话网站来使用。 4. 知识库精选:将每天知识库的精华内容呈现给大家。 WaytoAGI 里还有个离谱村,这是由 WaytoAGI 孵化的千人共创项目,让大家学习和接触 AI 更容易、更感兴趣。参与者不分年龄层,一起脑洞和创意,都可以通过 AI 工具快速简单地创作出各种各样的作品。离谱村是一个没有被定义的地方,每个人心中都有自己想象中的离谱村,它不仅代表着一个物理空间,更是灵魂的避风港,激励着每一个生命体发挥其无限的想象力,创造属于自己的独特生活方式。
2024-10-25
way to agi 可以提供每一个ai的教程吗
WaytoAGI(通往AGI之路)是由一群热爱AI的专家和爱好者共同建设的开源AI知识库。它提供了一系列开箱即用的工具,包括文生图、文生视频、文生语音等详尽的教程。无论您是AI初学者还是行业专家,都能在这里发掘有价值的内容。 知识库涵盖的内容丰富多样,包括但不限于以下方面: 推荐了 B 站 up 主 Nally 的免费课程,每节 15 分钟。 二十四节气相关教程和关键词已开源。 会有老师带领大家用 AI 做生图、毛毡字、光影字、机甲字等。 提到人像可控的炼丹操作、AI 视频及相关变现方式。 介绍了工程生产的可控性,以及 AI 视频相关的共学课程、工具及挑战赛。 提供了不同类型的学习路径规划,如 AI 提示词、AI 绘画、AI 语音与数字人等方面的学习路径。 包含 AI 产品介绍、数据分析、研究报告与课程、AI 论文和数据等内容。 有开源内容共建,如音乐之路、AI 视频学社、微信机器人搭建、手搓“硬件”机器人、关键词学社、AI 教育之路、AI 3D 学社、AI 即兴喜剧等。 您可以通过以下链接访问:https://waytoagi.com/ ,即刻体验:https://waytoagi.com/
2024-10-20
如果我需要撰写一个以“AI对音乐行业就业岗位的影响”为主题的约3000字的科普类文章,我应该优先关注WaytoAGI 知识库中的哪些内容?
很抱歉,目前“通往 AGI 之路”知识库中没有与“AI 对音乐行业就业岗位的影响”相关的直接内容。但您可以从以下几个方面入手来撰写这篇文章: 1. 了解 AI 在音乐创作、制作、表演等方面的应用现状和发展趋势。 2. 研究 AI 技术如何改变音乐的生产流程和效率。 3. 分析 AI 对音乐创作者、演奏者、制作人等不同岗位的具体影响,包括可能的岗位替代和新岗位的产生。 4. 探讨 AI 带来的音乐版权和知识产权问题,以及对相关法律和政策的影响。 5. 关注音乐消费者对 AI 参与音乐创作和表演的接受程度和需求变化。
2024-10-19
有最新的 AI 工具相关的信息么,更新频率是什么样的?
以下是为您提供的最新 AI 工具相关信息及更新频率: AIGC Weekly 61 每周一更新,主要介绍上周 AIGC 领域发布的一些产品以及值得关注的研究成果,包括 Mistral 推出新的大模型 Mistral Large、LTX 推出文字直接生成视频的软件、LayerDiffusion 项目可生成透明 PNG 图片等,还汇报了一些公司和项目的动态,推荐了一些新产品,如 Vercel AI SDK、OLMo7BInstruct 等。 2024 年 5 月 20 日的更新包括:《》介绍了 Coze.cn 临时上线又下线的“图像流”功能的试用情况。 2024 年 8 月 17 日的更新有:《》设想了未来 150 年内 AI 原住民与智能机器的共生关系。
2024-10-24
midjourney最近一次更新是什么时候
Midjourney 最近的更新情况如下: 上周更新了 V5.2 版本,增加了一些重要新功能,如新的美学风格、修复的 stylize 命令、新的“高变异模式”、新的 /shorten 命令、图片填充功能等。 数月前更新到了 v6.1 版本,该版本大大提高了图像质量、文本和连贯性,并配备了全新升级的个性化模型,带来了更连贯的图像、更好的图像质量、更精确详细和正确的小图像特征、新的 2x 放大器、标准图像处理速度提升约 25%、改进的文本准确性等新变化。同时,MJ 可能会在下个月左右发布 V6.2 模型。
2024-10-24
chatgpt版本更新时间
ChatGPT 不同版本的知识更新时间如下: ChatGPT 3.5 的知识更新到 2022 年 1 月。 ChatGPT 4o 的知识更新到 2023 年 10 月。 ChatGPT 4 更新到 2023 年 12 月。
2024-10-14
runway现在更新了吗
Runway 目前仍在不断更新。在近半年中,它在模型和产品功能上快速迭代。例如,7 月更新的 Gen3 支持了 Alpha Turbo(更快速)和 Alpha(更强表现力)两种模式,增强了对极度复杂提示词描述的理解,对图像运动元素的识别也有所提升,单次生成视频时长最长达到 10 秒,支持延长到 40 秒。11 月 2 日,Runway 的 Gen2 模型进行了升级,提高了视频生成的质量,确保视频内容与输入(无论是文本还是图像)更加匹配和一致。 您可以通过以下链接获取更多详细信息:https://x.com/xiaohuggg/status/1720069510324244986?s=20 这里还可以看到 Runway 目前支持的场景和视频案例:https://runwayml.com/product/usecases
2024-10-12
Way to AGI 近期更新
以下是 Way to AGI 的近期更新: Runway 官方镜头提示词相关: 官方镜头指南:https://help.runwayml.com/hc/enus/ 相关文章:articles/30586818553107Gen3AlphaPromptingGuide 生图官网:https://app.runwayml.com/videotools/teams/aimwisetonix/aitools/generativevideo 互动:最下面有个小互动,一起生文字“WaytoAGI”回头剪辑到一起 适合参加本期 video battle:https://waytoagi.feishu.cn/wiki/CufGwGyeXiomZnkiLTwcIgd3nnb 官方效果: https://waytoagi.feishu.cn/wiki/Eun9wqDgii1Q7GkoUvCczYjln7r Gen3 Alpha 上线,具有无限潜力,创建传达场景的强烈提示是生成与概念一致视频的关键,涵盖不同示例结构、关键字和提示。 观点方面: 作者 Allen 认为热爱与行动是通往 AGI 之路。 更新日志:补充对共创模式的思考,删减部分内容。 端午假期实践了三篇教程,难度从低到高排序为: 1. https://waytoagi.feishu.cn/wiki/QWQ0w1QOZiNZz9kreQecY4hYn4c (入门级网速好的话,一个小时能搞定) 2. https://waytoagi.feishu.cn/wiki/XnvIwd8NkiDefHkmbobcCfsBnKg 3. https://waytoagi.feishu.cn/wiki/YeBiwZx2TiyNLMk8pdjcmdQfnjd 关于加强写作能力的训练,准备调整工作流,先把初稿发在飞书上(可能是原来 2 篇或 3 篇的集合,有一些不方便说的也先发在初稿,后续再删),获取大家反馈后再拆分细化。 自我介绍:Allen,一个小镇青年,是 WaytoAGI 共创者。
2024-10-12
创建聊天机器人时,数据还是存在本地吗,后面可以实时更新知识库吗
在创建聊天机器人时,数据的存储和更新情况如下: 扣子平台:内置强大的知识库功能,允许开发者上传和维护大量数据,这些数据可用于训练 AI Bot 以更准确理解和回应用户需求。平台具备数据库记忆能力,能存储和检索用户交互历史以提供个性化服务。数据上传形式多样,包括文本、图片、视频等,可通过直观编辑工具整理分类。上传数据用于训练优化 AI Bot,机器学习算法分析数据提高回答准确性和相关性。知识库支持实时更新,对金融、法律等需频繁更新信息的行业尤为重要。数据库能存储用户交互记录,包括提问、回答和反馈,目前数据库设置只能在创建 AI bot 时设置和修改,无需懂数据库语法或编程,用自然语言告知操作即可。通过分析交互历史,AI Bot 能提供个性化服务,开发者还能利用交互记录进行错误分析和修正以提高性能。 FastGPT + OneAPI + COW:创建知识库应用时,地址输入浏览器:http://这里替换为你宝塔左上角的那一串:3000/ 。进入后点击应用并创建,选择 qwen 模型,创建知识库,上传文件等待处理至文本状态为“已就绪”。回到创建的应用关联知识库,点击两个发布,新建并创建 key,保存 API 根地址并加上/v1 。安装并接入 cow 时,回到宝塔打开【终端】,依次执行相关命令。
2024-10-08
近期融资的ai行业上市公司
以下是近期融资的 AI 行业上市公司的相关信息: Celestial AI 融资 1 亿美元,用于使用基于光的互连传输数据。 Zenarate 融资 1500 万美元,是提供 AI 模拟培训平台的公司。 Augmedics 获得 8250 万美元,用于使用 AR 和 AI 进行脊柱手术。 CalypsoAI 筹集了 2300 万美元,用于生成 AI 模型的护栏。 2024 年美国融资金额超过 1 亿美元的 AI 公司(截止 2024.10.15): |项目名称|融资时间|融资金额(亿美元)|轮次|估值(亿美元)|主营|产业链标签|话题标签|投资方|其他信息| ||||||||||| |Weka|20240513|1.4|E|16|AI 原生数据平台|应用|数据|Valor Equity Partners, 高通创投, Nvidia, 日立创投| |CoreWeave|20240501|11|C|190|GPU 基础设施|基础设施|硬件和云平台|Coatue, Fidelity, Altimeter Capital, Magnetar Capital| |Scale AI|202405|10|F|140|数据标记服务|应用|数据|Accel, Tiger Global, Spark Capital, 亚马逊| |Blaize|20240429|1.06|D||AI 边缘计算平台|基础设施|硬件和云平台|淡马锡, 富兰克林邓普顿, Bess Ventures| |Augment|20240424|2.27|B|10|AI 编码辅助|应用|编程|Lightspeed Venture Partners, Index Ventures, Sutter Hill Ventures| |Cognition|20240424|1.75||20|端到端软件 Agents|应用|编程|Founders Fund, Ramp 联合创始人 Eric Glyman, Stripe 联合创始人 Patrick 和 John Collison, DoorDash 联合创始人 Tony Xu| |Xaira Therapeutics|20240423|10|A||AI 药物研发|应用|医学|Foresite Capital, ARCH Venture Partners| 近期热门融资 AI 产品速递 1 st : You.com 已完成多轮融资,包括来自 Salesforce CEO Marc Benioff 的 2000 万美元资金和 4500 万美元的募资。目前,You.com 用户数量稳定增长,已超过 10 万。体验链接:www.you.com
2024-10-28
近期的大模型进展
近期大模型的进展主要包括以下方面: 多模态大模型: 现状:随着数据集和模型规模扩大,传统多模态模型计算量大,研究重点在于各模态的连接,利用现成训练好的单模态基础模型可减少训练费用和提升效率。通过多模态预训练和指令微调实现模态对齐及模型输出与人类意图对齐是核心挑战。 发展历程:最初集中在多模态内容理解和文本生成,如 Flamingo、BLIP2 等;同时实现多模态输入和输出工作,如 MMLMM;将 LLM 和外部工具继承进来,实现“anytoany”的多模态理解和生成,如 visualchatgpt 等;还有为减少级联过程中传播误差的工作。 大型视觉模型 Sora:符合视觉模型的规模化定律,展示了新兴能力,包括遵循指令、视觉提示工程和视频理解等,是第一个展示确认新兴能力的视觉模型,标志着计算机视觉领域的重要里程碑。 OpenAI 的新模型 o1preview/mini:复杂问题思考过程长,相对简单问题也需 5 10 秒,使用条数少,冷却时间长,但推理模型准确率不断攀升,为行业注入了强心剂。
2024-10-23
近期数字人比较成熟的应用有哪些
数字人目前有以下较为成熟的应用: 1. 影视行业:真人驱动的数字人通过动捕设备或视觉算法还原真人动作表情,用于影视制作。 2. 直播带货:真人驱动的数字人在直播带货领域发挥作用。 3. 家庭:未来可能会有数字人管家,全面接管智能家居或其他设备。 4. 学校:未来可能会有数字人老师,为学生答疑解惑。 5. 商场:未来可能会有数字人导购,为顾客提供指路、托管个人物品等服务。 数字人的构建方式包括: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,代表如 Live2D Cubism。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高,代表如 UE、Unity、虚幻引擎 MetaHuman 等。 3. AIGC:虽然省去建模流程,但在数字人 ID 一致性和帧连贯性上存在弊端,不过算法发展迅速,未来可能会有改善。AIGC 还有直接生成 2D/3D 引擎模型的探索方向。
2024-10-16
近期更新的虚拟陪伴产品
以下是近期更新的一些虚拟陪伴产品: 1. Character.ai:这是一个 AI 虚拟陪伴平台,用户可与数百个 AI 驱动的角色交流,包括名人、动漫角色等,还能创建自己的角色并赋予其描述、图像、个性等特性。 2. Replika:一款 AI 虚拟陪伴应用,用户能设计理想伴侣,其会存储记忆并在未来对话中参考,甚至可发送照片。 3. Talkie:主打情感路线的 AI 虚拟陪伴应用,设计有大量 npc,游戏和休闲娱乐体验感更强,每个 npc 带有自己的剧情体系,交流中会触发抽取卡牌机会。 享受型虚拟陪伴方面:享受是人不用付出就能得到想要的。过去 20 年,互联网产品在让用户享受上有成熟方法论,如交互简便、流程便利、连接畅通、内容无限。但用这些标准衡量 AI 产品,尤其是虚拟陪伴产品时,能经受审视的不多。当前虚拟陪伴产品本质上是角色扮演对话工具,用户核心体验是和 AI 扮演的虚拟角色通过文字消息、图片消息、语音消息、语音通话、视频通话等方式聊天。 此外,主流虚拟陪伴产品以一问一答的多轮对话作为基础交互方式,通过更产品化的信息收集方式降低高质量 Prompt 获得的门槛。但仍有人表示不会使用此类产品。推荐大家收听如等播客。 以上内容由 AI 大模型生成,请仔细甄别。
2024-09-10
近期有哪些新的AI产品
近期有以下新的 AI 产品: 1. 4 月下半月有 78 个 AI 新产品,包括 15 个初创企业的新产品(从开源和闭源角度划分)、39 个有用的和 10 个好玩的新产品(有用的部分从通用场景及垂直场景划分,并单列了模型训练、AI 安全、代码学习和 AI 代理等关注度较高的类别)、14 个大公司的新产品(如微软、谷歌、英伟达、苹果、Palantir 等)。 2. Google 在 I/O 大会上推出的新产品,如新一代 LLM PaLM2(在常识推理、数学和逻辑方面有所改进,编程能力好于 ChatGPT)、多模态大模型 Gemini、基于 PaLM2 运行的 Bard(向所有用户全面放开,并将逐步增加适配语言,具备多种功能)、Duet AI(Office Copilot 的竞品)。 3. 3 月底有 23 个 AI 新产品,包括 5 个来自大公司和成熟创业公司的新产品、9 个有用的、4 个有趣的和 5 个华人开发者所搭建的小产品。
2024-09-07