直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

现在有什么垂直行业Agent吗,真正有在应用的

回答

目前,AI Agent 已逐步应用于电商、电信服务、银行、核能制造和新零售等多个行业领域。以新零售客户为例,实在 AI Agent 能够提供全域数据自动化采集、全平台竞店、竞品、竞对的数据分析和回溯,通过自动化采集、分析数据,并以可视化呈现用户评论数据,帮助企业解决数据分散和处理效率低的问题,助力客户提效降本、敏捷精准优化营销策略。此外,该应用还能协助企业进行财务处理、客服互动、自动退换货等工作,极大提高工作效率。

在 AI 应用的开发过程中,实在智能团队充分发挥了在 RPA 领域的专业优势,开发团队成员包括流程开发工程师、AI 框架搭建师、接口开发工程师等,共同协作以确保应用高效运行。实在智能高级产品经理张译颢介绍,在喂数据库和调试阶段,团队通过模拟各种业务场景,不断优化 AI 模型,以确保准确理解和执行用户指令。实在智能的 AI 应用不仅显著提高流程性工作的效率,还降低了人为错误的可能性。通过自动化流程,企业能够更快响应市场变化,提升服务质量,在激烈的市场竞争中占据优势。

现代的 Agent 已经被广泛应用于游戏、机器人和其他领域。吴恩达在红杉美国 AI 峰会谈上表示,自己已经在使用研究 Agent,虽然不总是可靠,但有时会非常有用,可以帮助他节省时间和提高效率。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

2024钉钉AI助理白皮书-人人都是创造者-钉钉&财商学院-38页.pdf

目前实在AI Agent已逐步应用于电商、电信服务、银行和核能制造等多个行业领域。以新零售客户为例,实在AI Agent能够提供全域数据自动化采集、全平台竞店、竞品、竞对的数据分析和回溯,通过自动化采集、分析数据,并以可视化呈现用户评论数据,帮助企业解决数据分散和处理效率低的问题,助力客户提效降本、敏捷精准优化营销策略。此外,该应用还能协助企业进行财务处理、客服互动、自动退换货等工作,极大提高工作效率。在AI应用的开发过程中,实在智能团队充分发挥了在RPA领域的专业优势,开发团队成员包括流程开发工程师、AI框架搭建师、接口开发工程师等,共同协作以确保应用高效运行。实在智能高级产品经理张译颢介绍,在喂数据库和调试阶段,团队通过模拟各种业务场景,不断优化AI模型,以确保准确理解和执行用户指令。实在智能的AI应用不仅显著提高流程性工作的效率,还降低了人为错误的可能性。通过自动化流程,企业能够更快响应市场变化,提升服务质量,在激烈的市场竞争中占据优势。实在智能AI Agent你来说、AI做,所说即所得。通过自动处理重复性流程,使你的工作效率翻倍,实现创新自由。用户痛点

🌈通往AGI之路-分享会

图片:现代Agent应用示例现代的Agent已经被广泛应用于游戏、机器人和其他领域。

红杉 AI Ascent 2024 会议

今天我们实际上有Agent,我不想说它们工作得很可靠,它们有点挑剔。它们不总是工作,但当它工作时,实际上相当了不起,但有了Agent循环,有时你也可以从早期的失败中恢复过来。所以我发现我已经在使用研究Agent。所以我的一些工作,一部分研究,但我不觉得,自己去谷歌搜索并花很长时间。我应该发送给研究Agent,几分钟后回来看看它找到了什么,有时它有效,有时没有,但这已经是我的个人工作流程的一部分了。

其他人在问
ai agent 就是 ai 工具吗
AI Agent 是基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。 AI Agent 包括以下几个概念: 1. Chain:通常一个 AI Agent 可能由多个 Chain 组成。一个 Chain 视作一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的 Chain 是大语言模型完成的 LLM Chain。 2. Router:可以使用一些判定(甚至可以用 LLM 来判定),然后让 Agent 走向不同的 Chain。例如:如果这是一个图片,则 a;否则 b。 3. Tool:Agent 上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。 总结下来需要三个 Agent: 1. Responser Agent:主 agent,用于回复用户(伪多模态)。 2. Background Agent:背景 agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)。 3. Daily Agent:每日 agent,用于生成剧本,配套的图片,以及每日朋友圈。 这三个 Agent 每隔一段时间运行一次(默认 3 分钟),运行时会分析期间的历史对话,变更人物关系(亲密度,了解度等),变更反感度,如果超标则拉黑用户,抽简对话内容,提取人物和用户的信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。 此外,AI Agent 也像是在 RAG 的基础上更进一步。RAG 是给大模型一个浏览器工具使用,而 Agent 给了大模型更多工具,比如长期记忆(给大模型一个数据库工具记录重要信息)、规划和行动(在大模型的 prompt 层做逻辑,将目标拆解并输出不同的固定格式 action 指令给工具)。 总的来说,AI Agent 代表了在流程中给大模型使用工具的能力,为大模型的应用提供了更广阔的空间。例如可以让大模型安排差旅,它会判断完成目标所需步骤,搜索近期差旅记录,在相关平台预订酒店和机票,最终完成任务。
2024-09-18
ai agent
AI 智能体(Agent)是随着 ChatGPT 与 AI 概念爆火而出现的新名词,简单理解就是 AI 机器人小助手,参照移动互联网,类似 APP 应用的概念。AI 大模型是技术,面向用户服务的是产品,因此很多公司关注 AI 应用层的产品机会。 在做 Agent 创业的公司有不少,C 端案例中,比如在社交方向,用户注册后先创建自己的 Agent,然后让其与他人的 Agent 聊天,两个 Agent 聊到一起后真人再介入,这是有趣的场景;还有借 Onlyfans 入局打造个性化聊天的创业公司。B 端案例中,如果字节扣子和腾讯元器是面向普通人的低代码平台,类似 APP 时代的个人开发者,那么还有帮助 B 端商家搭建 Agent 的机会,类似 APP 时代专业做 APP 的。 此外,字节于 2 月 1 日正式推出 AI 聊天机器人构建平台 Coze 的国内版“扣子”,主要用于开发下一代 AI 聊天机器人。还有一个情绪主题角色扮演小游戏,本文会按照需求分析、分步实现需求、提示词编写测试、GPTs 使用链接、总结的顺序进行介绍。智能体来源于 Cathy 教练和 Leah 老师的情绪力手册,这是帮助家长和孩子从源头了解、分辨、分析、处理和控制情绪的手册,内涵多个相关的智能体。
2024-09-18
agent 相关的知识
以下是关于 Agent 的相关知识: 在人工智能领域,Agent 通常被定义为一种具有感知能力的实体,它能够通过对其所处环境的观察来做出相应的决策和反应。Agent 既可以是软件形式的程序,例如对话机器人,也可以具备物理形态,比如扫地机器人。 从产品经理角度思考 Agent: Agent 可以是一个历史新闻探索向导。 身份:历史新闻探索向导。 性格:知识渊博、温暖亲切、富有同情心。 角色:主导新闻解析和历史背景分析。 为使角色更生动,可为其设计简短的背景故事,比如曾是一位对世界重大历史事件了如指掌、充满热情且愿意分享知识的历史学家。 写好角色个性的方法: 角色背景和身份:编写背景故事,明确起源、经历和动机。 性格和语气:定义性格特点,如友好、幽默、严肃或神秘;确定说话方式和风格。 角色互动方式:设计对话风格,从基本问答到深入讨论。 角色技能:明确核心功能,如提供新闻解析、历史背景分析或心理分析;增加附加功能以提高吸引力和实用性。 “智能体”(Agent)在人工智能和计算机科学领域是一个非常重要的概念,指的是一种能够感知环境并采取行动以实现特定目标的实体,可以是软件程序,也可以是硬件设备。
2024-09-14
我想设计一款符合企业内部办公的ai agent,有哪些资料可以辅助参考
以下是一些可辅助您设计符合企业内部办公的 AI Agent 的资料和相关信息: Agent 构建平台: 1. Coze:新一代一站式 AI Bot 开发平台,集成丰富插件工具,适用于构建各类问答 Bot,能拓展 Bot 能力边界。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,可将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 AI Agent 的概念和组成: 1. LLM(大模型):提供庞大的信息存储和处理能力,以理解和响应问题。 2. Planning(规划):如同园丁制定种植计划,决定任务执行步骤。 3. Memory(记忆):类似于园丁的笔记本,记录经验和已完成任务。 4. Tools(工具):指可运用的各种软件和程序,帮助执行复杂任务。 AI Agent 的相关概念: 1. Chain:通常一个 AI Agent 可能由多个 Chain 组成,每个 Chain 可视为一个步骤,接受输入变量并产生输出变量,大部分是由大语言模型完成的 LLM Chain。 2. Router:可使用判定(甚至用 LLM 判定)让 Agent 走向不同的 Chain。 3. Tool:Agent 上的一次工具调用,如对互联网的搜索或对数据库的检索。 此外,还包括以下三种 Agent: 1. Responser Agent:主 agent,用于回复用户(伪多模态)。 2. Background Agent:背景 agent,用于推进角色当前状态,如进入下一个剧本,抽检生成增长的记忆体等。 3. Daily Agent:每日 agent,用于生成剧本、配套图片和每日朋友圈。 这三种 Agent 每隔一段时间运行一次(默认 3 分钟),分析期间的历史对话,变更人物关系、反感度等,抽简对话内容提取信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。 以上信息提供了关于 AI Agent 的概述,您可以根据自己的需求选择适合的平台和概念进行进一步探索和应用。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-09-13
AI agent 落地例子
以下是关于 AI agent 的相关信息: AI agent 是在 rag 的基础上更进一步,给大模型提供了更多工具,如长期记忆(相当于给大模型一个数据库工具记录重要信息)、规划和行动(在大模型的 prompt 层做逻辑,将目标拆解并输出固定格式的 action 指令给工具)。例如可以让大模型安排差旅,它会判断完成目标所需步骤,搜索差旅记录,预订酒店和机票等。 一些 Agent 构建平台包括: Coze:新一代一站式 AI Bot 开发平台,集成丰富插件工具拓展 Bot 能力。 Microsoft 的 Copilot Studio:具备外挂数据、定义流程、调用 API 和操作等功能,并能部署到多种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识等,并能访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 钉钉 AI 超级助理:依托钉钉优势,在处理高频工作场景表现出色。 大型语言模型置于 Agent 的“大脑”或“控制器”核心位置,赋予强大语言理解和生成能力。通过多模态感知技术和工具利用策略扩展感知和行动范围,采用思维链和问题分解技术展现出推理和规划能力,能从反馈中学习并与环境互动,在软件开发、科学研究等现实世界场景中得到应用,还能与其他 Agent 交流协作。
2024-09-11
什么是agent,技术原理是什么,有哪些应用
智能体(Agent)是指能够自主感知环境、做出决策并执行动作以实现特定目标的实体。 其技术原理包括: AppAgent 可以通过自主学习和模仿人类的点击和滑动手势,能够在手机上执行各种任务。它是一个基于大语言模型的多模态代理,能够处理和理解多种类型的信息(如文本、图像、触控操作等)。 沉浸式单机剧本杀 Bot 由多个 agent 共同协作完成,包括主持人 Agent 通过对话引导玩家,条件判断 Agent 负责解析玩家输入判断触发条件,以及通过对剧本内容进行向量化处理和构建索引来使剧情展开更流畅。 智能体的应用领域广泛,例如: 自动驾驶:自动驾驶汽车中的智能体感知周围环境,做出驾驶决策。 家居自动化:智能家居设备(如智能恒温器、智能照明)根据环境和用户行为自动调节。 游戏 AI:游戏中的对手角色(NPC)和智能行为系统。 金融交易:金融市场中的智能交易算法,根据市场数据做出交易决策。 客服聊天机器人:通过自然语言处理与用户互动,提供自动化的客户支持。 机器人:各类机器人(如工业机器人、服务机器人)中集成的智能控制系统。
2024-09-11
法律类的垂直AI大模型
以下是一些法律类的垂直 AI 大模型: Lawyer LLaMA:首先在大规模法律语料上进行了 continual pretraining,然后借助 ChatGPT 收集了一批对中国国家统一法律职业资格考试客观题的分析和对法律咨询的回答,利用这些数据对模型进行指令微调,让模型习得将法律知识应用到具体场景中的能力。 ChatLaw:由北大开源的一系列法律领域的大模型,包括 ChatLaw13B、ChatLaw33B、ChatLawText2Vec 等。其中,ChatLaw13B 基于姜子牙 ZiyaLLaMA13Bv1 训练而来,ChatLaw33B 基于 Anima33B 训练而来,逻辑推理能力大幅提升。此外,还使用 93w 条判决案例做成的数据集基于 BERT 训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配。
2024-07-12
PPT制作怎么插入垂直直线
在PPT中插入垂直直线,您可以按照以下步骤操作: 1. 打开您的Microsoft PowerPoint程序,并打开您想要插入直线的演示文稿。 2. 选择您想要插入直线的幻灯片。 3. 在菜单栏中,找到“插入”选项,点击它。 4. 在“插入”菜单中,您可以看到“形状”选项。点击它,会弹出一个形状列表。 5. 在形状列表中,找到“直线”或者“垂直直线”的图标。通常,“直线”图标是一个水平的直线,而“垂直直线”则是一条垂直的直线。 6. 点击“垂直直线”图标后,您的鼠标指针会变成一个十字准线,同时会有一个提示框显示“拖动鼠标绘制形状”。 7. 在幻灯片的适当位置点击并拖动鼠标,绘制出您想要的垂直直线。 8. 当您释放鼠标按钮时,直线就会被插入到幻灯片中。 9. 您可以点击直线以选择它,然后在格式工具栏中调整它的颜色、粗细、样式等属性,以符合您的演示需求。 10. 完成后,您就可以继续编辑您的演示文稿或进行演示了。 注意:不同的PowerPoint版本可能在界面和选项上有所不同,但基本的插入直线操作是相似的。如果您使用的是其他版本的PowerPoint或者在线的PowerPoint替代品,步骤可能会有所不同。
2024-05-23
如何运用知识图谱搭建垂直领域的知识库智能问答
知识图谱是一种结构化的知识表示方法,它通过节点和边来表示实体之间的关系。在垂直领域的知识库智能问答中,知识图谱可以作为问答系统的基础,帮助系统理解用户的问题,并从知识库中检索相关信息。以下是一些关键步骤和考虑因素: 1. 数据收集和预处理: 收集与垂直领域相关的数据,包括文本、图像、音频和视频等。 对数据进行清洗、去噪和标准化处理,确保数据的质量和一致性。 2. 实体识别和关系抽取: 使用实体识别技术识别文本中的关键实体,如人名、地点、组织等。 通过关系抽取技术识别实体之间的关系,如“作者写了书籍”。 3. 构建知识图谱: 根据实体和关系,构建知识图谱的节点和边。 使用图数据库(如Neo4j)来存储和管理知识图谱。 4. 问答系统设计: 设计一个能够理解自然语言问题的问答系统。 使用自然语言处理(NLP)技术,如命名实体识别、意图识别、槽填充等,来解析用户的问题。 5. 查询和推理: 使用知识图谱查询语言(如SPARQL)进行查询,以检索与用户问题相关的信息。 利用图神经网络等方法进行知识图谱上的推理,以生成更准确的答案。 6. 答案生成和优化: 将从知识图谱中检索到的信息转化为自然语言回答。 对回答进行优化,使其更加清晰、准确和易于理解。 7. 系统集成和部署: 将问答系统集成到垂直领域的应用中,如在线客服、教育平台等。 部署问答系统,并进行持续的监控和优化,以提高系统的性能和用户体验。 在构建垂直领域的知识库智能问答时,需要充分考虑该领域的特点和需求,并利用先进的AI技术和工具,如深度学习、知识图谱、自然语言处理等,来提高问答系统的准确性和效率。随着技术的发展,未来可能会出现更多创新的方法和工具,以进一步优化垂直领域的知识库智能问答系统。
2024-04-18
AI 在电商领域的应用有哪些?
AI 在电商领域的应用包括以下方面: 1. 产品推荐:通过分析客户数据,为每个客户推荐可能感兴趣的产品。 2. 搜索和个性化:改善搜索结果,为客户提供个性化的购物体验。 3. 动态定价:根据市场需求动态调整产品价格。 4. 药品推荐系统:利用机器学习算法分析用户购买记录和症状描述等数据,推荐合适的非处方药品和保健品。 5. 药品库存管理:分析历史销售数据、天气、疫情等因素,预测药品需求量,优化库存管理策略。 6. 药品识别与查询:借助计算机视觉技术,用户拍摄药品图像,自动识别药名并提供相关信息查询服务。 7. 客户服务智能助手:基于自然语言处理技术,回答顾客关于购药、用药、保健等常见问题。 8. 药店运营分析:分析销售、顾客流量、库存等大数据,发现潜在运营问题和优化空间。 9. 药品质量监控:通过机器视觉、图像识别等技术检测药品包装、标签、颜色等是否合格。 10. 药品防伪追溯:利用区块链等技术实现全流程的药品溯源,确保药品供应链的安全和可信度。 11. 推广:制定上市推广方案,包括品牌、产品信息、新品、成分、属性、功效、人群特征、客户分析、产品定位、核心卖点、推广策略、广告、公关、线上推广、线下活动、合作伙伴、资源整合、预算、执行计划、监测、评估、微调方案、价值主张、营销策略、热点话题、消费者、向往感、诱惑钩子等方面。 12. 推广:制定内容营销方案,以提高品牌知名度、增加客户参与度、提高转化率、增加销售等。 13. 图像模型生成菜品照片:如美团外卖商家版后台的应用。
2024-09-19
AI在法律领域的最新应用
以下是 AI 在法律领域的一些最新应用: 1. 专利审查方面:AI 技术通过自动化和智能化手段,帮助专利审查员更高效地处理大量专利申请、检索相关文献、评估专利性和创新性等任务。 2. 法律文书:这是目前 AI 在 2B 行业基本成熟的应用,其格式固定,核心技术是法条/判例的引用,是“搜索”能力和大模型能力的搭配。 3. 虽然目前其他 2B 应用如“AI 客服”等雷声大、雨点小,未达到大量取代人工的预期,但生成式人工智能技术已逐步涵盖艺术创作产业、医疗保健、虚拟现实、数据合成与数据增强等多个领域,为各行业带来创新、效率与价值。
2024-09-19
智能算法的应用场景有哪一些
智能算法的应用场景广泛,以下为您列举一些常见的应用场景: 1. 医疗保健: 医学影像分析,辅助诊断疾病,如 X 射线、CT 扫描和 MRI 图像分析。 药物研发,加速识别潜在药物候选物和设计新治疗方法。 个性化医疗,分析患者数据以提供个性化治疗方案。 机器人辅助手术,提高手术精度和安全性。 2. 金融服务: 风控和反欺诈,识别和阻止欺诈行为,降低金融机构风险。 信用评估,帮助金融机构做出更好的贷款决策。 投资分析,分析市场数据辅助投资者做出明智决策。 提供 24/7 客户服务,回答常见问题。 3. 零售和电子商务: 产品推荐,分析客户数据推荐可能感兴趣的产品。 搜索和个性化,改善搜索结果并提供个性化购物体验。 动态定价,根据市场需求调整产品价格。 4. 制造业: 预测性维护,预测机器故障避免停机。 质量控制,检测产品缺陷提高产品质量。 供应链管理,优化供应链提高效率和降低成本。 机器人自动化,控制工业机器人提高生产效率。 5. 交通运输: 自动驾驶,提高交通安全性和效率。 交通管理,优化交通信号灯和交通流量缓解拥堵。 物流和配送,优化物流路线和配送计划降低运输成本。 无人机送货,将货物快速送达偏远地区。 6. 其他领域: 教育,实现个性化学习,为学生提供定制化学习体验。 农业,分析农田数据提高农作物产量和质量。 娱乐,开发虚拟现实和增强现实体验。 能源,优化能源使用提高能源效率。 此外,KNN 近邻算法也有多种应用场景,包括: 分类问题,如文本分类、图像识别、手写数字识别、医学诊断等。 回归问题,如房价预测、股票价格预测等。 异常检测,识别异常值或离群点。 推荐系统,基于用户兴趣相似性进行推荐。 图像分割,识别图像中的区域。 聚类分析,尤其适用于数据集中簇非明显球形或高斯分布的情况。 人工智能的应用场景还在不断扩展,未来将对我们的生活产生更加深远的影响。
2024-09-18
AI在医疗器械方面有哪些应用?
AI 在医疗器械方面的应用包括以下几个方面: 1. 医疗器械的设计与优化:利用 AI 技术对医疗器械的结构、功能进行模拟和优化,提高器械的性能和安全性。 2. 疾病诊断辅助:通过对医疗数据的分析,帮助医生更准确地诊断疾病。 3. 医疗器械的质量检测:借助机器视觉、图像识别等技术,自动检测器械的外观、包装等是否合格。 4. 医疗设备的维护与预测性维修:分析设备运行数据,提前预测可能出现的故障,安排维护计划。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-09-16
ai在法律方面的应用
AI 在法律方面有以下应用: 1. 协助律师处理复杂案件:律师在面临情绪、精力、时间等压力可能影响专业判断时,可与 AI 协同,借助其优势相互加持。 2. 精准信息检索与整理:律师能指导 AI 精确抓取法律法规、先例判决等关键信息,为案件准备获取素材,也能让其生成和修改标准化合同,减少文档起草和修订的工作量。 3. 辅助整理案件事实和证据:在处理复杂法律关系和前沿性案件时,利用 AI 可减少工作时间。 4. 常用 Prompt 场景: 案例检索:最好使用法律行业垂类的 AI 产品,通用型 AI 可能存在查不出来、数据不全或生成内容不满足需求的情况。 指令词示例: 请搜索近五年内关于商标侵权案件中“混淆可能性”标准的具体判例,并提供相似度最高的三个案例的关键要点摘要。 检索近三年内所有涉及软件算法专利侵权的案例,分析法院判决中关于技术特征对比和侵权判定的标准,为即将面临的专利侵权案件提供参考。 比对不同地区法院在处理劳动争议案件时对加班费计算标准的差异判决,总结对雇主有利的判决趋势,为客户提供合规操作指导。 研究环境法相关案例,特别是涉及工业废弃物处理的法律责任,为客户提供合规处理建议,以降低潜在的法律风险。 5. 提供法律建议的方法: 采用逻辑结构,如 SWOT 分析法或 4P 原则。 从多个角度思考,如在分析商事诉讼时从市场趋势、竞争对手行为等角度思考诉讼策略。 简洁明了总结核心观点和注意事项。 使用引号、分隔符号及连接词组织 Prompt。 赋予 AI 特定角色,如专注于民商事法律领域的律师,以提升工作效率。
2024-09-14
有什么用于视频剪辑的AI应用吗?
以下是一些用于视频剪辑的 AI 应用: 1. MMVid:这是一个集成的视频理解系统,由 Microsoft Azure AI 开发,结合了 GPT4V 的能力和其他视觉、音频和语音处理工具。能够处理和理解长视频内容,应用场景包括快速的视频剪辑、图生视频和快速诊断等。其核心功能是将视频中的多模态信息转录成详细的文本脚本,以便大语言模型理解视频内容。 2. 在前 Sora 时代,使用的 AI 视频工具包括 Pika、Pixverse、Runway、SVD 等。视频剪辑流程包括粗剪、定剪、音效/音乐、特效和包装等环节。 3. 来来的 AI 视频短片工作流中涉及的工具包括:概念设定使用 MJ,剧本+分镜使用 ChatGPT,AI 出图使用 MJ、SD、D3,AI 视频使用 Runway、pika、PixVerse、Morph Studio,对白+旁白使用 11labs、睿声,音效+音乐使用 SUNO、UDIO、AUDIOGEN,视频高清化使用 Topaz Video,字幕+剪辑使用 CapCut、剪映。
2024-09-13