Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AL最新前沿

Answer

以下是 AI 领域的一些最新前沿信息:

  • 2024 年 2 月第一周:
    • Maimo:能从任何内容中提取要点。
    • Jellypod:可将订阅内容变成播客。
    • ARTU:能汇总和总结内容。
    • Lepton Search:用 500 行代码构建的 AI 搜索工具。
    • VectorShift:AI 自动化应用构建平台。
    • Findr:AI 搜索您所有软件中的内容。
    • Recraft:AI 帮助创建平面内容和矢量标志。相关链接:AIGC Weekly#57,日期:2024/02/01。
  • 2024 年 1 月第四周:
    • 扎克伯格宣布 Meta 致力于实现 AGI,将两大 AI 研究团队 FAIR 和 GenAI 合并,并投入超 90 亿美元向英伟达采购超 34000 张 H100 显卡,预计 24 年底 Meta 的 GPU 算力达 60 万个 H100。
    • 今年英伟达总的 H100 出货量将有 15 万张,Meta 采购量占 1/5。
    • Meta 正在开发名为 Llama 3 的大语言模型,以提升代码生成和逻辑推理能力。
    • 扎克伯格推动开源的通用人工智能开发方式,这也是大家关注其进展和 Llama3 的原因。相关链接:AIGC Weekly#56,日期:2024/01/23。
Content generated by AI large model, please carefully verify (powered by aily)

References

AIGC 周刊 by 歸藏

|标题|概要|图片|链接|日期||-|-|-|-|-||2024年2月第一周|Maimo:从任何内容中提取要点<br>Jellypod:将你的订阅内容变成播客<br>ARTU:汇总和总结内容Lepton Search:500行代码构建的AI搜索工具VectorShift:Al自动化应用构建平台<br>Findr:Al搜索你所有软件中的内容<br>Recraft:Al帮助创建平面内容和矢量标志||[AIGC Weekly#57](https://waytoagi.feishu.cn/wiki/DS5HwXakBiXBelkdgbtcMRmqn9g)|2024/02/01||2024年1月第四周|扎克伯格在他的threads和Ins上发布了一段视频,宣布Meta将会致力于实现AGI,为了实现这一目标公司正将其两大AI研究团队FAIR和GenAI进行合并,同时将投入超过90亿美元向英伟达采购员超过34000张H100显卡,到24年底Meta的GPU算力将达到60万个H100.<br>今年英伟达总的H100出货量将有15万张,Meta一下就要拿走1/5真的狠。<br>对于通用人工智能究竟是什么,以及何时能实现,连扎克伯格自己也没有明确的答案。尽管如此,他依然全力以赴地研究智能的各个方面,从逻辑推理到直觉判断。Meta正在开发名为Llama 3的大语言模型,目的是提升它在代码生成和逻辑推理方面的能力。<br>重要的是扎克伯格正在推动一种开源的通用人工智能开发方式,这也是大家这么关注他的进展和Llama3的原因。||[AIGC Weekly#56](https://waytoagi.feishu.cn/wiki/LFHYwgRNnizQb2kUxPrcDC3DnWb?table=tblcsRYm5QJiaXeA&view=vewoEOVVhr)|2024/01/23|

Others are asking
Function Calling 是什么
Function Calling 是一种在自然语言处理和人工智能领域中的技术和概念。 在金融业务场景中,例如搜索欧元兑美元的当前汇率,使用前需要做好配置,如使用 Gemini 1.5 Flash 模型。 对于 ChatGPT 而言,为了让其返回符合要求的 JSON 格式,prompt 的定制尤为重要和复杂。OpenAI 发布函数调用及其他 API 更新后,开发人员可以向 gpt40613 和 gpt3.5turbo0613 描述函数,并让模型智能地选择输出一个包含调用这些函数所需参数的 JSON 对象,这是将 GPT 的能力与外部工具和 API 连接起来的新方法。例如,本地写函数执行 this.app.mysql.select,这样使得 prompt 的定制更为简单,AI 的输出更为可控。 在 OpenAI 的相关实践中,Chat completions API 允许在请求时附带一系列函数描述,模型可据此产生函数参数,API 以 JSON 格式返回参数用于执行函数调用,函数调用的结果还可反馈给模型形成交互循环。想深入了解可查看 GPT 入门指南里的函数调用部分和 OpenAI Cookbook 里的用例。但需注意,模型生成的代码不一定都正确和安全,使用前要确保环境安全。
2025-03-14
OpenAl 发布 Agent 工具包
OpenAI 刚发布了全新的 Agent 工具包,这标志着 AI 智能体进入了新时代。新推出的 Responses API 及相关工具,简化了开发者构建多功能 AI Agent 的流程,实现了自动化任务处理。其中,网络搜索、文件搜索及计算机使用工具相结合,使 AI 不仅能获取实时信息,还能执行复杂操作。这不仅是对 Assistants API 的全面升级,也意味着智能体进入统一接口、标准化开发的新阶段。OpenAI 表示,2025 年将是 Agent 的元年,让 AI 超越聊天框,成为工作中的“数字助理”与“数字同事”。开发智能体不再需要拼凑繁杂代码,只需 4 行代码即可实现。
2025-03-13
生成头像chinali,背景今日家庭联盟开始AGI之路
很抱歉,不太明白您“生成头像 chinali,背景今日家庭联盟开始 AGI 之路”的具体需求。能否请您再详细描述一下,比如头像的风格、色彩偏好、人物特征等方面的要求,以便我为您提供更准确的帮助。
2025-03-12
实现一个简单的 function calling agents ,要求小白可以看懂
以下是一个关于实现简单的 function calling agents 的指导,以便小白能够理解: 实现原理: 提示词工程主要由提示词注入和工具结果回传两部分代码组成。提示词注入用于将工具信息及使用工具的提示词添加到系统提示中,它包含 TOOL_EAXMPLE、tools_instructions 和 REUTRN_FORMAT 三个部分。TOOL_EAXMPLE 用于提示 LLM 如何理解和使用工具,编写时应注意用无关紧要的工具作示例避免混淆。tools_instructions 是将通用工具字典转换成 LLM 可读的工具列表,实际使用时可动态调整。REUTRN_FORMAT 定义了调用 API 的格式。工具结果回传阶段利用正则表达式抓取输出中的“tool”和“parameters”参数,对于 interpreter 工具使用另一种正则表达式提取 LLM 输出的代码,通过识别 LLM 返回的调用工具的字典提取对应值传入工具函数,将工具返回结果以 observation 角色返回给 LLM,对于不接受相关角色的 LLM 接口可改为回传给 user 角色。 实现方式的比较与建议: 1. JSON Output:通过 Prompt 方式让模型输出 JSON 格式内容,但 Prompt 麻烦,输出不稳定,串业务成本高。 2. JSON Mode:官方 JSON Output,与 Tools 适用场景不同,JSON mode 为输出 JSON 存在,Tools 为 Call API 存在。 3. 从可控角度推荐 Function Calling 和 Tools 实现: 放弃 JSON mode,模型输出 JSON 仍可能出错,模型厂家对 Function Calling 有微调优化。 降低 System prompt 依赖,能在 Tools 里写的尽量写在里面。 API Response 增强 Prompt,准确率高。 尽量让模型做选择而非填空,减少 token 输出,提高速度和准确率。 利用 Tools 做 Route,构建 Multi Agent,术业有专攻。 此外,在初级菜鸟学习 Langchain 做简单 RAG 方面: 1. 没有用 Langchain 做 table 和 text 的 RAG: Table 表格:包括读入表格 markdown 格式嵌入 template 和直接使用 function call 两种方法。 Text 文字:包括文字相似度检索过程,涉及读入文字、清洗、切分、向量化、计算相似度等步骤。 2. 用 Langchain 做 table 和 text 的 RAG:包括运用 Agent 和 Chain 等方式。 3. 使用 Agent 把文本多种文档组合起来。 相关代码和示例可参考相应的链接。
2025-03-11
function calling 这是什么?
Function Calling 是一种在自然语言处理和人工智能模型中的技术。 在金融业务场景中,例如搜索欧元兑美元的当前汇率,使用前需要做好配置,如使用 Gemini 1.5 Flash 模型。 对于 ChatGPT 而言,为了让其返回符合要求的 JSON 格式,prompt 的定制尤为重要和复杂。OpenAI 发布函数调用及其他 API 更新后,开发人员可以向 gpt40613 和 gpt3.5turbo0613 描述函数,并让模型智能地选择输出一个包含调用这些函数所需参数的 JSON 对象,这是将 GPT 的能力与外部工具和 API 连接起来的新方法。例如,本地写函数执行 this.app.mysql.select。 对于 OpenAI 的 GPT 模型,Chat completions API 允许在请求中传递一系列函数描述,使模型能够根据提供的模式生成函数参数,API 以 JSON 格式返回生成的函数参数,可用于执行函数调用,函数调用的输出还可在后续请求中反馈给模型形成交互循环。想深入了解可查看 GPT 入门指南里的函数调用部分和 OpenAI Cookbook 里的用例。 需要注意的是,模型生成的代码不一定都是正确和安全的,在运行代码前要确保环境安全,最好在沙盒中进行。
2025-03-06
codepal 相关信息
CodePal 是一款全面的 AI 编程助手,具有以下特点: 1. 智能代码生成:用户输入编程语言及功能描述,即可自动生成相应的代码片段,适用于 Python、Java、JavaScript 和 C++等多种编程语言。 2. 广泛的语言支持:支持超过 30 种编程语言,包括主流语言(如 C、Ruby、Kotlin)和低级语言(如 C++、Rust),能满足不同开发需求。 3. 用户友好界面:设计简洁直观,适合从初学者到经验丰富的开发者等各类用户轻松上手。 4. 功能多样化:除代码生成外,还提供调试建议、代码优化和单元测试生成等功能,有助于提升代码质量和效率。 5. 免费计划:提供基本功能的免费版本,适合爱好者和初学者尝试使用。其独特之处在于强大的 AI 驱动能力,能让用户通过自然语言轻松生成高质量代码,节省时间并减少错误。
2025-03-05
快速帮我补充下大模型的发展时间线和关键节点,以及当前最前沿的新闻
大模型的发展时间线和关键节点如下: 2017 年:发布《Attention Is All You Need》论文。 2018 年: Google 提出 BERT,创新性地采用双向预训练并行获取上下文语义信息及掩码语言建模。 OpenAI 提出 GPT,开创仅使用自回归语言建模作为预训练目标的方式。 2021 年:Meta 提出 Large LAnguage Model Approach(LLAMA),成为首个开源模型。 2022 年 11 月 30 日:ChatGPT 发布,在全球范围内掀起人工智能浪潮。 2022 年 12 月:字节云雀大模型等出现。 2023 年: 国内大模型发展大致分为准备期(国内产学研迅速形成大模型共识)、成长期(数量和质量逐渐增长)、爆发期(开源闭源大模型层出不穷,形成百模大战态势)。 关键进展包括:Meta 开源 Llama2、OpenAI 发布多模态 GPT4V 及 GPT4 Turbo、百川智能开源 Baichuan7B 及 Baichuan2、百度升级文心一言 4.0、清华&智谱 AI 开源 ChatGLM2 及清华开源 ChatGLM3、腾讯发布混元助手等。 当前最前沿的新闻包括:过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从 7 月份与 GPT3.5 的 20 分差距,到 11 月份测评时已在总分上超越 GPT3.5。
2025-03-14
现在ai最前沿的发展趋势是什么
AI 技术的发展历程和前沿趋势如下: 发展历程: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现机器学习算法如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前前沿技术点: 1. 大模型(Large Language Models):如 GPT、PaLM 等。 2. 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:例如元学习、一次学习、提示学习等。 5. 可解释 AI:涉及模型可解释性、因果推理、符号推理等。 6. 机器人学:涵盖强化学习、运动规划、人机交互等。 7. 量子 AI:包含量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 在学习路径方面: 偏向技术研究方向: 1. 具备数学基础,如线性代数、概率论、优化理论等。 2. 掌握机器学习基础,包括监督学习、无监督学习、强化学习等。 3. 深入学习深度学习,如神经网络、卷积网络、递归网络、注意力机制等。 4. 熟悉自然语言处理,如语言模型、文本分类、机器翻译等。 5. 了解计算机视觉,如图像分类、目标检测、语义分割等。 6. 跟进前沿领域,如大模型、多模态 AI、自监督学习、小样本学习等。 7. 进行科研实践,包括论文阅读、模型实现、实验设计等。 偏向应用方向: 1. 掌握编程基础,如 Python、C++等。 2. 熟悉机器学习基础,如监督学习、无监督学习等。 3. 熟练使用深度学习框架,如 TensorFlow、PyTorch 等。 4. 应用于自然语言处理、计算机视觉、推荐系统等领域。 5. 做好数据处理,包括数据采集、清洗、特征工程等。 6. 进行模型部署,如模型优化、模型服务等。 7. 参与行业实践,如项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 此外,去年生成式 AI 从不引人注意走到了 AI 50 强榜单的前列。今年,随着企业用户和消费者的 AI 生产力大幅提高,其成为前沿和中心。尽管 2023 年美国的大部分 AI 风投流向了基础设施领域,应用公司仍在 AI 50 强榜单中占据主导地位。如今,许多公司正将 AI 融入其工作流程,以此来快速达成 KPI。不远的将来,我们有望看到 UX 和 UI 围绕 AI 的功能进行重新设计。
2025-03-08
前沿ai学习网站
以下是一些前沿的 AI 学习网站: 1. WaytoAGI:这是一个致力于人工智能(AI)学习的中文知识库和社区平台。为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。它汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯。平台提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。此外,社区还定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 2. 在没有任何推广的情况下,WaytoAGI 一年时间已有超过 100 万用户和超千万次的访问量。其目标是让每个人的学习过程少走弯路,让更多的人因 AI 而强大。目前合作过的公司/产品包括阿里云,通义千问,淘宝,智谱,支付宝,豆包,火山引擎,marscode,coze,堆友,即梦,可灵,MiniMax 海螺 AI,阶跃星辰,百度,Kimi,吐司,liblib,华硕,美团,美的,360,伊利,魔搭,央视频,Civitai,Openart,Tripo3D,青椒云等。 3. 「通往 AGI 之路」的品牌 VI 融合了独特的设计元素,以彩虹色彰显多元性和创新,以鹿的形象象征智慧与优雅,通过非衬线字体展现现代感和清晰性,共同构建了一个充满活力和前瞻性的品牌形象。
2025-01-23
目前最前沿的ai服装模特app
目前较为前沿的 AI 服装模特相关的应用有: Stitch Fix 是一家服装公司,已使用 AI 向客户推荐特定服装,并正在尝试使用 DALLE 2 根据客户对颜色、面料和款式的偏好创建服装可视化。 InterAlia 可以帮助搭配服装。 在小红书上,有通过 AI 制作服装如 AI 小绿裙实现变现的案例,新手可用 mewxai 或幻火来制作,熟练者可用 sd 或 mj 制作。 此外,还有用 AI 定制萌娃头像等相关应用。
2025-01-06
前沿AI硬件
以下是关于前沿 AI 硬件的相关信息: 由郎瀚威 Will 发起的 GenAI 硬件榜单: 定义:利用 GenAI 技术(主要是 LLM),与音频生成、翻译、视觉采集并解读相结合,以可穿戴为主逐步渗透的新品类硬件,以 Meta 雷朋眼镜为代表。 本期情况:未收录较大的 GenAI 硬件如 AI PC、AI 手机,以可穿戴、AI 助理相关硬件为起点。 榜单受众:GenAI 硬件创始人、投资人、从业者等。 榜单标的:以北美市场的视角,销量、影响力为主。 榜单初心:随着 Meta 眼镜的成功,GenAI 硬件爆发在即,每月从多角度围观这一现象,旨在给创业者提供参考。 本次更新(9.19): 更新亚马逊销量、独立站流量、新品发布、融资信息,排序标准从媒体综合指数改为 Tiktok 热度。 完善挂件、戒指、眼镜等分类榜数据。 榜单目录:包括 GenAI 硬件北美公开销量榜、GenAI 硬件亚马逊销量榜等共 15 个重要榜单。更多榜单可文末点击“阅读原文”免费访问或直接访问飞书:https://zw73xyquvv.feishu.cn/wiki/IqcqwTDiYiKttNktBg3cg8HgnLh 。数据来源:google、tiktok、twitter、亚马逊。对于榜单内容有疑问想交流的 GenAI 硬件创始人,或者想合作转载内容的公众号博主,请加微信,或者在本文末留言。 今年很火的几款 AI native 硬件: Rewind Pendant:可穿戴设备,能捕捉现实中所说和听到的内容,进行录音转录、数据加密和本地存储,保障安全性和隐私保护。https://www.rewind.ai/pendant Rabbit R1:新型人工智能驱动的移动设备,通过高级语音命令简化应用程序使用,售价 199 美元,配备 360 度摄像头、触摸屏和 4G 连接。Rabbit OS 基于 Large Action Model(LAM 大动作模型),能处理自然语言并转化为可执行任务,与常见应用交互,支持语音命令执行复杂任务,未来用户可教会其执行特定任务。https://www.rabbit.tech/
2024-12-27
AI图生视频前沿
以下是关于 AI 图生视频前沿的相关信息: 在近半年闭源产品趋势方面: 1. 服务头部创作者方面,产品将逐渐增强编辑器能力,强化视频细节可控性,并智能化后期制作任务。 2. 影视后期方向,可将动捕演员表演转化为虚拟角色,提高特效制作效率。 3. 专业领域,创作者能通过草图分镜快速验证效果,但目前效果不够成熟。 4. 随着实时生成能力提升和成本下降,AI 实验性艺术在博物馆、展览等互动应用将增多。 5. 在 C 端大众消费侧,AI 视频在小说、网文阅读、短情景剧等内容消费方向有潜力,人物识别和替换可衍生电商平台虚拟试衣间能力。 6. 模板套用能力若以低成本开放在短视频产品中,可能带来新的爆发周期。 其他动态包括: 1. Krea 用开放的 API 做了自己的 AI 视频功能,支持对任何视频输入提示词进行延长。 2. Runway 发布 ActOne 功能,支持将现实视频的人物表情和动作迁移到生成的视频上,且已全量开放。 3. Ideogram 发布 Ideogram Canvas,可在无限画布上对生成的图片进行编辑。 4. Meta 的图像分割模型 SAM 更新了 2.1,大幅加强了相似物体和小物体的分割和识别效果。 在 2024 年国内外 AI 企业竞争方面: 1. 中国开源项目赢得全球粉丝,成为积极开源贡献者。DeepSeek 在编码任务中表现出色,阿里巴巴的 Qwen2 系列视觉能力令人印象深刻,清华大学的 OpenBMB 项目催生了 MiniCPM 项目。 2. 国外 Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,并在定制化方面进步显著。今年 3 月推出的 Stable Video 3D 可预测三维轨道。 3. OpenAI 的 Sora 能生成长达一分钟的视频,保持三维一致性等,还使用原始大小和纵横比的视觉数据训练。 4. Google DeepMind 的 Veo 将文本和可选图像提示与嘈杂压缩视频输入结合,创建并解码独特的压缩视频表示。
2024-12-26
有什么ai学习的最新资讯么
以下是关于 AI 学习的最新资讯: WaytoAGI(通往 AGI 之路)是一个致力于人工智能学习的中文知识库和社区平台。它为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。在没有任何推广的情况下,一年时间已有超过 100 万用户和超千万次的访问量。目前合作过的公司/产品包括阿里云、通义千问、淘宝、智谱等众多知名企业和产品。 3 月 4 日的 AI 资讯: 【AI 3D】Meshcapade 预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝;InsTaG 通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果;3DMem 为新型 3D 场景记忆框架。 【AI 绘图】智谱开源 AI 绘图 CogView4,可在图像中生成中文字符;海螺推出 Image01 多功能文本转图像模型。 【AI 视频】Runway 被网友爆料内测能力可根据参考图像进行 Video to Video 视频风格化;Vidu 的 API 开放平台全面开放。 【AI 模型】Google Colab 推出 Data Science Agent;微软为医疗行业提供首个统一语音 AI 助手 Dragon Copilot;Opera 宣布推出网页浏览器的 AI 代理。 对于新手学习 AI,建议持续学习和跟进,AI 是快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。
2025-03-14
本周最新的AI资讯
以下是本周最新的 AI 资讯: 3 月 12 日: 【AI 3D】:BlenderMCP 与 Claude AI 沟通,在 Blender 实现快速 3D 建模;MIDI 可实现单幅图像到 3D 场景生成;Move AI 更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】:MMStoryAgent 是 AI 多模态故事生成系统。 【AI 视频】:VACE 是阿里推出的一体化视频创作和编辑技术;VideoPainter 是腾讯开源的视频编辑技术;Wonder Dynamics 推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】:OpenAI 为开发者推出一套 AI Agent 开发套件;R1Omni 是阿里情感识别模型,通过视频识别情感;Luma AI 发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能;Manus 宣布与阿里通义千问团队达成战略合作。 3 月 4 日: 【AI 3D】:Meshcapade 预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝;InsTaG 通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果;3DMem 是新型 3D 场景记忆框架。 【AI 绘图】:智谱开源 AI 绘图 CogView4,可以在图像中生成中文字符;海螺推出 Image01 多功能文本转图像模型。 【AI 视频】:Runway 网友爆料其内测能力可根据参考图像进行 Video to Video 视频风格化;Vidu 的 API 开放平台全面开放。 【AI 模型】:Google Colab 推出 Data Science Agent;微软为医疗行业提供首个统一语音 AI 助手:Dragon Copilot;Opera 宣布推出网页浏览器的 AI 代理。 AIGC Weekly32: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器:
2025-03-13
最新的Ai资讯
以下是 3 月 4 日、10 日、12 日的 AI 资讯汇总: 3 月 4 日: 【AI 3D】 Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。 InsTaG:通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果。 3DMem:新型 3D 场景记忆框架。 【AI 绘图】 智谱:开源 AI 绘图 CogView4,可以在图像中生成中文字符。 海螺:推出 Image01 多功能文本转图像模型。 【AI 视频】 Runway:网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。 Vidu:API 开放平台全面开放。 【AI 模型】 Google Colab:推出 Data Science Agent。 微软:为医疗行业提供首个统一语音 AI 助手:Dragon Copilot。 Opera:宣布推出网页浏览器的 AI 代理。 3 月 10 日: 【AI 3D】 MeshPad:草图创建 3D 网格,支持编辑修改,实现直观和交互式的 3D 建模。 【AI 写作】 Muse:专门为小说创作训练的 AI 模型工具,可实现在线的小说续写修改,创意头脑风暴以及同时基于画布形式的故事创作。可免费试用。 【AI 视频】 Luma:发布 Ray2 Flash 视频模型,生成速度快 3 倍,成本便宜三倍。 【其他】 OpenAI:为旗下模型推出模型对比页面,可对于模型基础能力进行直观对比了解。 谷歌:为开发者推出 Gemini 嵌入模型 Gemini Embedding。 中国成功研制“祖冲之三号”量子计算原型机。 3 月 12 日: 【AI 3D】 BlenderMCP:与 Claude AI 沟通,在 blender 实现快速 3D 建模。 MIDI:单幅图像到 3D 场景生成。 Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】 MMStoryAgent:AI 多模态故事生成系统。 【AI 视频】 VACE:阿里推出一体化视频创作和编辑技术。 VideoPainter:腾讯开源视频编辑技术。 Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】 OpenAI:为开发者推出一套 AI Agent 开发套件。 R1Omni:阿里情感识别模型,通过视频识别情感。 Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。 Manus:宣布与阿里通义千问团队达成战略合作。
2025-03-13
coze工作流的相关教程。要求从入门到实操的最新资料
以下是关于 Coze 工作流从入门到实操的相关资料: 一、一泽 Eze 的教程 Step 1:制定任务的关键方法 1. 设计每个子任务的执行方法 阅读理解小作业:基于英文原文,精心策划 3 道符合 CET4 难度的阅读理解题目。每道题均提供 A、B、C、D 四个选项,正确答案所在选项顺序随机,题目和选项均以英文呈现。题目的参考格式如下: 1) A. B. C. D. 参考答案:针对 3 道题目,生成题目答案。预期格式如下: 1) 答案: 2) 答案: 3) 答案: 英文音频:根据原文,利用 TTS 技术朗读全文 全文对照精读:根据原文,按照以下格式,分段完成全文精读结果的输出: 音标: 中文释义: 英文例句: 例句翻译: 二、大圣的教程 二、Coze 使用教程 1. 工作流AI Agent 的内功心法 节点:工作流是由多个节点构成,节点是组成工作流的基本单元。节点的本质就是一个包含输入和输出的函数。 Coze 平台支持的节点类型: LLM(大语言模型):使用输入参数和提示词生成处理结果。 Code(代码):通过 IDE 编写代码处理输入参数,并返回输出值。 Knowledage(知识库):根据输入参数从关联知识库中召回数据,并返回。 Condition(条件判断):ifelse 逻辑节点,用于设计工作流内的分支流程,根据设置条件运行相应的分支。 Variable(获取变量):从 Bot 中获取变量作为参数在工作流中使用。 Database(数据库):在工作流中使用提前配置在 Bot 数据库中的数据。 2. 创建和使用工作流 这一块官方有现成的教程参考: 海外参考文档:https://www.coze.com/docs/zh_cn/use_workflow.html 国内参考文档:https://www.coze.cn/docs/guides/use_workflow 国内版本还提供了一些示例,学习工作流强烈建议大家跟着实操一遍: 搜索新闻:https://www.coze.cn/docs/guides/workflow_search_news 使用 LLM 处理问题:https://www.coze.cn/docs/guides/workflow_use_llm 生成随机数:https://www.coze.cn/docs/guides/workflow_use_code 搜索并获取第一个链接的内容:https://www.coze.cn/docs/guides/workflow_get_content 识别用户意图:https://www.coze.cn/docs/guides/workflow_user_intent 三、蓝衣剑客的教程 三、Coze 简介 1. 工作流 在典型应用场景中,入门级场景可能仅添加一个节点来构建简单工作流。例如,使用获取新闻插件构建一个获取新闻列表的工作流;使用大模型节点接收并处理用户问题等。 更进阶的场景则通过多个节点组合构建逻辑较复杂的工作流。例如,在搜索并获取指定信息详情的场景中,先通过插件能力进行关键词搜索、然后通过代码节点过滤指定信息、最后通过插件能力获取信息详情;或者在通过条件判断识别用户意图的场景中,通过大模型节点处理用户消息,并将消息分类后通过条件节点分别处理不同类型的消息。这些详细配置教程提供了实际操作指南以帮助理解和应用各种功能。
2025-03-12
我是AI小白,应该如何浏览了解AI的最新资讯
对于 AI 小白来说,想要浏览了解 AI 的最新资讯,可以参考以下方法: 1. 持续学习和跟进:AI 是一个快速发展的领域,新的研究成果和技术不断涌现。您可以关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。 2. 考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 3. 关注腾讯研究院开发的一系列专业的 AI 资讯产品,如: AI 每日速递,一份高度凝练的日报产品,帮助您用 3 5 分钟快速掌握 AI 领域当日十大关键进展。 AI 每周 50 关键词,作为周报产品,基于 AI 速递内容构建。通过梳理一周热点关键词并制作可交互索引,为研究者提供便捷的“检索增强”工具,助力快速定位所需信息。 科技九宫格,一档短视频栏目,以 3 5 分钟视频形式解读科技热点与关键技术原理。通过可视化呈现,促进您对前沿技术的理解与讨论。 4. 您还可以通过以下友情链接获取最新资讯:
2025-03-11
我想了解法律AI的最新发展状况
以下是关于法律 AI 最新发展状况的一些信息: 潘帅作为法律科技探索者,整理了关于 AI 大模型使用方法的资料并结合自身经验编写了相关内容。他指出在人工智能时代,律师要实现人机协同,需理解 AI 优劣势及自身长处与不足。 《促进创新的人工智能监管方法》提到,AI 已在众多领域带来重大进步和效率提升,具有巨大的变革潜力,能用于多种场景,推动经济增长和创造就业。但这只是开始,随着技术发展,会有更多应用出现,英国需创造利于创新的监管环境。 AIGC 法律风险研究报告指出,AI 将改变生活各方面,带来生产力解放和生产关系变化,法律需做出回应。生成式人工智能技术在多领域带来创新、效率与价值的同时,也带来了传播虚假信息、侵犯个人信息权益、数据安全等法律风险。飒姐法律团队致力于为其发展保驾护航,总结法律红线风险,提示合规要点。
2025-03-11