「AGIへの道」飛書ナレッジベースへ直行 →

ai+赛道盘点

回答

以下是一些 AI 相关的赛道盘点:

  • AI 与宠物结合:这是一个充满想象空间的新兴赛道,可基于 AI 技术和宠物行业需求开发各种有趣有用的应用。
  • Agent 相关比赛赛道:
    • 图文创作赛道:包括 AI 自动编写文章并选择或生成相应图片、图像标注、图文匹配等。
    • 实用工具赛道:涵盖数据可视化、设计辅助(如生成 LOGO、海报设计)、自动化排版、图文识别等。
    • 互动创意赛道:例如新闻和社交媒体方面,AI 对大量信息进行自动编辑和汇总生成有趣的图文摘要;艺术创作领域,辅助绘画、音乐创作、文学创作等,鼓励探索 AI 与艺术结合的新模式。
AIモデルによって生成されたコンテンツであり、慎重に確認してください(提供元: aily)

参照

问:AI 怎么和宠物结合?

总的来说,AI+宠物是一个充满想象空间的新兴赛道,结合AI技术和宠物行业需求,可以开发出各种有趣有用的应用。内容由AI大模型生成,请仔细甄别

13. Agent 相关比赛

|大赛赛道|图文创作赛道|实用工具赛道|互动创意赛道|<br>|-|-|-|-|<br>|参考方向方向仅供参考,欢迎更多符合赛题的创意和场景参赛|内容生成:例如,AI可以自动编写文章,然后为文章选择或生成相应的图片。图像标注:AI可以识别和理解图片内容,并为图片生成相应的文字描述图文匹配:为给定的图片找到最合适的文字描述,或为给定的文字找到最相匹配的图片。数据可视化:将复杂的数据进行可视化展示,用图表、信息图等方式进行显示,使数据解读更直观、简洁。设计辅助:例如生成LOGO,海报设计等。自动化排版:根据文本内容与结构,自动进行页面布局与美观的排版。图文识别:在借助OCR技术进行图文抓取内容后,AI能够理解并处理这些信息。新闻和社交媒体:AI可以对大量新闻和社交媒体信息进行自动编辑和汇总,生成有趣的图文摘要。艺术创作:辅助绘画、音乐创作、文学创作等艺术领域,鼓励参赛者探索AI与艺术结合的新模式。

扣子 AI 工坊 Coze AI Factory 火热开启

|大赛赛道|图文创作赛道|实用工具赛道|互动创意赛道|<br>|-|-|-|-|<br>|参考方向方向仅供参考,欢迎更多符合赛题的创意和场景参赛|内容生成:例如,AI可以自动编写文章,然后为文章选择或生成相应的图片。图像标注:AI可以识别和理解图片内容,并为图片生成相应的文字描述图文匹配:为给定的图片找到最合适的文字描述,或为给定的文字找到最相匹配的图片。数据可视化:将复杂的数据进行可视化展示,用图表、信息图等方式进行显示,使数据解读更直观、简洁。设计辅助:例如生成LOGO,海报设计等。自动化排版:根据文本内容与结构,自动进行页面布局与美观的排版。图文识别:在借助OCR技术进行图文抓取内容后,AI能够理解并处理这些信息。新闻和社交媒体:AI可以对大量新闻和社交媒体信息进行自动编辑和汇总,生成有趣的图文摘要。艺术创作:辅助绘画、音乐创作、文学创作等艺术领域,鼓励参赛者探索AI与艺术结合的新模式。

他の質問
AI将带来哪些新赛道、新机会
AI 带来的新赛道和新机会包括以下方面: 1. 引领新的服务模式,即“智能即服务”,重塑工作和生活,为芯片和云计算行业带来新机遇,GPU 需求预计持续增长。 2. 企业软件、AI 驱动的金融服务以及 AI 健康技术成为吸引投资的主要领域,机器人行业投资额可能成为下一轮 AI 革命的重要爆发点。 3. 科技巨头通过资本控制 AI 模型公司,企业竞争策略呈现分化,行业未来更加多元化和复杂。 4. 大模型争霸,如 OpenAI、Gemini、Anthropic、LLama 以及来自法国的 Mistral 等公司相互竞争,为 AI 发展设定标准。 5. 随着模型规模和自然语言理解能力增强,专业创作和企业应用将改变甚至颠覆,如营销文案、邮件沟通、客户服务等。 6. 基础模型领域竞争刚开始,如 OpenAI、Google、Cohere 等公司,以及新兴的开源选项和共享神经网络模型的社群。 7. 基于 LLMs 服务或训练 Transformer 模型,诞生涉及多个行业的新应用。 8. 进入多模态灵活转换的新时代,实现文本、图像、音频、视频等多模态相互理解和转换。 9. 人类劳动形式“软件化”,复杂劳动被抽象为可调用的软件服务。 10. AI 行业目前亏损,商业化进程有待提升。 11. 云厂商是产业链中的“链主”。 12. 头部 AI 应用中,创意工具仍占最大比重,To P 应用市场潜力大,ToB 应用发展路径复杂,ToC 应用面临挑战。 13. Copilot 和 AI Agent 是 AI 应用的主要技术实现方式。 14. 北美和欧洲贡献了 AI 移动应用市场三分之二的份额,中国 AI 公司积极出海。
2025-04-01
想进入AI 这个赛道,有啥搞钱方式
以下是进入 AI 赛道的一些搞钱方式: 1. 参加“城市狂想”文旅短视频创意大赛: 该大赛由百度百家号主办,国内最大 AI 开源社区通往 AGI 之路协办,于 8 月 27 日正式开启。 无论个人、团体还是机构,AI 视频创作者或普通自媒体创作者,都可选择适合的分赛道参与,奖金池达 60000 元。 优质作品有机会获得单项 10000 元奖金及百+助推,还有机会获得地方政府/媒体扩圈传播,百度 APP 城市频道商业 banner 推荐。 针对零基础/技术欠缺的朋友,下周将在社区开设线上直播课程,由行业内顶尖的 AI 艺术家手把手教学如何制作 AI 文旅宣传片。 报名方式: 第一步,报名,填写右侧报名链接,本赛道为实名制,未报名作者不参与评奖。https://www.wjx.top/vm/w2oCF2q.aspx 第二步,投稿,在百家号创作者后台/百度 APP,带话题城市狂想发布符合活动要求的视频内容。(允许同一作者投稿多个参赛作品,或参与多部参赛作品制作。) 第三步,提交作品,填写右侧提交作品链接。https://www.wjx.top/vm/wvfqf2f.aspx 2. 运营 AI 创作账号: 变现方式:分为通过官方蒲公英平台接单和主流媒体约稿。蒲公英平台会收取 10%手续费,行业 AI 视频价格一分钟约 2.5 万到 4 万,主流媒体约稿稿费可能较低但有背书作用。 平台选择:推荐小红书和 B 站。小红书从种草平台逐渐变为知识社区,其知识属性适合 AI 创作者,视频号也值得做但经验分享较少。 内容形式:小红书能发视频就发视频,小红书的视频 UI 界面改版且推送机制变化,后续可能重点发力视频。 账号赛道:起号前期可用妖魔鬼怪类内容,但后期要扭转账号标签,此类账号变现方式窄,做账号要有价值,不能割韭菜,要把 AI 生态圈做大。 账号搭建与运营: 头像设计:要有记忆点和视觉冲击力,能让人记住。 名称选择:要独特,能体现个人或内容特点。 简介撰写:要有哲理或引人思考的话语,能吸引用户。 封面统一:要统一且具有账号属性,体现商业化。 追热点策略:账号初期应追热点,如对热门内容进行分析和跟风创作。 获取信任:做 IP 最终要赢得用户信任,用户信任能增强其对推荐内容的关注度。 3. 运营 AI 视频号: 保持日更:起号阶段至少两天一更,每天半小时就能完成 20 秒的简单内容制作,持续更新让平台看到创作者的诚意。 选择赛道:资讯类不做,选择 AI 视觉冲击力、利他的内容,有 AI 基础可做教程。 寻找对标:起号阶段要找 10 个对标的账号,参考其内容和模式。 克服心理:出镜做 IP,不要有容貌焦虑,长得丑或有特点都能有流量,要克服不敢出镜的心理。 蹭取热点:蹭经过平台验证有流量的热点,如黄油小熊,根据热点抄学制作,同时注意热点的舆论导向和合规性。 其他经验: 获取视频教程:可在 vtwoagi.com 网站的飞书知识库中获取 AI 视频创作教程。 应对抄袭方法:在抄袭者评论区留言指出,或找朋友点赞将评论顶上去,为自己账号引流。 特效视频长度:建议控制在 1 分钟内,不建议做费时费力的剧情或故事片。 账号限流处理:视频号限流建议重新起号,小红书限流可日更 10 天尝试。 内容商业价值:内容有商业价值的标准是甲方或品牌愿意投钱,如靠播放量或带货分成有收入。 封面获取渠道:可从堆友、吉梦、小红书等获取封面素材。 蹭取平台热点:做哪个平台就蹭哪个平台的热点。 寻找对标账号:在小红书创作者平台的成长榜样中可找到对标账号。 账号标签查看:在小红书创作者后台可查看账号是否被打上标签。 内容发布时间:8 点到 10 点、2 点到下午 5 点、7 点到 8 点较为合适。
2025-03-28
AI赛道融资情况
以下是关于 2024 年 AI 赛道融资的一些情况: 从整体来看,AI 仍是最强吸金赛道。国内 AI 行业融资总金额增加,但事件数同比下降,反映出机构更加谨慎的理性态度,且马太效应越发明显,资本更青睐热点和高成熟度赛道。 在细分赛道中,智能驾驶表现突出,投资事件数量和金额总数远超其他赛道,多家企业成功 IPO 为市场注入信心与活力。AI+教育、AI+游戏、AI+医疗等赛道也迎来投资总额的增长,机构对技术难度更高、壁垒更强、更晚达到 TPF 的赛道更感兴趣。 政策方面,政府积极推进 AI 原生行业发展,北京、上海、武汉等城市出台系列政策吸引人才和企业。国家队频繁出手投资体现政策的鼓励与支持。 具体案例方面,Cursor 宣布获得 1.05 亿美金 B 轮融资;爱诗科技完成 A+轮近 3 亿元融资;深圳市计划每年投入超 15 亿元专项资金支持 AI 产业发展,并将设立 100 亿元产业基金。
2025-03-14
AI应用赛道中top应用介绍,实现的功能和应用场景,产品Launch时间:AIGC功能 Launch时间、当前月活用户数、营收利润、一年成本投入、市场占有率、目前融资金额及估值、创始团队介绍、公司员工规模、所属国家、用户来源、用户来自于哪些国家、用户profile、转化率、ROI等等, 盈利模式,优劣势与未来发展趋势。
以下是关于 AI 应用赛道的相关介绍: 应用场景:涵盖医疗、制造业、金融风控、消费端个性化服务、办公、农业、能源优化、娱乐等领域。 关键技术: 1. 包括大语言模型作为中枢神经系统,记忆模块实现长期和短期记忆,以及规划能力中的目标设定、任务拆解、生成策略、执行与反馈、资源管理和多智能体协同。 2. 强化学习用于环境感知和决策调整,多模态融合涉及多种数据类型,低成本训练是考虑成本的重要因素。 智能体特征:包括自主性、交互性和适应性,如通过自我对弈和博弈不断进化,在金融风控领域利用大量数据提升准确率。 AI 技术路线:从有语言能力的 AI 到有推理能力,再到能使用工具、发明创新以及形成组织,共五级。 智能体框架类型:分为任务驱动型、多智能体协作、强化学习型、具身智能体、应用型智能体,每种类型都有代表性框架。 智能体与大模型的关系:大模型是中枢和基石,智能体是行动引擎,两者协同演进,智能体产生的数据可反哺大模型。 未来趋势:智能体可能在中小企业中更具效益,人机协作中人类成为监督角色,但存在算力成本、伦理风险、技术瓶颈等挑战。 B 端变现与创业方向: 1. B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。 2. 自媒体创业:视频号等平台尚有蓝海空间,需具备内容创新和差异化,内容成本低且更新迭代快。 3. 游戏创业:个人或团队可做轻量化游戏,结合 AI 技术,满足放松和社交需求,专注垂类赛道,避免与大厂竞争。 4. 影视创业:25 年将是拐点,更多内容会采用 AI 技术,如哪吒 2 因前期规划未用 AI 技术。 5. 广告营销创业:重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: 1. 创业难点:创业对创业者综合能力要求极高,找到志同道合且能力互补的战友是创业前期最难的事。 2. AI 虚拟人发展:从早期以首位为核心的宅文化虚拟偶像,到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人,其发展历程不断演进。 3. 虚拟人产业链:包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。 4. 未来创业机遇:AI 虚拟人是未来 310 年 Web 3.0 的风口,提前布局未来有潜力的赛道,准备好迎接机遇。 相关案例和产品信息: 1. 10 月 26 日,AI 翻译和口型匹配技术在视频制作中的应用逐渐流行,公司如 Captions、HeyGen 和 Verbalate 通过 AI 生成字幕、配音和口型匹配等功能,帮助用户轻松实现视频翻译本地化。 2. 10 月 25 日,Perplexity 最新估值约为 5 亿美元,较 3 月宣布的 1.5 亿美元估值上涨 300%以上,当前的付费用户数量达到了 1.5 万人,截止本月,Perplexity 的 ARR 达到 300 万美元,最新估值约为 ARR 的 150 倍。 3. 《100 个有意思的 AI 应用》由国盛证券出品,分为基于 LLM 自然语言能力的对话、写作、阅读、分析等应用;多模态技术持续发展,图像、视频、音频、3D 等 AIGC 应用;企业级应用等。
2025-03-14
请起草一份小白学习AI辅助修图的入门到精通的教程,提供学习大纲,包括从基本玩法到高级卡bug玩法,常见红海赛道,常见问题,注意事项,常见误区,避坑指南等等
以下是为您提供的小白学习 AI 辅助修图从入门到精通的教程大纲: 一、基础知识与基本玩法 1. 了解 AI 辅助修图的概念和基本原理。 2. 熟悉常见的 AI 修图工具和软件。 二、常见问题与注意事项 1. 风格局限性:如全是二次元风格,缺少适合特定需求的风格。 2. 图像叙事性不足:画出来的多为美少女看镜头,缺乏叙事内容。 3. 素材局限性:已有素材单一,图生图可行性低,训练泛化性差。 三、常见误区与避坑指南 1. 避免盲目依赖初始的 Embedding、CKPT 等方法,不断尝试和改进。 2. 注意训练集中人物朝向固定等问题,采取相应处理措施,如镜像处理。 四、从入门到精通的进阶玩法 1. 掌握不同的训练方法,如 Lora 等,以获得更理想的效果。 2. 学会引导 AI 画出具有前景后景区分明显的图像,如制作引导图。 五、高级卡 bug 玩法 探索一些非常规但有效的技巧和方法,以突破常规限制,实现更出色的修图效果。但需注意,此部分玩法可能存在一定风险和不确定性。 六、常见红海赛道 分析当前 AI 辅助修图在不同领域的竞争激烈程度和应用热点。 在学习过程中,还需了解以下 AI 相关的技术原理和概念: 1. 生成式 AI 生成的内容称为 AIGC。 2. 相关技术名词: AI 即人工智能。 机器学习包括监督学习、无监督学习、强化学习,监督学习有标签,无监督学习无标签,强化学习从反馈中学习。 深度学习参照人脑神经网络,神经网络可用于多种学习方式。 生成式 AI 可生成多种内容形式。 LLM 为大语言模型,不同模型有不同擅长的任务。 3. 技术里程碑:2017 年 6 月谷歌团队发表的《Attention is All You Need》提出了 Transformer 模型。
2025-03-05
请起草一份小白学习AI应用(包括app和网站)的入门到精通的教程,提供学习大纲,包括从基本玩法到高级卡bug玩法,常见红海赛道,常见问题,注意事项,常见误区,避坑指南等等
以下是一份小白学习 AI 应用(包括 app 和网站)的入门到精通的教程,涵盖学习大纲、常见问题等方面: 一、学习大纲 1. 了解 AI 基本概念 阅读相关资料,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(机器学习、深度学习、自然语言处理等)及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅 参考「」中的初学者课程,了解生成式 AI 等基础知识,推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并争取获得证书。 3. 选择感兴趣的模块深入学习 AI 领域广泛,包括图像、音乐、视频等,根据自身兴趣选择特定模块深入学习。 掌握提示词技巧,因其上手容易且实用。 4. 实践和尝试 理论学习后进行实践,巩固知识,尝试使用各种产品创作作品。 分享实践后的经验和成果。 5. 体验 AI 产品 与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式,获得实际应用体验。 二、常见红海赛道 目前,AI 在自然语言处理、图像识别、智能推荐等领域竞争较为激烈。 三、常见问题 1. 对复杂应用的需求理解不准确,导致产品出错。 2. 技术组件的配置和整合可能遇到困难。 四、注意事项 1. 注重基础知识的学习,打牢根基。 2. 实践过程中要耐心,遇到问题多尝试解决。 五、常见误区 1. 认为 AI 学习短期内就能精通,忽略了长期积累和实践的重要性。 2. 过度依赖现成的模型和工具,缺乏对原理的深入理解。 六、避坑指南 1. 在选择学习资源时,要注意其权威性和适用性。 2. 开发 AI 应用时,要充分考虑用户需求和实际场景,避免盲目跟风。 希望以上内容对您有所帮助,祝您在 AI 学习的道路上取得成功!
2025-03-05
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
24年AI大事件盘点
以下是 2024 年 AI 大事件的盘点: 10 月: 9 月 27 日:Reecho 睿声●三只羊录音事件涉及 AI 公司出面回应。 9 月 28 日:TeleAI●正式开源 TeleChat2115B。 10 月 1 日:快手●可灵 AI 全面开放 API,OpenAI DevDay。 10 月 2 日:Black Forest Labs●发布 FLUX1.1,苹果●推出多模态大模型 MM1.5。 10 月 3 日:OpenAI●发布 ChatGPT Canvas。 10 月 8 日:2024 年诺贝尔物理学奖。 10 月 9 日:2024 年诺贝尔化学奖。 10 月 10 日:字节●发布首款 AI 智能体耳机 Ola Friend,Vivo●增加蓝心端侧大模型 3B,谷歌●图像生成模型 Imagen 3 开放使用,智源●BGE 登顶 Hugging Face 月榜,State of AI 2024 报告发布。 10 月 11 日:智谱●GLM4Flash 与「沉浸式翻译」合作,北大&北邮&快手●开源高清视频生成模型 Pyramid Flow。 10 月 12 日:OpenAI●开源多智能体协作框架 Swarm,深势科技●完成数亿元人民币新一轮融资,苹果●质疑当前 LLM 缺乏真正的逻辑推理能力。 10 月 14 日。 11 月: 11 月 1 日:《》来自南乔,10 月 AI 行业大事件盘点包括多家公司的重要发布和创新,如 OpenAI 推出多项新功能,字节发布 AI 智能体耳机,以及各大模型的开源。趋势方面,强化学习被认为是推动 AGI 发展的关键技术,原生多模态模型逐渐成为研究热点。新兴应用如 AI 音乐创作、翻译和智能助手等受到关注,整体呈现出技术与应用的快速发展态势。 11 月 1 日:《》来自歸藏,10 月份美国 AI 聊天机器人市场报告显示,ChatGPT 仍是市场领导者,但份额逐渐下降。谷歌和微软在争夺第二的位置,Perplexity 和 ClaudeAI 则实现高速增长,正在从 ChatGPT 和 Gemini 手中蚕食市场份额。总体来看,专业 AI 工具的增长势头强劲,而初创公司的用户获取相对缓慢。 11 月 1 日:《》比尔・盖茨在采访中讨论了人工智能的革命性影响,认为 AI 将使每个人都能成为“超级个体”,改变人机交互方式。他强调 AI 将显著降低白领工作的成本,并逐渐影响蓝领市场。盖茨还提到他对全球健康和气候问题的关注,认为技术创新速度超出预期,未来 20 年将是充满希望的时期。他同时探讨了可再生能源的发展,尤其是核能和太阳能的潜力。 在 2024 年,AI 商业界还发生了以下事件: 全球芯片出口管制下,中国仍成重要市场。美国商务部长吉娜·雷蒙多警告英伟达:“如果你围绕中国特定的需求重新设计芯片,我将在第二天控制它。”据悉,中国在美芯片制造商中所占的份额正在减少。据英伟达称,它从代表 NVIDIA 数据中心业务的 20%下降到“中个位数”。尽管中国实验室在进口硬件方面受到限制,但其当地分支机构目前没有控制权。字节跳动通过美国的甲骨文租用 NVIDIA H100 访问权限,而阿里巴巴和腾讯则与 NVIDIA 就在美国建立自己的数据中心进行谈判。与此同时,谷歌和微软直接向中国大型企业推销他们的云服务。 模型变得更便宜了。以前认为提供强大模型的成本过高,但现在提供这些模型的推断成本正在下降。OpenAI 更达到 100 倍下降!Google Gemini 生产了一种具有很强竞争力的定价系列!Gemini 1.5 Pro 和 1.5 Flash 的价格在推出后几个月内下降了 64%86%,而性能强劲,例如 Flash8B 比 1.5 Flash 贵 50%,但在许多基准测试中表现相当。注意:价格适用于<128K 令牌提示和输出。检索日期为 2024 年 10 月 4 日。考虑到计算成本很高,模型构建者越来越依赖与大型科技公司建立合作伙伴关系。反垄断监管机构担心这将进一步巩固现有公司的地位。
2024-12-15
大模型赛道盘点
以下是对大模型赛道的盘点: 1. Compass Arena 是由上海人工智能实验室和魔搭社区联合推出的大模型测评平台,集齐了国内主流的 20 多款大模型,包括阿里通义千问、百度文心一言、腾讯混元、讯飞星火、字节跳动豆包、智谱 AI、百川智能、零一万物、月之暗面等,用户可在平台选择大模型两两“对战”,实名或匿名对战皆可。在 Qwen 系列中,Qwen2 性能优越,所有尺寸的模型都使用了 GQA 以带来推理加速和显存占用降低的优势,针对小模型使用了 tie embedding 的方法让输入和输出层共享参数。所有预训练模型在 32K tokens 数据上训练,在 128K tokens 时仍有不错表现,指令微调模型还需进行长序列理解实验。 2. 伯克利的团队管理着聊天机器人竞技场,根据 ELO 评级对不同语言模型进行排名,计算方式与国际象棋相似。顶部是专有封闭模型,如 OpenAI 的 GPT 系列和 Anthropic 的 Claude 系列,下方是开放权重的模型,如 Meta 的 Llama2 系列,底部有 Zephyr 7b Beta 等。 3. 有观点认为大模型应用是除内容、电商、o2o、工具之外的第五条赛道,但当前其是否够资格有待商榷。许多产品同学未真正意识到大模型带来的变革,思路和视角仍停留在传统互联网商业模式上。
2024-08-26