与知识库对话 - AI分类

回答

AI 主要有以下分类：

生成式 AI：
- 生产力方面：包括文档、PPT、会议、脑爆、数据处理、搜索、浏览、email、文件等。
- 社交方面：包括真实和虚拟社交。
- 教育方面：涵盖早教、语言学习、公司教育、父母教育、学生工具、学校工具等。
- 创意内容方面：包含视频、音乐、声音、个人图像、图像等。
以生成方式划分：
- 音视频生成类：
  - 视频生成：当前视频生成可分为文生视频、图生视频与视频生视频。主流生成模型为扩散模型，可用于娱乐、体育分析和自动驾驶等领域，经常与语音生成一起使用。
  - 语音生成：用于文本到语音的转换、虚拟助手和语音克隆等，模型可由 Transformers 提供。
  - 音频生成：用于生成音乐、语音或其他声音，常用技术包括循环神经网络、长短时记忆网络、WaveNet 等。
- 一些具有代表性的海外项目：
  - Sora（OpenAI）：以扩散 Transformer 模型为核心，能生成长达一分钟的高保真视频，支持多种生成方式，在文本理解方面表现出色。
  - Genie（Google）：采用 ST-transformer 架构，包括潜在动作模型、视频分词器与动力学模型，拥有 110 亿参数。
  - WaveNet（DeepMind）：一种生成模型，可以生成非常逼真的人类语音。
  - MuseNet（OpenAI）：一种生成音乐的 AI 模型，可以在多种风格和乐器之间进行组合。
  - Multilingual v2（ElevenLabs）：一种语音生成模型，支持 28 种语言的语音合成服务。
在 AI 创客松中，参与同学的分类：
- 秦超：AI 2C 项目负责人，擅长产品落地服务，具有产品、技术架构和项目管理经验。
- kaikai：技术实践者，擅长多 Agent 处理任务流，具备技术实践和团队合作能力。
- Cici?：AI 算法开发，想法是宠物与 AI 结合，具有 AI 产品研发和创业经验。
- BIN 陈裕彬：CTO，方向是 AI 绘画精灵、AI 推文小说视频生成器，是爆款 AI 小程序作者。
- 11 鸭鸭呀：产品经理，专注智能写作产品，擅长 Prompt 撰写和 AI 应用。
- zz：AI 产品经理，方向是效率工具和游戏，具有大厂经验。
- 天天向上：AIGC 爱好者，方向是 AI 配音应用，是配音演员，有 AI 预告片制作经验。
- 烦烦烦#??：产品经理，方向是企业服务 AI 应用，具备 PRD 输出和前端开发能力。
- 周文斌：产品业务负责人，方向是 AI 创业，具有产品规划和研发经验。
- Wilson·W：咨询顾问/服务设计师，方向是 AI 组团协作场景，是 GPT4.0 用户，有咨询行业经验。
- 王蒙：程序员，从事 AI 相关开发，具有后端开发经验。
- Nero：产品体验设计师，方向是 AI 绘画、AI 视频，研究 AIGC 方向。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

生成式AI季度数据报告_2024Q1.pdf

◼ ◼ ◼经讨论，根据a16z榜单重新整理分类，原因是A16Z的报告是发声最频繁，研究广度认可度最高，共识度相对最高，离一线创业者最近的GenAI报告从原有红杉模态分类，即文字，图像，声音模态标准，改为：•生产力(文档+ppt+会议+脑爆+数据处理+搜索+浏览+email+文件)•社交(真实+虚拟)•教育(早教+语言学习+公司教育+父母教育+学生工具+学校工具•创意内容(视频+音乐+声音+个人图像+图像)这样的分类好处是，从用户特性出发，更加具体和聚焦◼只能参考热度的赛道：• LLM基础设施/开发者生态汇聚了巨大融资，包括代码工具等，其C端流量无法完全代表重要程度，仅作参考•垂类分类汇聚了巨大融资，包括金融，医疗等，其2C部分难以管中窥豹，仅做参考• Agent赛道亦是如此◼完全无法Cover重要程度的赛道：• B2B在美国是真正的趋势，本次偏向2C的报告，并无法覆盖•硬件+AI也是非常重要的新兴赛道•游戏+AI也是被寄予厚望的赛道，然后C端流量也无法参考其热度报告说明（3）：A16z应用端文章列表，公众号aiwatch.ai扫码访问本表格A16z的报告的确是目前2C端覆盖面最广的本次报告框架也有所参考，推荐阅读。国内比较喜欢的公众号:我自己的:郎瀚威(广告)应用端研究:海外独角兽哥飞白鲸出海Super黄的念想数字生命卡兹克深思senseAl硅兔赛跑特工宇宙宏观:孔某人的低维认知共识粉碎机小熊跑得快

2024AIGC法律风险研究报告（更新版）.pdf

4AIGC法律风险研究报告以生成方式划分，当前视频生成可分为文生视频、图生视频与视频生视频。视频生成（video generation）也涉及深度学习技术，如GANs和Video Diffusion，现在的主流生成模型为扩散模型（Diffusion model）。视频生成可用于各种领域，如娱乐、体育分析和自动驾驶。视频生成经常可以看到与语音生成（speech generation）一起使用。用于语音生成的模型可以由Tranformers提供。语音生成可用于文本到语音的转换、虚拟助手和语音克隆。这类Generative AI用于生成音频信号，如音乐、语音或其他声音。常用的技术包括循环神经网络（RNNs）、长短时记忆网络（LSTMs）、WaveNet等。[heading1]一些具有代表性的海外项目：[content]➢Sora（OpenAI）：以扩散Transformer模型为核心，能够生成长达一分钟的高保真视频。支持文本生成视频、视频生成视频、图像生成视频，被定位为世界模拟器，在文本理解方面有出色表现，还能在单个生成的视频中创建多个镜头，保留角色和视觉风格。➢Genie（Google）：采用ST-transformer架构，包括三个关键组件即潜在动作模型、视频分词器与动力学模型，拥有110亿参数，被定位为基础世界模型，可通过单张图像提示生成交互式环境。➢WaveNet（DeepMind）：一种生成模型，可以生成非常逼真的人类语音。➢MuseNet（OpenAI）：一种生成音乐的AI模型，可以在多种风格和乐器之间进行组合。➢Multilingual v2（ElevenLabs）：一种语音生成模型，支持28种语言的语音合成服务。

【已结束】AI 创客松

|序号|姓名/昵称|擅长领域/岗位|想法/方向|优势||-|-|-|-|-||12|秦超|AI 2C项目负责人|产品落地服务|产品、技术架构，项目管理经验||13|kaikai|技术实践者|多Agent处理任务流|技术实践，团队合作||14|Cici?|AI算法开发|宠物与AI结合|AI产品研发和创业经验||15|BIN陈裕彬|CTO|AI绘画精灵、AI推文小说视频生成器|爆款AI小程序作者||16|11鸭鸭呀|产品经理|智能写作产品|Prompt撰写，AI应用经验||17|zz|AI产品经理|效率工具和游戏方向|大厂经验，AI产品经理||18|天天向上|AIGC爱好者|AI配音应用|配音演员，AI预告片制作||19|烦烦烦#??|产品经理|企业服务AI应用|PRD输出，前端开发能力||20|周文斌|产品业务负责人|AI创业|产品规划和研发经验||21|Wilson·W|咨询顾问/服务设计师|AI组团协作场景|GPT4.0用户，咨询行业经验||22|王蒙|程序员|AI相关开发|后端开发经验||23|Nero|产品体验设计师|AI绘画、AI视频|AIGC研究方向|请注意，表格中的信息是根据您提供的内容整