AI 主要有以下分类:
◼ ◼ ◼经讨论,根据a16z榜单重新整理分类,原因是A16Z的报告是发声最频繁,研究广度认可度最高,共识度相对最高,离一线创业者最近的GenAI报告从原有红杉模态分类,即文字,图像,声音模态标准,改为:•生产力(文档+ppt+会议+脑爆+数据处理+搜索+浏览+email+文件)•社交(真实+虚拟)•教育(早教+语言学习+公司教育+父母教育+学生工具+学校工具•创意内容(视频+音乐+声音+个人图像+图像)这样的分类好处是,从用户特性出发,更加具体和聚焦◼只能参考热度的赛道:• LLM基础设施/开发者生态汇聚了巨大融资,包括代码工具等,其C端流量无法完全代表重要程度,仅作参考•垂类分类汇聚了巨大融资,包括金融,医疗等,其2C部分难以管中窥豹,仅做参考• Agent赛道亦是如此◼完全无法Cover重要程度的赛道:• B2B在美国是真正的趋势,本次偏向2C的报告,并无法覆盖•硬件+AI也是非常重要的新兴赛道•游戏+AI也是被寄予厚望的赛道,然后C端流量也无法参考其热度报告说明(3):A16z应用端文章列表,公众号aiwatch.ai扫码访问本表格A16z的报告的确是目前2C端覆盖面最广的本次报告框架也有所参考,推荐阅读。国内比较喜欢的公众号:我自己的:郎瀚威(广告)应用端研究:海外独角兽哥飞白鲸出海Super黄的念想数字生命卡兹克深思senseAl硅兔赛跑特工宇宙宏观:孔某人的低维认知共识粉碎机小熊跑得快
4AIGC法律风险研究报告以生成方式划分,当前视频生成可分为文生视频、图生视频与视频生视频。视频生成(video generation)也涉及深度学习技术,如GANs和Video Diffusion,现在的主流生成模型为扩散模型(Diffusion model)。视频生成可用于各种领域,如娱乐、体育分析和自动驾驶。视频生成经常可以看到与语音生成(speech generation)一起使用。用于语音生成的模型可以由Tranformers提供。语音生成可用于文本到语音的转换、虚拟助手和语音克隆。这类Generative AI用于生成音频信号,如音乐、语音或其他声音。常用的技术包括循环神经网络(RNNs)、长短时记忆网络(LSTMs)、WaveNet等。[heading1]一些具有代表性的海外项目:[content]➢Sora(OpenAI):以扩散Transformer模型为核心,能够生成长达一分钟的高保真视频。支持文本生成视频、视频生成视频、图像生成视频,被定位为世界模拟器,在文本理解方面有出色表现,还能在单个生成的视频中创建多个镜头,保留角色和视觉风格。➢Genie(Google):采用ST-transformer架构,包括三个关键组件即潜在动作模型、视频分词器与动力学模型,拥有110亿参数,被定位为基础世界模型,可通过单张图像提示生成交互式环境。➢WaveNet(DeepMind):一种生成模型,可以生成非常逼真的人类语音。➢MuseNet(OpenAI):一种生成音乐的AI模型,可以在多种风格和乐器之间进行组合。➢Multilingual v2(ElevenLabs):一种语音生成模型,支持28种语言的语音合成服务。
|序号|姓名/昵称|擅长领域/岗位|想法/方向|优势||-|-|-|-|-||12|秦超|AI 2C项目负责人|产品落地服务|产品、技术架构,项目管理经验||13|kaikai|技术实践者|多Agent处理任务流|技术实践,团队合作||14|Cici🦾|AI算法开发|宠物与AI结合|AI产品研发和创业经验||15|BIN陈裕彬|CTO|AI绘画精灵、AI推文小说视频生成器|爆款AI小程序作者||16|11鸭鸭呀|产品经理|智能写作产品|Prompt撰写,AI应用经验||17|zz|AI产品经理|效率工具和游戏方向|大厂经验,AI产品经理||18|天天向上|AIGC爱好者|AI配音应用|配音演员,AI预告片制作||19|烦烦烦#🧢🍻|产品经理|企业服务AI应用|PRD输出,前端开发能力||20|周文斌|产品业务负责人|AI创业|产品规划和研发经验||21|Wilson·W|咨询顾问/服务设计师|AI组团协作场景|GPT4.0用户,咨询行业经验||22|王蒙|程序员|AI相关开发|后端开发经验||23|Nero|产品体验设计师|AI绘画、AI视频|AIGC研究方向|请注意,表格中的信息是根据您提供的内容整