以下是对 a16z 的 AI top100 榜单的分析:
A16Z 的 AI top100 榜单聚焦生成式 AI 应用。自 ChatGPT 将生成式 AI 引入公众视野以来,已涌现出成千上万面向消费者的相关产品。
在 AI 陪伴方面,它已成为生成式 AI 的主流应用场景之一。例如,Character.AI 在网页端和移动端榜单上表现出色。网页端有八家 AI 陪伴公司进入榜单,移动端有两家。其中,多数产品自诩“无限制”,用户可进行不受限的对话或互动,且访问主要通过移动网页,平均 75%的流量来自移动设备。对于有移动应用的陪伴产品,用户参与度高,如 Character.AI 每位用户平均每月会话次数达 298 次,Poly.AI 为 74 次。
时隔六个月更新分析,超过 40%的公司是首次出现在榜单上。与六个月前相比,有 30%的新公司。名次进步最大的是 Suno,从第 36 名到第 5 名。移动端最多的应用是图像和视频编辑,占 22%。Luzia 服务西班牙语用户值得关注。字节多款应用上榜,包括 Coze、豆包、CiCi、醒图、Gauth。美学和约会应用开始增加,为用户提供相关建议。此外,Discord 流量值得关注,相当多的应用在其平台完成 PMF 验证。
原文链接:https://a16z.com/100-gen-ai-apps/ 作者:A16Z Olivia Moore 发布时间:2024.03.13 去年 9 月的报告:23 年 9 月 a16z:消费者如何使用生成式 AI?
AI陪伴可能看起来是个小众市场,但实际上,这种互动已经成为生成式AI最为主流的应用场景之一。包括我们在内的数百万人,已经与聊天机器人建立了某种形式的联系。网页端和移动端数据表明,社会正在经历一场转变:AI陪伴正在变得越来越普及。回顾六个月前,只有两家AI陪伴公司跻身前50强榜单;但在这次的分析中,网页端榜单上有八家,移动端榜单上有两家。无论是在网页端还是移动端,[Character.AI](http://character.ai/)都领跑AI陪伴榜单,其在网页端榜单上排名第三,移动端榜单上排名第十六。在我们网页端榜单上的八家AI陪伴产品中,有六家自诩为“无限制”,也就是说,用户可以与它们进行在ChatGPT等平台上可能受限的对话或互动。用户主要通过移动网页来访问这些产品,而不是通过桌面端——尽管它们中几乎没有提供移动应用。平均而言,我们网页端榜单上无审查AI陪伴的流量有75%来自移动设备。对于那些提供移动应用的陪伴产品来说,用户的参与度非常高。在这个类别中表现最出色的产品已经成为用户日常生活不可或缺的一部分,变得和给朋友发信息一样司空见惯——甚至可能更加频繁!依据Sensor Tower的数据显示,[Character.AI](https://apps.apple.com/us/app/character-ai-ai-powered-chat/id1671705818)每位用户平均每月的会话次数为298次,相比之下,[Poly.AI](http://poly.ai/)的用户平均每月会话次数则为74次。
原文链接:https://a16z.com/100-gen-ai-apps/作者:A16Z Olivia Moore翻译:🌈通往AGI之路WaytoAGI.com发布时间:2024.03.13去年9月的报告:[23年9月a16z:消费者如何使用生成式AI?](https://waytoagi.feishu.cn/wiki/SSiTw47KBiOL5HkMrBlcEzYznXq)自从一年多前ChatGPT将生成式AI带入公众视野以来,我们已经见识到了成千上万面向消费者的AI产品——从视频生成到工作流提效,从创意工具到虚拟陪伴。六个月前,我们深入研究了网络流量数据,试图从众多噪音中筛选出真正有价值的信息。我们根据每月访问量对最受欢迎的生成式AI产品进行了排名,并揭示了消费者实际使用这项技术的方式。虽然有一些早期的“赢家”引起了广泛的关注,即ChatGPT和Midjourney,但每个月都有新的AI公司涌现,激发着一个充满活力、竞争激烈的市场发展。如今,时隔六个月,我们再次回到数据中更新我们的分析,根据SimilarWeb(截至2024年1月)再次对前50名AI-first网页端产品进行排名。我们惊讶地发现:与我们2023年9月的报告相比([23年9月a16z:消费者如何使用生成式AI?](https://waytoagi.feishu.cn/wiki/SSiTw47KBiOL5HkMrBlcEzYznXq)),名单上超过40%的公司都是首次出现。然而,与我们最初的分析方法不同——那时我们是先根据网页端流量对公司进行排名,然后针对那些拥有APP的公司补充了移动应用端数据——这一次,我们把网页端和移动端的生成式AI产品分成了两个独立的榜单。
相比六个月前的一期变化还是挺大的,一些值得关注的要点:与6个月前相比有30%的新公司名次进步最大的是Suno,从第36名到第5名移动端最多的应用是图像和视频编辑,占22%Luzia值得关注,主要服务西班牙语用户字节多款应用上榜,包括Coze、豆包、CiCi、醒图、Gauth美学和约会应用开始增加,主要为用户提供美学和照片建议帮助用户更有吸引力。Discord流量是值得关注的,相当多的应用都是在Discord完成的PMF验证。[heading2][如何评估大语言模型的有效性](https://eugeneyan.com/writing/llm-[content]详细讨论了LLM-Evaluators的关键考虑因素,如选择合适的基准、评估方法(直接评分、成对比较、参考基准评估)、使用的指标(分类指标和相关性指标),以及如何对齐评估标准。此外,还探讨了LLM-Evaluators在不同应用场景中的效果,如评估有害输出、摘要质量、问答准确性等。网页还提到了多种LLM-Evaluators的评估技巧、对齐工作流程、微调模型的方法,以及对LLM-Evaluators的批判性分析和支持证据。