目前在写文案和直播稿方面,没有绝对最好用的 AI 工具,不同的工具具有各自的特点和优势。
例如,OpenAI 和 Cohere 的 embedding 模型能够处理各种类型的需求,但开源的最好模型可能还需要指令等。在文档处理方面,国内有像庖丁这样相对较好的公司,但整体上文档处理的价值目前被低估了。
另外,在生成式 AI 产品方面,其不确定性、响应速度和服务成本与之前有很大区别,懂 AI 的产品经理是稀缺资源,他们需要明白这些新的差别,不能按照以前的惯性思维工作。
[title]季逸超Peak《一个AI创业者的反思、观察和预测》[heading1]直播转写文本他们OpenAI跟Cohere的embedding模型,他们能够处理各种类型的需求,比如大家可能知道相似度跟搜索是完全不一样的事,这个我怎么解释呢?就比如说我说两句话,一个是“今天天气不错”,另外是“今天天儿不错”,这两个相似,这个叫相似性。而搜索是什么?我问了今天天气怎么样,他回答的我不是今天天气如何,我要找到的是今天北京多少度,所以这是完全两个problem DOMAIN,而这些专有的模型,他们甚至能把这些DOMAIN给融合目前开源的最好的,像Sota的可能还需要instruction(指令)之类这些东西,所以差距是非常大的。但是目前这块可能有一点被忽视掉,可能大家还没有意识到这一个层面的价值。还有一点更无聊的一件事,就是PDF这个东西,或者说任何这些文档从其中正确的获取信息提取出来,是非常复杂的一件事。国内我记得有一家公司叫庖丁吧,还是什么东西,它可能是国内做的相对来说比较好的,但实际上PDF或者说文档的处理是咱们刚谈到的一切,无论你是向量数据库还是要外置知识的一个前提,这些东西目前来看整体是被低估了的。而且还有一点比较好,就是embedding跟文档模型的应用场景跟向量数据库也类似,它应用场景其实远不止于LLM。接下来这个其实有点老生常谈的话题就是懂AI的产品经理真的是稀缺资源。这个先说一下区别,就是我们目前做生成式AI的产品,感受是它的不确定性、响应速度跟服务成本,跟之前都有非常非常大的区别。一个最简单的例子就是以前我们还会说一个词叫QPS,就是你每秒能承载多少的这个并发,大家一吹都是几百几千的,现在都是零点几,甚至包括像Google、Bard它的其实这个并发能力都非常差,而产品经理如果还按以前这些惯性思维去做的话,你可能会把公司给玩死。所以我们认为懂AI的产品经理,你要在既懂之前的这些东西,你更要明白这其中的一个差别。