Perplexity 是由前 OpenAI 研究科学家 Aravind Srinivas 与前 Meta 研究科学家 Denis Yarats(Perplexity CTO)等合伙人共同创办的。它是一家专注于开发新一代 AI 搜索引擎的公司,创立于 2022 年 8 月。其搜索引擎采用了大型语言模型(LLM)技术,具有理解能力强、生成式回答、个性化和上下文感知等优势,但也存在训练成本高、可解释性差、潜在的偏差和不当内容等劣势。Perplexity 将 LLM 技术应用于搜索引擎领域,试图颠覆传统的基于关键词匹配的搜索范式,为用户提供更自然和智能的搜索体验,还融合了个性化和上下文感知等功能。
Perplexity AI是一家专注于开发新一代AI搜索引擎的公司,创立于2022年8月,由前OpenAI研究科学家Aravind Srinivas与前Meta研究科学家Denis Yarats(Perplexity CTO)等合伙人共同创办。它的搜索引擎采用了大型语言模型(LLM)技术,可以更好地理解和回答用户的自然语言查询。优势理解能力强:Perplexity的LLM模型能够深入理解查询的语义,而不仅仅是匹配关键词,从而提供更准确和相关的结果。生成式回答:它可以生成通顺的自然语言回答,而不是简单返回网页链接和片段。这使得结果更易于理解和使用。个性化和上下文感知:Perplexity可以根据用户的历史查询和偏好来个性化结果,提供更加贴合需求的答复。劣势训练成本高:训练大型LLM模型需要大量的计算资源和高质量的训练数据,成本可能较高。可解释性差:LLM的工作原理较为黑箱,很难解释为什么会给出某个结果,缺乏透明度。潜在的偏差和不当内容:由于训练数据的局限性,LLM可能会产生偏见或不当内容。独特之处Perplexity将LLM技术应用于搜索引擎领域,试图颠覆传统的基于关键词匹配的搜索范式,为用户提供更自然和智能的搜索体验。它还融合了个性化和上下文感知等功能,努力成为新一代的"智能助手"。总的来说,Perplexity凭借LLM的强大语义理解能力,为搜索引擎带来了新的可能性,但也面临着一些技术和伦理挑战。原问题:Perplexity AI如何?谁开发的?其优劣势是?有什么独特之处?
1.首先,LLM的一个很大的缺陷是它无法实时获取最新的信息。它能获取的信息就是预训练时输入的信息,这些信息有一个截断日期,这个日期之后的信息它一概不知(至少无法从模型内部获取到)。而搜索引擎可以获取到更加实时的信息。2.LLM有“幻觉”问题。在缺少相关事实信息的情况下,它就会编造。更严重的是,它很擅长编造,经常编得跟真的一样。而搜索引擎可以检索出相关的信息,这些信息可以作为LLM“推理”的依据。3.LLM无法给出准确的引用来源。LLM吸收了整个互联网的信息,当它回答问题的时候,你会感觉它的回复好像是参考了互联网上的某个地方的内容,但是它无法告诉你它具体引用或者改编的是哪里的内容,因为LLM已经把整个互联网的信息作了词元(token)级别的融合。LLM无法给出引用来源间接带来一个严重问题是,你无法去到信息源,去自己做验证。而搜索引擎可以给予准确的信息源。以上种种问题,决定了LLM本身作为一个知识问答工具是完全不合格的。而搜索引擎的问题则是体验上不够简便、不够直接。搜索引擎返回的信息是一堆链接和文本片段(很多时候还有广告干扰),这种呈现形式是比较原始的,还需要人去做进一步处理。给搜索引擎加上LLM,或许可以带来更优的信息检索体验。Perplexity[4]就是基于这个思路搞出来的产品,目前其估值已经超过5亿美元了,它的目标是要取代Google搜索。这个思路本身没有什么新鲜的,OpenAI早在21年就研究过了[5],后来也有研究者作了进一步的验证[3]。这个思路的技术实现也不复杂,贾扬清大佬用了不到500行Python代码就实现了一个基础版[6]。
原文链接:https://orangeai.notion.site/AI-9283e4365d4e4764a1d1aac28ecdacdb[heading2]引子[content]AI知识搜索引擎Perplexity的创始人Aravind在接受采访时说:最好的点子往往是那些你明说出来,人们还会觉得,哦,谁会去做这个?这听起来真是天方夜谭。为何很多的聪明人看到一个很好的新想法,却会无动于衷?为何大厂的资金和人员都非常充盈,却在创新方面总是慢人一步?Aravind的回答是:只有结合了坚定的决心和深入骨髓的信念,这个想法才有可能成功。而对于商业上已经取得成功的组织,似乎不可避免地陷入了创新的窘境里,很难再有决心和信念。尽管这个窘境已经在互联网浪潮、移动互联网浪潮发生过无数次,在这轮AI浪潮里依然是否可以破局?本文会展开讨论一下这个问题。