以下是关于“Function Calling in AI”的相关内容:
函数调用为 AI 系统带来了诸多重要优势,包括简化用户体验,使用户无需在模型和应用程序间繁琐地复制粘贴信息,过程更流畅直观;显著减少错误发生的可能性,降低输入不正确信息的风险,提高准确性;为更高级的自动化开辟道路,能够处理如酒店预订或制定旅行计划等复杂操作,用户通过简单的语音命令就能完成一系列复杂任务,重新定义了人与技术的互动方式。
在 ChatGPT 中,为让其返回符合要求的 JSON 格式,prompt 的定制尤为重要和复杂。OpenAI 于当地时间 6 月 13 日发布函数调用及其他 API 更新,开发人员可向 gpt-4-0613 和 gpt-3.5-turbo-0613 描述函数,让模型智能地选择输出包含调用函数所需参数的 JSON 对象,这是将 GPT 能力与外部工具和 API 连接的新方法。结合函数调用,本地控制返回 JSON 格式,prompt 定制更简单,AI 输出更可控,可根据实际业务需求选择函数查询或 SQL 查询。
在 AI 智能体方面,工具使用或函数调用通常被视为从 RAG 到主动行为的第一个半步,为现代人工智能栈增加新层。工具本质上是预先编写的代码组件,执行特定操作,如网页浏览、代码解释和授权认证等。系统向 LLM 呈现可用工具,LLM 选择工具、构建必要的结构化 JSON 输入并触发 API 执行以产生最终操作。例如 Omni 的“计算 AI”功能,利用 LLM 直接输出适当的 Excel 函数到电子表格中,然后执行计算并自动生成复杂查询供用户使用。但工具使用仅凭自身不能视为“主动性”,逻辑控制流程仍由应用程序预先定义。
函数调用为我们的AI系统带来了几个至关重要的优势,显著提升了用户体验和系统效率。首先,它大大简化了用户体验。用户不再需要在模型和应用程序之间繁琐地复制粘贴信息,整个过程变得更加流畅和直观。其次,这种方法显著减少了错误发生的可能性。通过最小化用户手动输入的需求,我们降低了输入不正确信息的风险,提高了整体的准确性。最后,也许是最令人兴奋的,函数调用为更高级的自动化开辟了道路。它使我们能够处理更复杂的操作,如酒店预订或制定旅行计划,这些都可以直接由用户对Gemini模型的简单请求触发。这种级别的集成和自动化不仅提高了效率,还为创新的AI应用打开了无限可能:用户只需一个简单的语音命令就能完成一系列复杂的任务,从查询实时数据到执行多步骤的操作。这就是函数调用为我们的AI系统带来的革命性变化,它正在重新定义我们与技术互动的方式。以上就是关于多模态提示词培训课程的所有内容了,希望这个课程能对你产生帮助。这样也就不枉我花费时间重新编排、翻译了。谢谢。
可以发现为了让ChatGPT返回符合要求的JSON格式,prompt的定制就尤为重要和复杂。好消息是,在当地时间6月13日,OpenAI发布函数调用及其他API更新。现在开发人员可以向gpt-4-0613和gpt-3.5-turbo-0613描述函数,并让模型智能地选择输出一个包含调用这些函数所需参数的JSON对象。这是一种更可靠地将GPT的能力与外部工具和API连接起来的新方法。传送门:[Function calling and other API updates](https://openai.com/blog/function-calling-and-other-api-updates)官网有很详细的例子,这里就不再描述代码了。我用本文案例总结大致流程:有个好处是不需要让ChatGPT生成SQL了,减少SQL注入的风险。本地写一个函数执行this.app.mysql.select(table,condition),根据GPT返回的函数名、参数(字段和where)来查询数据,更为安全。但这个方法又有局限性,事先定义函数查询不如SQL查询来的灵活,所以这里也可以让函数改为SQL查询this.app.mysql.query(sql),GPT的函数调用改为:getSqlQuery(sql:string),函数名getSqlQuery,参数:sql,更为灵活。总结:让GPT与函数调用结合,本地控制返回JSON格式,prompt的定制更为简单,AI的输出更为可控。根据实际业务需求采用函数查询或SQL查询,值得一试![heading2]SQL分析示例[content]注:以下SQL分析的数据均是在数据库中伪造的数据,仅供测试。分析每种图表的使用情况分析图表类型是柱状图的创建时间和数量
工具使用或函数调用通常被视为从RAG到主动行为的第一个半步,为现代人工智能栈增加了一个新的层。这些工具,本质上是预先编写的代码组件,执行特定的操作。流行的原语如网页浏览([Browserbase](https://www.browserbase.com/)、[Tiny Fish](https://www.tinyfish.io/))、代码解释([E2B](https://e2b.dev/))和授权+认证([Anon](https://www.anon.com/))已经出现。它们使LLMs能够导航网络、与外部软件(如CRM、ERP)交互并运行自定义代码。该系统向LLM呈现可用的工具,后者然后选择一个工具,构建必要的结构化JSON输入,并触发API执行以产生最终操作。Omni的[计算AI](https://omni.co/blog/introducing-calculations-ai)功能体现了这种方法。它利用LLM直接输出适当的Excel函数到电子表格中,然后执行计算并自动生成复杂查询供用户使用。就此而言,工具的使用是强大的,但仅凭自身并不能被视为"主动性"。逻辑控制流程仍然由应用程序预先定义。我们将在即将到来的设计中探索的真正智能体人,使LLMs能够动态地编写全部或部分自己的逻辑。