以下是关于 Coze Web SDK 具体测试的案例:
|测试平台|目的|测试模型||-|-|-||海外版Coze|测试提示词母体模板是否能按规定指令进行生成。|Claude3.5 Sonnet(200K)||国内版Coze||GLM(128K)|先来生成一个现实主义的人物角色。这种角色更贴近我们的日常生活,可以验证模板在创建真实、可信的人物形象方面的能力。这对于创作小说、编写剧本或设计虚拟助手等场景都有重要意义。[heading3]4.1.1国内模型测试——现实主义人物角色[heading3]4.1.2国外模型测试——现实主义人物角色[heading3]4.1.3国内外模型测试——虚幻主义人物角色[content]在这部分测试的最后一段,我将尝试创建一个游戏角色,我选择了广为人知的魔兽世界作为背景,这不仅因为它的知名度,更因为它丰富的世界观和多样化的种族设定为我们的测试提供了理想的素材。这种测试可以检验我们的模板在处理虚构、奇幻元素时的表现,对游戏开发、角色扮演游戏设计等领域有重要参考价值。(由于篇幅有限,在这里只放一张效果图)测试一圈下来我的整体感受就是:基线达到了,国内外的模型都能按要求生成拟人化提示词,但是效果不一。按生成质量来说,Claude最好,GPT其次,MoonShot第三。至于其他的。。。凑合能看吧。所以,我强烈建议大家在条件允许的情况下,优先选择使用Claude模型进行测试和实际应用。它不仅能够生成更加优质的内容,还能带来更多的可能性和创新空间。
首先进入Coze,点击「个人空间-工作流-创建工作流」,打开创建工作流的弹窗。根据弹窗要求,自定义工作流信息。点击确认后完成工作流的新建,可以看到整个编辑视图与功能如下:其中,左侧「选择节点」模块中,根据我们的子任务需要,实际用上的有:1.插件:提供一系列能力工具,拓展Agent的能力边界。本案例涉及的思维导图、英文音频,因为无法通过LLM生成,就需要依赖插件来实现。2.大模型:调用LLM,实现各项文本内容的生成。本案例的中文翻译、英文大纲、单词注释等都依赖大模型节点。3.代码:支持编写简单的Python、JS脚本,对数据进行处理。而编辑面板中的开始节点、结束节点,则分别对应1.2分解子任务流程图中的原文输入和结果输出环节。接下来,按照流程图,在编辑面板中拖入对应的LLM大模型、插件、代码节点,即可完成工作流框架的搭建。
首先进入Coze,点击「个人空间-工作流-创建工作流」,打开创建工作流的弹窗。根据弹窗要求,自定义工作流信息。点击确认后完成工作流的新建,可以看到整个编辑视图与功能如下:其中,左侧「选择节点」模块中,根据我们的子任务需要,实际用上的有:1.插件:提供一系列能力工具,拓展Agent的能力边界。本案例涉及的思维导图、英文音频,因为无法通过LLM生成,就需要依赖插件来实现。2.大模型:调用LLM,实现各项文本内容的生成。本案例的中文翻译、英文大纲、单词注释等都依赖大模型节点。3.代码:支持编写简单的Python、JS脚本,对数据进行处理。而编辑面板中的开始节点、结束节点,则分别对应1.2分解子任务流程图中的原文输入和结果输出环节。接下来,按照流程图,在编辑面板中拖入对应的LLM大模型、插件、代码节点,即可完成工作流框架的搭建。