与知识库对话 - 文心一言和通义千问哪个更强

回答

文心一言和通义千问在不同方面各有特点。

对于律师答辩状 prompt 的评测：

文心一言：
- 输入起诉状后，直接给出起诉状范本，未理解 prompt 输出答辩状。经提示输出的答辩状存在主体少、不专业、错误多等问题，但提示输出应诉方案时，能按 prompt 结构输出，内容简洁明了，可作为框架使用。
通义千问：
- 输入起诉状后，欢迎语直接，无废话，能正确处理两个答辩人，但专业度稍差，未引用具体法律条文。提示输出应诉方案时，能按 prompt 结构输出，整体内容及格，无亮点。

在结构化 prompt 的测试和反馈中：

文心一言的综合评分为 2.25 分，整体表现一般。
通义千问的综合评分为 3.125 分，表现还算不错，若内容再提高些，体验感和专业性会更好。

此外，文心一言和通义千问都是国内免费的 APP。文心一言是百度出品的 AI 对话产品，定位为智能伙伴；通义千问是由阿里云开发的聊天机器人。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

杨志磊：律师答辩状prompt各模型评测

把prompt输入到文心一言后，欢迎语加上专业的导入，让当事人能直奔主题。输入起诉状后，输出的内容方面：1、它直接给出了起诉状的的范本，显然没有理解prompt，并没有直接输出答辩状，不够作为起诉状的prompt是很好的借鉴。于是，我提示它“请输出答辩状”，输出的内容：1、主体上少了一个，对prompt执行不到位；2、答辩的四点，基本上不能直接使用，很不专业；3、错误也很多，有点像非专业人士，好像是在耍赖；4、它应该是充分执行了prompt中的“constrains”部分，不能直接认可原告的诉讼请求。提示“请输出应诉方案”后，能够按照prompt结构输出，内容上简洁明了，是一份方案的结构，可以作为框架使用，补充完整后，还得非常省劲的。[heading3]通义千问[content]把prompt输入到通义千问后，欢迎语很直接，没有废话。而且prompt中是“你好”，它转换成“您好”，非常好。输入起诉状后，输出的内容方面：1、两个答辩人都正确，很好。2、能够按照prompt结构输出，专业差点，没有引用具体的法律条文，对于基础的也是没有体现出专业的水平；3、答辩的逻辑和立场，没有问题。提示“请输出应诉方案”，能够按照能够按照prompt结构输出，整体内容上及格，没有亮点。

问：国内免费的大模型app有哪些？

Kimi智能助手、文心一言、通义千问这几个都是国内免费的APP。Kimi智能助手：Kimi是一个有着超大“内存”的智能助手，可以一口气读完二十万字的小说，还会上网冲浪，Moonshot AI出品的智能助手。文心一言：百度出品的AI对话产品，它的定位是智能伙伴，能写文案、想点子，又能陪你聊天、答疑解惑。通义千问：通义千问是由阿里云开发的聊天机器人，能够与人交互、回答问题及协作创作。还有更多大模型产品，可以访问网站查看：内容由AI大模型生成，请仔细甄别。

各大模型对结构化prompt的测试和反馈

||输出格式|专业性|完整性|实用性|综合评分||-|-|-|-|-|-||ChatGPT3.5|3.5|2|2|1.5|2.25||Bard|4|4|4|4|4||Kimi chat|4.5|3.5|3|3.5|3.625||智谱清言|4|3|2|3|3||文心一言|3|2|2|2|2.25||讯飞星火|2.5|3|3|3.5|3||Copilot|1.5|3|2|3|2.375||通义千问|3.5|3|3|3|3.125|这次评测，bard综合表现更加稳定和平衡，体验效果最好的，其次是Kimi chat表现也是令我眼前一亮，脱颖而出。智谱清言的表现也不错，整体上表现比较中规中矩。ChatGPT3.5的表现令我有点失望，可能是版本有点低的原因，升级到4.0后再看看。文心一言整体表现一般，波澜不惊。而Copilot表现有点失望，可能希望比较大的原因吧，再看后续的升级迭代吧。通义千问的表现还算不错，只要内容上再提高一些，体验感和专业性会更好一些，期待吧。