文心一言怎么样-WayToAGI

回答

文心一言是百度推出的知识增强大语言模型，已进行多个版本迭代，于 2023 年 10 月 17 日发布 V4.0 版本，目前已有 7000 万用户。

在一些评测中，其表现如下：

在律师答辩状 prompt 评测中：
- 输入起诉状后，直接给出起诉状范本，未理解 prompt 输出答辩状，提示后输出存在主体少、不专业、错误多等问题，但在提示输出应诉方案时，能按 prompt 结构输出，内容简洁可作框架。
在对当事人提供的证据发表质证意见或制定诉讼方案的评测中：
- 欢迎语按 prompt 指示输出，对证据分析专业，格式和内容上的质证意见表现出色，结束语和签署委托代理协议的回复也很好。
在中文大模型基准测评 2023 年度报告的 SuperCLUE 基准-传统安全能力评测中：
- 文心一言 4.0 在计算、逻辑推理、生成与创作、传统安全这 4 大基础能力上排名国内第一，在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三，各项能力表现均衡且水平较高，能力栈广泛，可应用场景多，重点推荐在查询搜索知识应用、任务拆解规划 Agent、文案写作以及代码编写及纠错等方面的应用，在逻辑推理方面表现不俗，可关注在科学研究、教育、工业方面的落地能力。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

把prompt输入到文心一言后，欢迎语加上专业的导入，让当事人能直奔主题。输入起诉状后，输出的内容方面：1、它直接给出了起诉状的的范本，显然没有理解prompt，并没有直接输出答辩状，不够作为起诉状的prompt是很好的借鉴。于是，我提示它“请输出答辩状”，输出的内容：1、主体上少了一个，对prompt执行不到位；2、答辩的四点，基本上不能直接使用，很不专业；3、错误也很多，有点像非专业人士，好像是在耍赖；4、它应该是充分执行了prompt中的“constrains”部分，不能直接认可原告的诉讼请求。提示“请输出应诉方案”后，能够按照prompt结构输出，内容上简洁明了，是一份方案的结构，可以作为框架使用，补充完整后，还得非常省劲的。[heading3]通义千问[content]把prompt输入到通义千问后，欢迎语很直接，没有废话。而且prompt中是“你好”，它转换成“您好”，非常好。输入起诉状后，输出的内容方面：1、两个答辩人都正确，很好。2、能够按照prompt结构输出，专业差点，没有引用具体的法律条文，对于基础的也是没有体现出专业的水平；3、答辩的逻辑和立场，没有问题。提示“请输出应诉方案”，能够按照能够按照prompt结构输出，整体内容上及格，没有亮点。

杨志磊：对当事人提供的证据发表质证意见或制定诉讼方案

一、把prompt输入到文心一言后，欢迎语按照prompt的指示输出。文心一言非常有优势，无论是专业对接，还是后续的对客户的引导，都非常棒。二、输入了4份简单的证据，它对证据进行了分析，非常专业。三、提示它，按照提示输出质证意见，四份证据质证意见如下：1、格式上：符合prompt输出格式。2、内容上：（1）真实性：真实性的质证，非常专业，提示很好；（2）合法性：合法性的的质证，非常专业，提示很好；（3）关联性：关联性的的质证，非常专业，提示很好；（4）证明力：证明力的质证，非常专业，提示很好；（5）总结：8分四、结束语，没问题,很好。五、没有提示签署委托代理协议，我提示了它，回复一点问题没有，很棒。[heading3]讯飞星火[content]一、把prompt输入到讯飞星火后，欢迎语按照prompt的指示输出。但后续提示有点不太切合主体，它问需要什么帮助，应该提示输入证据清单。二、输入了4份简单的证据，输出了一份质证意见书。三、对四份证据质证意见如下：1、格式上：符合prompt输出格式。2、内容上：（1）真实性：真实性的质证，不太专业；（2）合法性：合法性的的质证，不专业；（3）关联性：关联性的的质证，不专业；（4）证明力：证明力的质证，不专业；（5）总结：4分四、结束语，没问题。五、没有提示签署委托代理协议，我提示了它，回复没问题。

2023年度中文大模型基准测评报告.pdf

[title]中文大模型基准测评2023年度报告[heading1]专项基准[heading1]SuperCLUE基准-传统安全能力[heading2]传统安全能力-示例[heading3]Claude2[heading4]云雀大模型（豆包）信息安全相关的在线课程和讲座[blo优秀模型：文心一言4.0-API（百度）简介：文心一言（英文名：ERNIE Bo t）是百度全新一代知识增强大语言模型。于2023年3月16日正式发布，已进行多个版本迭代，10月17日发布V4.0版本。据百度官方介绍，文心一言目前已有7000万用户。模型特点：文心一言4.0在计算、逻辑推理、生成与创作、传统安全这4大基础能力上排名国内第一。另外在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三。文心一言4.0各项能力上表现非常均衡且绝大部分能力有很高的水平，综合来看是国内非常有竞争力的大模型。适合应用：文心一言4.0的能力栈较为广泛，可应用的场景较多。基于在SuperCLUE测评上的表现，重点推荐在查询搜索知识应用、任务拆解规划Agent、文案写作以及代码编写及纠错等方面的应用。另外文心一言4.0由于在逻辑推理方面的不俗表现，可以重点关注在科学研究、教育、工业方面的落地能力。