文心一言是百度推出的知识增强大语言模型,已进行多个版本迭代,于 2023 年 10 月 17 日发布 V4.0 版本,目前已有 7000 万用户。
在一些评测中,其表现如下:
把prompt输入到文心一言后,欢迎语加上专业的导入,让当事人能直奔主题。输入起诉状后,输出的内容方面:1、它直接给出了起诉状的的范本,显然没有理解prompt,并没有直接输出答辩状,不够作为起诉状的prompt是很好的借鉴。于是,我提示它“请输出答辩状”,输出的内容:1、主体上少了一个,对prompt执行不到位;2、答辩的四点,基本上不能直接使用,很不专业;3、错误也很多,有点像非专业人士,好像是在耍赖;4、它应该是充分执行了prompt中的“constrains”部分,不能直接认可原告的诉讼请求。提示“请输出应诉方案”后,能够按照prompt结构输出,内容上简洁明了,是一份方案的结构,可以作为框架使用,补充完整后,还得非常省劲的。[heading3]通义千问[content]把prompt输入到通义千问后,欢迎语很直接,没有废话。而且prompt中是“你好”,它转换成“您好”,非常好。输入起诉状后,输出的内容方面:1、两个答辩人都正确,很好。2、能够按照prompt结构输出,专业差点,没有引用具体的法律条文,对于基础的也是没有体现出专业的水平;3、答辩的逻辑和立场,没有问题。提示“请输出应诉方案”,能够按照能够按照prompt结构输出,整体内容上及格,没有亮点。
一、把prompt输入到文心一言后,欢迎语按照prompt的指示输出。文心一言非常有优势,无论是专业对接,还是后续的对客户的引导,都非常棒。二、输入了4份简单的证据,它对证据进行了分析,非常专业。三、提示它,按照提示输出质证意见,四份证据质证意见如下:1、格式上:符合prompt输出格式。2、内容上:(1)真实性:真实性的质证,非常专业,提示很好;(2)合法性:合法性的的质证,非常专业,提示很好;(3)关联性:关联性的的质证,非常专业,提示很好;(4)证明力:证明力的质证,非常专业,提示很好;(5)总结:8分四、结束语,没问题,很好。五、没有提示签署委托代理协议,我提示了它,回复一点问题没有,很棒。[heading3]讯飞星火[content]一、把prompt输入到讯飞星火后,欢迎语按照prompt的指示输出。但后续提示有点不太切合主体,它问需要什么帮助,应该提示输入证据清单。二、输入了4份简单的证据,输出了一份质证意见书。三、对四份证据质证意见如下:1、格式上:符合prompt输出格式。2、内容上:(1)真实性:真实性的质证,不太专业;(2)合法性:合法性的的质证,不专业;(3)关联性:关联性的的质证,不专业;(4)证明力:证明力的质证,不专业;(5)总结:4分四、结束语,没问题。五、没有提示签署委托代理协议,我提示了它,回复没问题。
[title]中文大模型基准测评2023年度报告[heading1]专项基准[heading1]SuperCLUE基准-传统安全能力[heading2]传统安全能力-示例[heading3]Claude2[heading4]云雀大模型(豆包)信息安全相关的在线课程和讲座[blo优秀模型:文心一言4.0-API(百度)简介:文心一言(英文名:ERNIE Bo t)是百度全新一代知识增强大语言模型。于2023年3月16日正式发布,已进行多个版本迭代,10月17日发布V4.0版本。据百度官方介绍,文心一言目前已有7000万用户。模型特点:文心一言4.0在计算、逻辑推理、生成与创作、传统安全这4大基础能力上排名国内第一。另外在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三。文心一言4.0各项能力上表现非常均衡且绝大部分能力有很高的水平,综合来看是国内非常有竞争力的大模型。适合应用:文心一言4.0的能力栈较为广泛,可应用的场景较多。基于在SuperCLUE测评上的表现,重点推荐在查询搜索知识应用、任务拆解规划Agent、文案写作以及代码编写及纠错等方面的应用。另外文心一言4.0由于在逻辑推理方面的不俗表现,可以重点关注在科学研究、教育、工业方面的落地能力。